「夢のAIプロジェクトの理想と現実」赤間怜奈(AI研究者)×はやみねかおる対談2

「夢のAIプロジェクトの理想と現実」赤間怜奈(AI研究者)×はやみねかおる対談2

赤間 それを調べるためにも、とりあえずシンプルな方法でできるところまでやってみようと。そこで、当時とても性能が良いと言われていた最新のモデルをベースとして、【はやみね先生が文字として生み出した「RDのふるまい」に関する言語データ】をうまく使うことで、それらしいシステムを作ってみました。

はやみね 自分が【文字として生み出した「RDのふるまい」に関する言語データ】というのは、つまりぼくの書いた原稿ということですよね。それを全部、集めたんですか!

赤間 そのとおりです。このシステムの挙動を観察してみると、「RDの再現」に至るまでに解決しなくてはならない、いくつかの課題が浮き彫りになりました。主要なものを挙げると、以下のようになります。

① 学習していない情報に対応できない
② 間違いを生成する(ハルシネーション)
③ 回答がRDらしくない

赤間 ①や②は、生成AI全般で見られる現象で、言ってしまえばよくある問題です。十分な学習をした話題については、非常に流暢に会話を続けられますが、それ以外の話題については「経験が不足していてあまりうまく話せない」ということが起こると知られています。

今回のRD……ファンとしてはRDにプロトタイプはないですし、本来のキャラクターとは乖離があるので、本音ではまずRDと呼びたくないのですが(笑)、「RDをつくろうと思ってつくったシステム」に関しても、実際に「与えられた話題にうまく答えられない」状況がしばしば観察されました。

ここには、このプロジェクトならではの難しさもあります。

RDは、現実世界の知識のみを学習するだけでは不十分で、「怪盗クイーン」固有の世界観の知識も必要になります。既存のモデルが学習済みの「現実の世界」と、今回再現したい「フィクションの世界」には、どうしても乖離が生じるため、かなりの頻度で「RDらしくない」回答が出てきてしまいました。私はここがどうしても気になるところで、一番どうにかしたいポイントでした。

──ファンとして、納得できないという状態だったんですね。
プロジェクト公開前の開発画面。
プロジェクト公開前の開発画面。RDが搭載されている大型飛行船「トルバドゥール号」については設定を正しく回答することができていますが、「クイーンが好きなお寿司」については、正確な情報が取り出せずに、おかしな回答になっています。
赤間 でも「可能性はあるよね」という話を、開発チームのみなさんとしました。そこで思い切って、目標を「みんなで育てる」という方向に変えたんです。たとえ納得がいかない部分があったとしても、ユーザーが楽しみながら参加して、おもしろいフィードバックをしてもらえたらいいのではという方向で、まとまりました。

はやみね 今のAI技術では、キャラクターを再現するのはすごく難しいということですね。

赤間 そうですね。キャラクターらしさを一貫して表現することもそうですし、特定の世界観──今回は「怪盗クイーン」ひいては「赤い夢」の世界観を保持することは挑戦だといえます。

はやみね 解決方法はあるんですか?

赤間 まずは、モデルの学習に使うデータを増強したいと思っています。より網羅的で具体的なデータをたくさん集めて、質の良いデータをモデルに十分学習させることを考えています。ユーザーからのフィードバックを活用することで、学習を効率化することについても検討しています。ここからは数の力も大事になってくる、ということで、今の形のプロジェクトになりました。
はやみね ひとつ質問です。人工知能がいろんな学習をして賢くなっていくというのはよく聞きますが、RDの場合はフィクションの経験が多いですよね。その場合は、その経験をどうやって学習させるんですか?

赤間 今回は、入出力に自然言語文をとるタイプのモデルを使っています。

モデルは与えられた自然言語文、つまり人間が使うことばで構成された文章を見て、そこで表現されている内容を“経験”します。世界観や常識、知識も言語化されたものが存在すれば、ことばを介して学習することは可能です。性格やキャラクター性、それから感情も、ことばとして見えているものは学習できることになっています。

つまり裏を返せば、ことばになっていないものは、学習することが難しいということです。私たちが普段ことばにするまでもないと考えている、超基礎的な知識や暗黙的な前提、今回の場合に関しては、はやみね先生がまだ作品の中で明かしていない設定や世界観などは、モデルにとっては扱いづらいものである可能性があります。

はやみね おっしゃるとおりで、本当に難しいことをお願いしてすみません。でも楽しみです。

赤間 とても挑戦的でやりがいがあります、楽しみながら試行錯誤しています。
「質の良いデータ」を学習させたRDが劇的に変化!
38 件