【レポート】第3回 AI×コンテンツ研究会「大規模言語モデルのコンテンツビジネスへの活用」
CiP協議会ではAIの登場によって大きく変わりつつあるコンテンツの制作、流通、受容についての変化を共有し、日本から新たな利活用の事例を作り世界に打って出る機会を探るプロジェクト「AI×コンテンツ研究会」をスタートし、5/9に第3回「大規模言語モデルのコンテンツビジネスへの活用」を実施しました。
■登壇者 *敬称略
・宮崎昇氏(NTT人間情報研究所 思考処理研究プロジェクト プロジェクトマネージャ)
・関根聡氏(理化学研究所 革新知能統合研究センター 目的指向基盤技術研究グループ 言語情報アクセス技術チーム チームリーダー)
・花光宣尚氏(慶應義塾大学大学院メディアデザイン研究科 特任助教)
モデレーター:
菊池尚人(デジタル政策財団 理事)
※このほか共催で会場提供者のデジタル政策フォーラムより、デロイト トーマツ コンサルティング合同会社の戸田崇生氏よりご挨拶をいただき、パネルディスカッションからはCiP協議会理事長中村伊知哉が参加しました。
■レポート
花光氏のAIホットトピックを皮切りに宮崎氏よりNTTが開発中のLLMであるTSUZUMIのご紹介、関根氏より理研AIPが行ったLLMに対する日本語インストラクション(教科書)の構築についてのご紹介が行われました。
【AIホットトピック:花光氏】
実際にLLMを開発している2名のスピーカーの話の前にガイドラインとなる話題提供が行われました。
・生成AIの国際競争でも日本は負けていないことの例示として、
−G7サミットでの「広島AIプロセス」における日本の主導
−外資系の企業がAIの拠点を日本に置く事例
−経産省によるGENIACの立ち上げ
などが挙げられた。
・オープンモデルのLlama3のリリースを契機にそれを用いた多くの派生モデル(日本語特化モデル含む)の登場を樹形図で紹介。
・「AIにはなんでも学習させるのではなく、精査した教科書を与えることで結果が良くなる」という内容のマイクロソフトが出した論文『Textbooks Are All You Need:必要なのは教科書だけ』の紹介。
以上の状況を踏まえ、2名のスピーカーへの問いかけとして以下4点が挙げられた。
①そもそも国内LLMの開発は必要なのか
②コンテンツに活かすとなった場合にLLMという根底の技術をどう使っていくと良いのか
③逆に研究者としては、LLMの学習に使ってみたいコンテンツ(音声でも文学作品でもなんでも)はなにか
④そもそも(産業と?)連携していいLLMとかコンテンツはつくれるのか
【宮崎氏】
NTTが開発しているLLM「TSUZUMI」について以下の紹介が行われました。
・TSUZUMIのコンセプトは「日本語をしっかり扱える」LLM。
・作成に際し事前コーパスをどのように調整したか。
・形態素解析(トークナイズ)の重要性とNTTの優位性。
・テキストだけでなく画像などに含まれる情報を同時に処理する「マルチモーダル」の開発について。
・NTTが目指すAIと人の未来として多様なLLMが特性を生かしながら連携しあうというビジョン「AIコンステレーション(星座)」
以上の話を踏まえてTSUZUMIとGPT-4 turboによる出力比較のデモンストレーションが行われました。
【関根氏】
理研AIPが行ったLLMに対する日本語インストラクション(ichikaraインストラクション)の紹介が行われた。
・OpenAIの論文でも「質問と答えのペア」であるインストラクションをファインチューニングすることで精度が上がることが述べられている。
・インストラクションとLLMの両方を作らないと、きちんとしたものができないということに気づき「日本語のインストラクションを構築する」プロジェクトを立ち上げた。
・予算が2000万円程度必要であり、1社200万円で共同研究を募ったところ18社と契約した。
・共同研究参加社には作成ノウハウ、マニュアル、安価な商用ライセンスを提供している。
・マニュアルには答え方やタグ付けの仕方などいろいろなものがあることを例示。
・ichikaraインストラクションを学習させたLLMとGPT3.5で出力を比較した。これをGPT4.0と人間に評価させると異なる結果を得た。
・今後の方向性として「データの追加」「安全性」「マルチターン(対話の継続)」「分野特化型インストラクション」「マルチモーダル」を研究していく。
以上のプレゼンテーションを踏まえ、冒頭の花光氏からの問いかけを中心に登壇者によるパネルディスカッションで意見交換が行われました。
=====================================
6/18(火)17:30より【第4回】AI×コンテンツ研究会「放送コンテンツにおけるAI活用」を開催します。
詳しくはこちらをご確認ください。