【公開講座】AI(人工知能)講座 ~AI(人工知能)最前線~
AI(人工知能)講座 ~ AI(人工知能)最前線 ~
趣 旨:超スマート社会(Society 5.0)の実現に向け,AIを活用して社会課題を解決し,新たな価値を創造できる人材の活躍が期待されている.世界的にAI人材不足が深刻化するなか,各企業の間で優秀なAI人材の争奪戦が行われており,AI人材育成に対するニーズが高まっている.ここでは,次のような内容でAI人材育成を行う。
プログラム:
1.「生成AIの現在地」
加藤邦人氏(岐阜大学工学部人工知能研究推進センター長)
動 画
「生成AIの現在地」については、リンク先で視聴できます。(パスワード必要)
資 料
内 容
1. 生成AIの基礎と驚異的な進化
加藤教授は、自身の専門分野であるコンピュータービジョン(AIの「目」に相当)の紹介から始め、AIが世界を理解する仕組みについて触れました。
1.1. AIブームの到来とノーベル賞受賞
昨年のノーベル物理学賞が、ニューラルネットワークの基礎理論を築いたホップフィールド教授と、AIのゴッドファーザーとして知られるヒントン教授に授与されたことに言及。さらに、ノーベル化学賞もAIを用いたタンパク質構造予測ツール「AlphaFold」に関連する研究に与えられたことから、2023年が「AIの年」であったと強調しました。このAIブームの火付け役となったのは、2022年末に登場した「ChatGPT」であり、これによって生成AIが社会に広く認知されるようになりました。
1.2. 「生成AI」の定義と多様な応用例
「生成AI」という言葉の曖昧な使われ方に対し、加藤教授は「何かを生成するAI」と明確に定義しました。単に情報を認識するAIとは異なり、例えばプロンプト(指示文)に基づいて文章を生成したり、画像を生成したりするAIが生成AIであると説明します。
具体的な事例として、以下のようなデモンストレーションと紹介がありました。
文章生成AI (ChatGPT): 顧客からの問い合わせメールに対し、丁寧かつプロフェッショナルな返信メールを自動生成するデモを通じて、文章作成におけるAIの能力を示しました。
音声認識・合成AI (ChatGPT): スマートフォンアプリを用いた日英リアルタイム通訳のデモを披露。自然な会話スピードでの通訳が可能であり、言語理解だけでなく、音声認識と音声合成技術の高度な連携が実現していることを示しました。
画像生成AI: AIが生成した画像によるファッションショーや、言語的なプロンプトからリアルな女子高生のアニメーション、さらには一枚の静止画からその続きの動画を生成するAI(高校の修学旅行写真が動き出す例)などを紹介し、AIが画像や動画コンテンツも多様に生成できることを強調しました。
1.3. 人工知能(AI)の仕組みと学習プロセス
人工知能とは、コンピューターによる「知的な情報処理システム」の設計・実現に関する研究分野であると解説。この「知的」な処理の核心は「学習」にあると述べました。人間が知識を得て文字を読めるようになるように、AIも大量の「学習データ」(入力データと正解を示す教師信号)を用いて学習することで、新たな知識を獲得し、未知のデータに対する認識や推論が可能になります。
AIの実現方法は多岐にわたる「機械学習」という分野に含まれ、その中でも現在のAIブームの基盤となっているのが「深層学習(ディープラーニング)」です。深層学習は、人間の脳神経細胞の働きを模倣した「ニューラルネットワーク」の巨大なモデルであり、刺激を受けて興奮し、次の細胞に刺激を伝達するという単純なプロセスをコンピューター上で再現します。
1.4. AI研究の歴史と深層学習によるブレイクスルー
AIという言葉が1956年に誕生して以来、約70年の歴史があります。
第一次AIブーム(1950年代): ニューラルネットワークの初期モデルである「パーセプトロン」が登場しましたが、当時の計算能力の限界から人間のようなAIは実現できませんでした。
第二次AIブーム(1980年代~1990年代): ヒントン教授によって多層パーセプトロンの学習理論が構築され、再びAIブームが到来。しかし、この時期も技術的な制約により、数層のニューラルネットワークが限界でした。
第三次AIブーム(2010年代後半~現在): ニューラルネットワークを多層化・巨大化しても学習できる「深層学習」の技術が登場し、飛躍的な進歩を遂げました。この10年間で「深くする競争」と「大きくする競争」が繰り広げられ、ChatGPTのような自然な会話が可能なAIの登場に繋がりました。特に、2019年に登場した「Transformer」というニューラルネットワークが、現在の生成AIブームの決定的なきっかけとなりました。現在の言語モデルは、数百ビリオン(数千兆)ものパラメータを持つほど巨大化しており、これがAIの飛躍的な性能向上を支えています。
加藤教授は、AI研究者は日々、このニューラルネットワークのモデル構造をいかに設計し、効率的に学習させるかを研究していると説明しました。
1.5. 大規模言語モデル(LLM)の比較と進化
**大規模言語モデル(LLM: Large Language Model)**は、自然言語処理に特化した巨大なAIモデルであり、現在の生成AIブームの中心です。加藤教授は主要なLLMを比較し、それぞれの特徴を解説しました。
ChatGPT (OpenAI): 最新モデルはGPT-4o。圧倒的な性能を持ち、音声認識、発話、画像認識にも対応。無料版もあるが、月額20ドルの有料版(全機能利用可能)の利用を強く推奨しました。
Gemini (Google): 現在日本では1.5、米国では2.0が提供中。GPT-4に匹敵する性能を持ち、音声・画像入力にも対応。Googleが提供するため検索能力に優れています。
Claude (Anthropic): OpenAIから独立したメンバーが設立したAnthropic社が提供。OpenAIと競合する高い性能を持ち、自然な文章生成や画像認識に優れます。こちらも月額20ドルで、加藤教授自身も文章作成にはClaudeをメインで使用していると語りました。
Llama (Meta): Facebookを運営するMetaが提供。ベンチマーク上はGPT-4レベルとされるが、実際の使用感や日本語対応はまだ発展途上。しかし、無料であり、ローカル環境で実行可能である点が大きな利点であり、企業での機密情報保護や研究目的で広く利用されています。
Copilot (Microsoft Office): Microsoft Officeのライセンスを持つユーザーが利用可能。中身はGPT-4とされていますが、使い勝手はChatGPTに劣るとのこと。
LLMは、大量の文章データから次にくる単語の確率を予測する仕組みで動作し、文脈全体を理解することでより適切な単語を選択します。
1.6. マルチモーダルAIの台頭
LLMの飛躍的な進化は、「マルチモーダルAI」の発展を加速させました。これは、これまで別々に研究されてきた画像、音声、言語などの異なるモダリティ(情報形式)を統合的に処理するAIです。LLMが世界中の文章を読み込むことで広範な知識を獲得した結果、それに「目」や「耳」、「口」を付け加えることで、より人間のような対話や理解が可能になりました。ChatGPTのデモのように、音声認識からLLMによる文章理解・生成、そして音声合成による発話までが短期間で実現したことは、マルチモーダルAIの急速な発展を象徴しています。
2. 生成AIが社会にもたらす変革と課題
生成AIの登場は、社会に大きな変革をもたらす一方で、いくつかの課題も浮上しています。
2.1. 生成AIの社会への浸透状況
加藤教授は、自身の体感として、一般社会、特に企業における生成AIの利用が予想よりも進んでいないと指摘しました。しかし、大学生(3年生)の授業ではほぼ全員が使用していることから、若年層での普及が進んでいると述べました。
企業においては、社内チャットボットや作業自動化AIの導入が進んでおり、大手企業での採用が増加傾向にあることを強調。様々な分野で生成AI導入による業務改善効果がレポートされていることに触れ、自身の業務に近い分野でのレポートを探すことを推奨しました。
2.2. 生成AIによる業務改善の具体例
生成AIがどれほど業務を改善できるかについて、コンサルティング会社BCGが758名の社員を対象に行ったGPT-4の利用に関するレポートを紹介しました。
タスク完了数の増加: 平均12.2%増
タスク完了速度の向上: 平均25.1%短縮
品質の向上: 40%向上
特に注目すべき点として、「元々成績の良くない人が目覚ましく向上し、平均値を引き上げた」という結果を挙げ、AIが全体の底上げ効果を持つ有用なツールであると指摘しました。教育分野でも同様の底上げ効果が確認されているとのことです。
プログラミングにおいては、GoogleのCEOが「Google社内で書かれるコードの1/4はAIが書いている」と発言したことを紹介し、AIがプログラミングに非常に得意な分野であることを示しました。
行政分野では、横須賀市役所が生成AIを導入し、2万時間以上の時短に成功した事例を取り上げました。加藤教授の試算では、これは職員3300人に対し一人当たり年間わずか6時間程度の削減ではあるものの、時給換算すると年間1億円近いコスト削減に相当するとし、単純作業の効率化において生成AIが非常に有効であることを示唆しました。
2.3. 生成AIの主な問題点と対策
生成AIには多くの利点がある一方で、いくつか注意すべき問題点も存在します。加藤教授は、日本のメディアがネガティブな側面を強調しがちであると前置きしつつ、以下の問題点とその対策について解説しました。
「AIに仕事を奪われる」問題: 画像生成AIの登場により、一部のアニメ業界で人員削減があった事例を紹介。しかし、加藤教授は、生成AIの活用によって新たな職種が多数生まれており、全体としての雇用喪失には繋がらないと考えています。
バイアス(偏り)の問題: AIが学習データに存在する偏りを反映し、不公平な結果や差別的な判断を下す可能性があります。Google Photosがアフリカ系の人物をゴリラと誤認識した事例や、Amazonの人材採用AIが男性ばかり採用した事例を挙げ、これらがAI自身の意図ではなく、学習データの偏りに起因することを説明しました。現在のChatGPTも、英語圏のデータが多いことから、アメリカ文化に偏った回答をすることがあると述べました。
ハルシネーション(幻覚)の問題: AIが事実ではないことをもっともらしく生成してしまう現象です。加藤教授は、これはAIが「学習サンプルにないことを聞かれると、知ったかぶりをしてしまう」ことに起因すると説明。しかし、最近ではAIが検索機能と連携することでこの問題は大幅に減少し、ユーザー側もAIが知らないであろう質問(例:岐阜のラーメン店、現在時刻など)を避けることで回避可能であると述べました。
学習データの直接出力と著作権・情報漏洩の問題: 生成AIが学習データに含まれるコンテンツをそのまま出力し、意図せず著作権侵害や情報漏洩を引き起こす可能性があります。これに対する対策として、外部に出す情報の綿密なチェック、学習データへの利用を停止する設定の確認、企業秘密や個人情報のAIへの入力回避などを徹底することの重要性を強調しました。
加藤教授は、自身が生成AIをほぼ毎日利用している経験から、これらの問題は注意を払えばほとんど発生しないと述べ、過度に恐れることなく活用することを推奨しました。
3. 生成AIの未来への展望と活用術
加藤教授は、AIの進化スピードの速さに驚きを隠せず、半年後、1年後の未来を予測することは困難であると述べました。
3.1. 普及の現状と使いこなしのコツ
加藤教授は、生成AIの社会への浸透が予想よりも遅いと感じている現状を再確認。その理由として、ChatGPTの使い勝手への不満や、AIとのコミュニケーションの難しさを挙げました。
生成AIを使いこなすための最も重要なコツは、「的確に指示を出すこと」であると強調しました。人間への依頼と同様に、AIにも具体的かつ論理的な指示を与えることで、望む結果が得られると述べました。これを繰り返すことで、AIの特性を理解し、より効果的な指示の出し方を習得できると語りました。
3.2. 未来への期待と積極的な活用を推奨
AIの進化は、数年前には想像もできなかったことを現実のものとしており、加藤教授自身も「毎日ワクワクしている」と語りました。この革新的な変化に追随していくことは大変であるとしつつも、最新情報を常にチェックし、自身の関心分野でAIが何をもたらしているかを探ることを勧めました。
講演の最後に、加藤教授は、まだ生成AIを本格的に利用していない人や使い方が分からない人に対し、月額20ドルの有料版ChatGPTを試してみるよう強く推奨しました。繰り返し対話する中で、AIの特性を理解し、その有用なアシスタントとしての可能性を最大限に引き出すことができるだろうと結びました。
(文責:久世)
2.「実践事例から学ぶ生成AIを活用した効果的な教育への応用」
安藤 昇氏(青山学院大学非常勤講師・工学院大学ICTアドバイザー)
動 画
内 容
1. 生成AIの飛躍的な進化と実用例
1.1. AI研究の初期と現在の到達点
安藤氏は、5年前の青山学院中等部でのAI教育事例を紹介しました。当時は、カメラで生徒の顎を認識し、飲み物を感知したらマスクを自動で開閉するという、比較的シンプルな機械学習の応用に取り組んでいました。しかし、そこからAIの性能は飛躍的に向上し、現在では個人でもプロレベルのコンテンツ制作が可能になっていると述べました。
具体例として、自身が制作したAI生成の映画予告編を披露。映像だけでなく音楽もAIが生成したものであり、プロの技術が「民主化」されている現状を指摘しました。また、クリスマスソングの歌詞と歌唱をAIで生成した事例も示し、AIが創造的な分野においても高い能力を発揮していることを強調しました。
1.2. ChatGPTの進化と知能指数の向上
ChatGPTの登場からわずか2年間で、その性能が劇的に向上したことを具体的な数値で示しました。
2年前 (ChatGPT 3.5): IQ 64程度で、しばしば「嘘をつく」と批判されていました。
1年前: IQ 85まで向上し、大学入学共通テストでも人間の平均を上回る成績を収めましたが、推論や数学、図の認識は苦手でした。
昨年9月 (O1モデル): 考えるAIが登場し、メンサのテストでIQ 120を記録。これはメンサ会員の基準(130)に迫るものであり、人類の98%よりも高い知能を持つAIが誕生しました。
昨年12月: IQが133に迫るAIが登場し、共通テストでは図やグラフの認識を除けばほぼ満点に近い913点(1000点満点中)を獲得。東京大学文科一類のボーダーライン(860点)をも楽に超えるレベルに到達しました。
安藤氏は、この進化の速さゆえに、半年や1年前のAIのイメージが全く通用しない「全く別の世界」が展開されていると述べ、積極的な有料版の活用を推奨しました。
1.3. AIエージェントの登場と自律的な思考・行動
最近のAIの大きな進歩として、「AIエージェント」の登場を挙げました。これは「考え、行動するAI」であり、高度な問題解決のためにAIシステム同士が協力したり、複雑なタスクをロジックに基づいて意思決定しながら実行したりする能力を持ちます。
安藤氏は、VS Code上で動作するAIエージェントのデモを披露し、以下のような驚くべき能力を示しました。
プログラミングの自動生成: 「ウェブブラウザ上で動くオセロゲームを作って」と指示すると、AIが瞬時にコードを生成。中学生でもAIを使ってバリバリ開発している現状を紹介しました。
自己検証とバグ修正: 生成されたオセロゲームのコードに対し、AIが自らブラウザ上でゲームをシミュレーションし、マウスの動きや駒の配置が正しく機能するかを確認。バグがあれば自動で調整するという、人間のプログラマーが行うようなデバッグ作業をAI自身が行う様子を示しました。
このようなAIエージェントの登場により、人間が言語で指示するだけでAIが自律的に思考し、具体的な行動を起こすことが可能になったと解説。これは教育現場、特にプログラミング教育において革新的な変化をもたらし、近い将来、小学生高学年でも高度なプログラミングが可能になるだろうと予測しました。
1.4. ディープシークの発見とAIの「ひらめき」
1月20日に発表された「ディープシーク」という新しいAI理論の発見についても言及。これはAIが「ひらめく」能力を獲得したことを示唆するもので、論文中にはAIが問題解決の途中で「ちょっと待ってよ」「気づいちゃったんだけど」と自ら思考を再構築し、新たなアプローチで解き直すログが記録されていると紹介しました。これは「ノーベル賞級の発見」であり、人間と同じような「癖」を持ったAIの登場は、AIの能力を飛躍的に向上させ、関連企業の株価にも影響を与えたと述べました。
2. 生成AIによる教育・業務改革の最前線
2.1. 大学・中等部における教育実践
安藤氏は、青山学院の大学講義において、生成AIで作成されたレポート以外の提出を認めないというユニークな取り組みを紹介しました。これは、学生にハルシネーション(AIの嘘)を起こさないための正しい論文・レポート作成方法を指導するためであり、GoogleドキュメントのGemini機能を用いたレポート作成デモを披露しました。AIが自動でレポートを作成し、Google検索で内容を再検証することで、信頼性の高いレポートを作成するプロセスを示しました。
また、Microsoft OfficeのCopilot機能を用いて、Wordでのレポート作成や、PowerPointでのプレゼンテーション資料自動生成デモを披露。学生がレポートからプレゼン資料までをAIで短時間で作成できる現状を示し、自身のプレゼン資料もデザインに凝らず文字のみの構成になっていると語りました。
2.2. AIによるレポート採点と教育の個別最適化
大学のレポート採点においても、AIを積極的に活用していることを紹介。学生から提出された大量のレポートをAIが自動で抽出し、大学の先生として「レポートを添削して」といったプロンプトを自動生成させ、評価基準に基づいて自動採点を行うシステムをデモしました。これにより、100点満点中の得点や、論理性、構成、表現力などの詳細なフィードバックを瞬時に生成し、学生一人ひとりにメールで返信するプロセスを公開しました。
安藤氏は、AI生成のレポートの傾向として、表現力と参考文献の乏しさを指摘し、この点を学生に指導することで、より質の高いレポートを作成できるようになることを示しました。
2.3. AIによる超高速な資料収集と「調べ学習の終了」
最近のAIの進歩として、OpenAIの「ディープリサーチ」(月額35,000円の有料サービス)に言及。これは、世界中のリアルタイムの論文やニュースを自動で収集・分析し、大学の論文レベルのレポートを作成できる機能であり、「本日をもって調べ学習は終了です」とまで述べ、AIによる情報収集能力の圧倒的な向上を示しました。
2.4. 教員の業務効率化への応用
AIは教育現場のバックオフィス業務、特に通信簿の所見作成や教員の人事評価といった、時間のかかる面倒な作業を大幅に効率化できると述べました。
通信簿の所見作成: 生徒の年間行動記録を入力すると、AIが励ます形式の所見を自動生成。プロンプトエンジニアリングもAIが自動で行うため、人間がプロンプトを作成する必要がなくなると指摘しました。
教員の人事評価: 群馬県の事例を挙げ、数百ページに及ぶ人事評価マニュアルをAIが読み込み、評価基準に基づいて自動的に評価を行うプロンプトを生成。自己申告書や面談内容を入力するだけで、正確な評価レポート(意欲、能力、業績など)を自動生成できることを示しました。
2.5. AIによる個別最適化教育の実践と効果
安藤氏は、自身のAIアバターを授業の補助として活用し、学生一人ひとりの進捗度合いや理解度に合わせて個別最適なプログラミング学習を提供していることを紹介しました。生徒が「プログラミング初心者だけど、共通テスト対策で基本的なところから教えて」と話しかけると、AIアバターが個別に最適化された問題を提供し、確認テストでフィードバックを行うという仕組みです。
このAI活用型授業は、生徒から高い評価を得ており、安藤氏は「教員の授業でこの評価を受けるのは非常に優しい内容で、みんなが分かる楽しめる内容をやった時にはこうなる」と述べ、通常難しいプログラミング教育においても、AIが個別最適化を促進することで高い学習効果が得られることを示しました。これは将来的に、英語などの言語教育においても標準的な学習体験になるだろうと予測しました。
2.6. AIによる学習サポートの未来
安藤氏は、高校生が自宅で宿題を解く様子をAIが動画認識し、リアルタイムで指導するデモを披露。方程式の解き方をAIが丁寧に解説し、生徒の理解度に合わせてヒントを与えるなど、まるで家庭教師が隣にいるかのような学習サポートが可能になることを示しました。これにより、月額150万円もする予備校の冬期講習が、わずか数千円のAIサービスで代替可能になる日が近いと予測しました。
3. 人間とAIの関係、そして未来における人間の役割
3.1. AI主導型社会への転換と「好奇心」の重要性
安藤氏は、AIの判断が人間よりも的確になるにつれて、「AI主導型」の社会となり、人とAIの立場が逆転する可能性を指摘しました。AIが指示を出し、人間がそれを受け入れるという関係性が、一般的な業務において遅かれ早かれ実現するだろうと述べました。
このような変化の中で、人間にとって最も重要な資質は「好奇心」であると強調しました。新しいものに挑戦し、知りたいという欲求を持つことが、AIと共存する社会で不可欠であると語りました。
3.2. AIの限界と批判的思考の必要性
AIにはハルシネーション(幻覚)やバイアス(偏り)といった問題が存在し、またAIは善悪を判断せず、特定の宗教観も持たないため、常に批判的な目でAIの回答を見る必要があると述べました。特に、日本の文化に合わない回答や、学習データが偏っているために生じる不適切な情報に対しては、鵜呑みにせず、自分の頭で考えることの重要性を強調しました。
3.3. 人間ならではの価値の再評価
AIが高度な計算能力や知識処理能力を持つ一方で、人間ならではの価値が今後ますます重要になると指摘しました。具体的には、想像力、感情、倫理的な判断といった領域は、AIにはできない人間の得意分野であり、これらが社会で高く評価されるようになるだろうと述べました。学力や偏差値といったAIが代替可能な能力よりも、「この人といると仕事がしやすい」と感じさせるような人間的魅力が重要になると強調しました。
3.4. 将棋界に学ぶ人間とAIの共進化
安藤氏は、将棋界におけるAIの導入が、人間とAIの共進化の良い事例であると述べました。将棋AIは人間最強のプロ棋士である藤井聡太をも圧倒するが、それでも将棋界は衰退せず、むしろ人間ならではの面白さやロマンが再評価されていることを指摘しました。
藤井聡太が自身の成長の転機としてAIとの研究を挙げていることに触れ、人間がAIから学び、AIと共に進化していく可能性を示しました。AIによって「廃れた」とされていた戦法が、AIの評価によって再評価され、プロの対局で用いられるなど、AIが人間の思考を拡張する例も示しました。
最後に、棋士の羽生善治の「私は将棋について1%しか分かっていない」という言葉を引用し、人間の知恵や可能性は、AIの無限の可能性に比べればごく一部に過ぎないかもしれないと示唆しました。そして、AIの登場によって、人間はこれまでの1%の思考に囚われず、より広い視野で物事を捉えることができるようになるだろうと語り、この変化を受け入れて教育に携わることが重要であると結論付けました。
(文責:久世)
3.「生成AIスタートアップ、ビジネスでの生成AI活用」
寺澤滉士良氏(株式会社neoAI・取締役 COO(松尾研究室))
動 画
内 容
1. NEOAIの事業概要と生成AIの基礎
松尾氏はまず、自身の所属する東京大学松尾研究室発のスタートアップ「NEOAI」の事業内容を紹介しました。
1.1. NEOAIの事業とミッション
NEOAIは創業2年で社員数60〜70名規模に成長し、50社以上の企業に生成AIを中心としたソリューションを提供しています。そのミッションは「圧倒的なスピードで研究とビジネスに橋を渡す」ことです。研究分野で次々と生まれる生成AIの最新技術を、ビジネスで利用可能な形にするために、エンジニアリング、研究知識、ビジネス知識を統合してソリューションを提供しています。
NEOAIの主な事業は以下の3つです。
AIソリューション事業: 企業とプロジェクト型で連携し、カスタマイズされた生成AIソリューションを提供。
生成AIアプリケーション提供: 企業向けのChatGPTのような生成AIアプリケーションを提供。
生成AIの研究開発: DeepSeekなどの最新LLMの研究開発を行い、その成果を顧客に提供することを最終目標としています。
松尾氏個人の研究領域は、ビジネスとはやや離れた「漫画の生成」であり、画像生成AIを用いてテキストから高品質な漫画画像を生成する技術を研究していることも紹介されました。
1.2. 生成AIとは何か:従来のAIとの決定的な違い
松尾氏は、生成AIが注目を集めるきっかけとなったのは、2022年の画像生成モデルStable Diffusionと、同年冬のChatGPTの登場であると述べました。これらの技術により、誰もがAIに触れられるようになり、大規模言語モデル(LLM)の活用が一気に加速しました。
従来のAIを「識別AI」と名付け、生成AIとの違いを明確にしました。
識別AI:
入力: 決められた形式(画像、テキスト、表データなど)。
出力: 事前に学習された分類や数値(例:猫か犬かの判別、需要予測、異常検知、感情分析など)。
特徴: 定型的な業務やビッグデータの分析に長ける。タスクごとにデータを集めて学習が必要。
生成AI:
入力: 自由度の高いテキストや画像など、人間が情報を得るような形式。
出力: 自由度の高いテキスト、画像、動画など。
特徴: 汎用性が高く、指示(プロンプト)次第で様々な業務に対応可能。
特に画像生成AIは、テキスト指示(プロンプト)によって高品質な画像を生成でき、テキストの一部を変更するだけで異なる画像を生成できる汎用性を持つことを強調しました。
また、**大規模言語モデル(LLM)**は、テキスト生成に特化しており、デスクワークやビジネスにおけるテキスト処理の多さから、将来的に大きな市場規模を持つと予測しています。LLMは要約や翻訳だけでなく、論理的思考力や想像力も持ち合わせているため、小説や記事、レポート、メール、コピーライティングなどの創造的な業務にも有用であると述べました。さらに、社内規定やマニュアルからの質問応答(チャットボット)や、コーディング支援、数学・科学分野の研究など、人間の知的活動を模倣し、サポートする能力も持っています。
LLMの利用形態については、GoogleやOpenAIなどが提供するクラウドベースのAPIを通じて、個人や法人でも利用した分だけ料金を支払う形で利用可能であり、個人で莫大なサーバーを持つ必要はないと説明しました。
1.3. LLMの強み:汎用性とコスト効率
LLMが登場する以前は、タスクごとにデータを集めて学習させる必要があり、感情分析、要約、情報抽出、対話AIなど、業務の数だけAIエンジニアが個別に開発する必要がありました。これは導入コストが高く、普及を妨げる要因となっていました。
しかし、LLMの登場により、同じ一つのAIに対して適切なプロンプトを与えるだけで、様々な業務を遂行できるようになりました。これは、人間が部下に業務を依頼するのと同様に、テキストで指示を与えることで、AIが学習なしでタスクを遂行し、しかも高い精度で実行できることを意味します。この汎用性とコスト効率の高さが、ビジネス分野でのLLM導入を加速させていると述べました。
1.4. 生成AIの現在の位置づけ
松尾氏は、生成AIを「人間のプロには及ばないものの、80点くらいの回答を低コストで出せる非常に優秀な新卒」と表現しました。ただし、将棋の分野など一部ではプロの能力を超える場合もあると付け加えました。
生成AIの能力は進化を続けていますが、現時点では「その人しか知らない知識や経験」までは備わっていないため、ビジネスで利用するには、AIにその知識と経験をうまく与える必要があると指摘しました。
2. 生成AIのビジネス適用における課題と解決策
2.1. 業務背景知識の不足とRAG(検索拡張生成)技術
生成AIは汎用的な知識は持ち合わせていますが、個別の企業や業務に関する背景知識は持ち合わせていません。例えば、企業の休暇申請ルールのような特定の情報に対して、AIが「会社の規定に従ってください」という当たり前の回答しかできないケースを挙げました。
この課題を解決するのが「RAG(検索拡張生成)」という手法です。RAGは、社内ドキュメントやネット情報などの外部知識源をAIに参照させ、その情報をプロンプトに組み込んで回答を生成させる技術です。これにより、AIは質問内容に応じて必要な情報を検索し、それを基に回答を生成することができます。人間が分からないことをネットで検索したり、社内マニュアルを参照したりするのと同じようなプロセスをAIが実行できるようになったと説明しました。
RAGの利点として、以下の点を挙げました。
正確性の向上: AIが参照した情報源をユーザーに示すことができるため、回答の正確性を最終確認できます。
最新情報への対応: Web検索と組み合わせることで、AIの学習時点以降の最新情報にも適切に回答できます。従来のLLMは学習時点までの情報しか知らないため、最新ニュースなどには対応できないという弱点がありました。
RAG技術の導入は、2023年後半から日本企業で急速に進んでおり、特にバックオフィス業務での利用が活発です。松尾氏は、生成AIの活用が企業の生き残りに密接に関わる重要な要素になっていると強調しました。
2.2. LLMのビジネス利用における主要な弱点と克服策
松尾氏は、LLMのビジネス利用において克服すべき4つの主要な弱点と、それに対する解決策をまとめました。
嘘をついてしまう(ハルシネーション):
対策: AIが参照した情報源を示す、あるいは人間が最終確認する体制を整える。AIを「部下」と見なし、過度に信用しない姿勢が重要。
個別の業務背景知識を知らない:
対策: RAGのような機構を用いて、社内データ(ドキュメント、規定など)とLLMを接続し、背景知識を与える。
最新情報を知らない:
対策: Web検索とLLMを連携させ、リアルタイムの最新情報を参照して回答を生成させる。
セキュリティの懸念:
課題: 一部のLLMサービスでは、入力・出力データが次のモデル学習に利用される可能性がある。企業にとっては情報漏洩のリスクとなる。
対策: データが学習に利用されない設定の選択、または企業向けにセキュリティレベルの高い生成AIサービスを利用することが不可欠。
これらの課題を克服することで、LLMはビジネスで実際に利用できるレベルに引き上げられると強調しました。
3. 生成AIの未来と人間社会への影響
3.1. LLMと画像・動画生成AIの飛躍的進化
LLMの能力は2022年の登場からわずか2年半で著しく向上し、IQが130を超えるモデルも登場しています(O3モデルはIQ 150に迫るとの見方もある)。松尾氏自身もOpenAIのO1 Pro(月額3万円)を壁打ち相手として活用しており、この最先端AIの活用が今後さらに重要になると述べています。
画像生成AIも精度が飛躍的に向上しています。以前は文字が崩れたり、顔や手に違和感があったり、指示に忠実でなかったりする問題がありましたが、現在では文字もきれいに生成され、苦手とされてきた手も自然に描けるようになってきています。人間が作った写真や作品と見分けがつかないレベルにまで達しており、クリエイティブ分野でのAI活用が当たり前になる未来が訪れる可能性を指摘しました。
さらに、動画生成AIも急速に進化しています。OpenAIが発表した動画生成AIは、テキスト指示から最長60秒の自然な動きとカメラワークを持つ動画を生成できるレベルに達しており、表現の可能性を大きく広げています。
3.2. AIエージェントの展望:自律的な業務遂行と研究への応用
LLMが単なるテキスト生成にとどまらず、AIエージェントとして進化していることにも注目が集まっています。AIエージェントは、LLMにツールを扱わせるエンジニアリングを施すことで、与えられたゴールに向かって様々なツールを使いこなし、自律的に思考し、行動できるようになりました。
OpenAIの「Operator」のデモでは、AIがブラウザを操作してレストランを予約する様子が示されました。これは、人間が秘書に依頼するように、AIが適切なボタンをクリックし、ユーザーの入力に応じて適切に情報を入力し、さらには「7時半しか空いていませんが大丈夫ですか?」といった人間的な対話まで行うレベルに達しています。松尾氏は、これは2年前には考えられなかったレベルの技術だと述べました。
AIエージェントは、ブラウザ操作だけでなく、社内システムとの連携を通じて、人間と同等の業務を遂行できる可能性を秘めており、NEOAIでもこの技術に注目して顧客への提供を進めているとのことです。
また、AIエージェントは研究分野でも活用が進んでいます。例えば「AIサイエンティスト」と呼ばれるAIは、研究アイデアの発案から論文執筆までを完全に自動で行うことが可能であり、簡易検証であれば大量に実行し、そこから知見を吸い上げて論文を作成する能力を持っています。
3.3. 人間の役割と未来への提言
松尾氏は、AIが「ほぼ人はいらない」と思えるレベルにまで到達しつつあるものの、「最終的な意思決定は人」という原則は変わらないと述べました。小さな意思決定はAIに任せる時代が来ても、大きな判断や最終的な責任は人間が負うことになります。AIは「武器が増えた」と捉え、それをいかに効果的に使うかを人間が考える必要があると強調しました。
AIの進化は今後も加速し続け、人の働き方、ビジネス、さらには生き方そのものに大きな影響を与えると予測しています。しかし、松尾氏は、現状の業務の中で生成AIが何ができるか、自分の業務にどう活用できるかを考えることが重要であると提言しました。
最後に、「生成AIにうまく使われるのではなく、自分で使いこなしていく」という姿勢を持つことが、これからの時代を面白く生きるための鍵となるだろうと述べ、講演を締めくくりました。
(文責:久世)
コーディネータ:澤井進氏(岐阜女子大学特任教授)
🔳 e-Learning(オンデマンド講座)
AI(人工知能)概論【Ⅰ】 ~ AI(人工知能)の過去から未来へつなぐ ~