AI業界の点と点をつなぐ存在であり、AI界の未来を担う存在。それがAIエージェント。
OpenAIはもちろん、Google I/OもMicrosoft BuildもApple WWDCも、昨今のテック業界の発表会はAI一色です(Apple Intelligence含む)。なかでもよく耳にするバズワードが「AIエージェント」。AIエージェントという存在がテック業界の次なるビッグヒットであり、注目すべきことなのはわかりました。
ですが、AIエージェントってそもそもなんですか? なんで急にみんな注目しているの?
Google(グーグル)のサンダー・ピチャイCEOは、「買った靴の返品すらしてくれるようなシステムだ」と説明。
Microsoft(マイクロソフト)は、Copilot AIシステムをバーチャル社員のように独立して動かすことができると発表。OpenAIは、見て、聞いて、話すことができるGPT-4 Omniを公開。同社のサム・アルトマンCEOは、以前MIT Technologyにて、AIエージェントは最も技術的ポテンシャルがあると語っていました。
各社が語るAIの姿は理想であり将来の姿。ただ、実現は口で言うほど簡単なことではありません。
AIエージェントはAIモデル
簡単にいうと、AIエージェントは自分でタスクをこなすAIモデルです。
フィクションの世界で例えるなら、『アイアンマン』のJ.A.R.V.I.S.であり、『インターステラー』のTARSであり、『2001年宇宙の旅』のHAL 9000。
近年すでに慣れた感のあるレスポンスを返すチャットbotの一歩先を行く存在であり、そこにはアクションが含まれます。ここでいうアクションとは、現状はデジタル上のアクション。ユーザーのコンピューターの多種多様なAPIと連携して動くことができるようトレーニングされることで実現します。
エージェント化の難しさ
AIの未来がエージェントにあることは、完全同意だというAIスタートアップのEcho AI創設者Alexander Kvamme氏。「業界はもう何年も(AIエージェントについて)語っていますが、いまだに実現できていません。非常に難しい問題なのです」と語ります。Echo AIは企業と消費者の会話を解析し、サービス改善のインサイトを提供するというAIエージェントを開発しています。
Kvamme氏いわく、完全にエージェント化したシステムは、何十何百という決断を独自で行なう必要がありますが、それは自動化するのがとても難しいこと。
例えばGoogleのピチャイCEOが語る靴の返品をしてくれるAIエージェントの場合、エージェントはメール受信箱から購入のレシートを探し出し、その注文ナンバーと返品先をメモ、返品フォームを記入し、返品に必要なあれこれのアクションをこなしていかねばなりません。その過程では、たくさんの決断が必要になります。われわれ人間にとっては「決断」と意識することもないようなさまざまな無意識の決定。その1つ1つが(現在の)エージェントにとっては、力を発揮すべき大きな壁なのです。
大規模言語モデル(LLM)は、制御下であっても常に完璧に作動するわけではない。それは多くの人がすでに知るところ。アルトマンCEOは、最近やけにChatGPTをおバカさん呼ばわりしていますが、謙遜ではなく、それがあながち間違ってはいないからでしょう。
インターネットの世界で、自分でタスクこなせとLLMにオーダーすれば、ミスを連発するでしょうから。ただ、そのミスを正していくことこそが、前述のEcho AIなどのAI系スタートアップからGoogleやMicrosoft、OpenAIなど大手テック企業が取り組んでいることなのです。
物理的タスクもできるように?
もし、デジタルで(ソフトウェア面で)賢いエージェントの開発に成功すれば、現実の世界で物理的タスクをこなすエージェントが登場するのも時間の問題でしょう。だってデジタルエージェントの思考を物理的に反映するロボットを作ればいいわけなので。で、ここまで来るとレストランで注文を取ったり、屋根に瓦やタイルを貼ってくれたりの仕事をロボットに任せられるようになり、まさにSF世界となります。実現するのはきっとまだまだ先の話。
その未来へと続く道の最初にあるのが、今多くの起業が取り組んでいるデジタル面のエージェントです。
不安と期待
AIエージェント業界でよく話題に出ることがあるそうです。それはタスクをやりすぎるエージェントを作ってはいけないということ。
これを靴返品の例でいうと、見つけた購入メールのすべてを返品処理したり、靴をすべて返品したりすることです。話だけ聞くと、そんなコントみたいなことしないだろ?と思いますが、AI研究者の中では小さいながらも見捨てることができない不安の種だそう。AIによる過剰な決断が人類の文明を滅ぼすかもしれない…なんてね。
不安視する人がいれば、楽観視する人もいます。Echo AIはよりポジティブな見方で、エージェント技術こそわれわれ人類に力を与える存在だと考えます。AIコミュニティの悲観的・楽観的な正反対の考え方はさておき、少なくとも楽観組は、AIエージェントが現代のパソコンに匹敵するほど自由に活躍していくと考えています。
Kvamme氏はこう語ります。
「エージェントがこなす仕事の多くは、人間ができればやりたくないと思っている仕事であり、実現できればそれを解決できると私は深く信じています。そうなれば人間は自分の時間を、より価値あることに使うことができるようになりますからね。ただ、まずはそれに慣れることですけどね」
AIエージェント活用のわかりやすい例に、自動運転があります。現在はTesla(テスラ)やWaymo(ウェイモ)が自動運転技術では先頭を走っています。自動運転とは、ある意味自動車業界だけの話なので、AIワールドの中ではニッチでしょう。ですが、エージェント化は比較的先に行っており、すでにAIを活用した運転の導入が始まっています。
本当に使えるAIエージェントができるには
AIエージェントが本当に靴の返品をできるようになるには、何が必要なのか。
まずはその基礎となるAIモデルがより正確に、より賢くなる必要があります。となれば、多分完全なAIエージェント化よりも、ChatGPT、Gemini、Copilotなどの各社AIのアップデートが先に来ることになりそう。AIチャットbotは、それにつれてハルシネーション問題を改善する必要もあり。
その次に来るのが、エージェント自体のアップデート。OpenAIのGPTストアにはすでにたくさんのタスク特化型エージェントが並んでいますが、まだまだ進化の余地が多分にあります。
多くのAI企業が目指す進化版AIエージェントは、まだ実現の域にはありません。実現できれば、本当の意味でユーザーの日常で大きな役に立つ存在になります。
まるでSFではありますが、大企業が何千億円・何兆円という巨額の資金を注ぎ込んで実現させようとしている、それがAIエージェントという存在です。