2024年、Siriはおバカじゃなくなる

デジタルアシスタントにもAIの波が訪れています。

なんでも用事を言いつけてテキパキ対応してくれるミニロボットをポケットに入れて持ち歩ける日がくるなんて遠い昔の先祖は夢にも思わなかっただろうし、奇跡に近いことですが、問題はSiriにしてもGoogleアシスタント、Amazon Alexaにしても、そこまで有能じゃないこと。みな天気予報以上のややこしい用事になると、たちどころに使いにくくなります。

2024年はそれが変わる年。

AIでSiriも見違えるほどスマートになって、みんなの暮らしに小さいながらも意味ある変化をもたらす年です。大手テック企業が大規模言語モデルに“”を与えて、スマホ、ガジェットがますますAIまかせになっていく予感がします。

人間の言葉で話せる相棒

些細な変化に感じるかもしれませんが、これは結構大きな変化です。

今は、コンピュータにもわかる言語に翻訳して用事を言いつけないと、こちらの思惑や意図がうまく伝わりません。マウスやキーボードを使ったり、スマホやほかの端末をスワイプしたり、一定の手順に従わないと、思うように動いてくれなかったりしますよね。

AIでいろいろスゴイことができるようになったけど、機械と人間の間には意思疎通のバリアがあって、それがAIの進化の壁になっているのが現実です。

でもSiriにChatGPT的なAIが導入されたらどうでしょう。あたかも人に話しかけるようにコンピュータと対話できて、脳のメカニズムにだいぶ近づきます。スマホも今よりずっと身近になって、AIのみならずテクノロジー全般との関わり方にも変化が起きるはず。

「2024年にはあらゆるアプリと電子機器に、高度でパワフルなバーチャルアシスタントが組みこまれ、AIはマルチモーダルの段階に到達するだろう」と、AI市場をカバーする市場調査会社「Insider Intelligence」基幹アナリストのYory Wurmserさんも取材に答えて言ってます。

これは大きな転換点になります。

検索やスマホの操作方法が変わって、これまでの足かせが消えるんですからね。車や家にあるスマート端末すべてがノートPCに変貌を遂げるといっても過言ではありません。コンピュータとの関わり方がもっと人間的になって、そこからいろいろ興味深い課題も生まれてくるでしょう。

確かにスマホにイライラするときのことを想像してみると、たいてい何か処理したいことがあるのに所定の細かい手順を踏まないとタスクが実行できなくて、それがイラつきの元だったりしますもんね。

こうした通常の手順を踏むルートのことを専門用語で「happy path」といいます。順調に所定の手順に従ってるうちはいいのだけど、ひとつでもつまづくと、うまくいかなくなってしまうのが難点。

その点AIなら、クリックとかしなくても、人間の言葉で言いつけるだけで処理できるからその心配はありません。これが新しいマシンの使い方。その時代がもうはじまってるんです。

シリコンバレーの大手企業はAIが「人間並みに賢くなって職を奪う」と盛んに言うけど、AIで確実に訪れるのは「自分の全デバイスが自分の言葉を理解できる世界」。「超有能なAI」よりそっちが先なのかなと思います。

「AIピン」の不評が意味すること

その証拠に、秋にHumane社がリリースした「AIピン」は消費者の反応が非常にイマイチでした。「シャツにつけると、スマホの代わりになる」ということでだいぶ話題にはなったのだけど、700ドル(約10万3000円)で発売になったら笑われて終わり。製品紹介ビデオにもAIが事実を間違えてるシーンがあったりと問題が山積みだったのもありますが、そもそも発想の土台が間違っていたのかもしれません。

みんなが求めているのは「AIのパワーをアンロックする端末」ではなく「手持ちの端末のパワーをアンロックするAI」。まったく別の端末をつくることよりそっちが先決という印象です。

AIを軸にしたデジタルアシスタント再編

12月はじめにGoogle(グーグル)が次世代AI「Gemini」を発表したときにも「スマホで駆動するNanoバージョンも開発中」というお話でした。実装はまだ先ですが、Geminiはもう自社のChatGPT風チャットボット「Bard」に組み込まれてます。今年は「Hey Google」で質問に答えるSiriっぽい「Assistant」機能にもBardが導入されるとのこと。

それに呼応するように、これまでのGoogleアシスタントとARなんかのチームは年明けから大量レイオフされました

あなたと共同作業で働くBardと、あなたのために働くGoogleアシスタント。このふたつを統合する作業を現在進めているところです。コンピューティングは根底から変わる段階に入ったと考えていいでしょう。

とGoogleのBard開発責任者のJack Krawczykさんも最近会ったとき言ってましたし、Bardを軸にAIは統合されていきそうな気配です。

もっとも、AIによる再編も一番乗りはOpenAIとその提携先のMicrosoft(マイクロソフト)ですけどね。MS検索マシンBingにChatGPTのアシスタントが実装され、対話からテキストを生成して、それで検索できるように、もうなってます。「Hey ChatGPT」と呼ぶと起動するわけじゃないけど、それは簡単に直せるだろうし、ここでも先行者ですね。

Apple(アップル)はすっかりビリだけど、まあAppleの場合、一番乗りじゃなくてもいいって話もあるかな。野心的なAI事業をいくつかローンチ済みだし、何千、何百万人が使うiPhoneがすでにあるので、それに利用価値の高いAIプロダクトと組み込めばそれでOKですから。

Amazon Alexaも自社独自のチャットボット「Q」を先ごろ発表して追い上げているし、Metaもマーク・ザッカーバーグがAI、AIと檄を飛ばしてるようだし、おもしろくなってきました。

こうした流れのなか、GoogleのKrawczykさんは米Gizmodoの取材にこう答えています。

BardみたいなAIのことを当社は『augmented imagination(拡張イマジネーション)』と呼んでいるんですよ。頭の中にあるアイデアを吐き出して、いろんな実現アプローチを探すお手伝いをするAIですね。

何がどう変わるの?

従来のデジタルアシスタントはSiriもAlexaもGoogleも「タイマーを10分にセットして」といったコマンドを覚えないとダメでしたが、Bardは「手紙を書くのを手伝って」と言えば、それだけでこっちの意図を理解してくれます。新旧ひとつにまとめれば無限の可能性が開けていくというわけです。

具体的に何がどう変わるのかというと、SiriやGoogleアシスタントに「Netflixアプリを開いて映画を再生して」とは頼めませんでしたが、そういうことができるようになります。ChatGPTを一度でも触ったことのある人ならもう知ってると思いますが、どんな聞き方をしても話が通じるようになるんですね。

検索の回答がいつも正しいとは限らないし、ハルシネーション(まことしやかに作り話すること)の問題も残るだろうけど、あいまいな質問にも複雑な質問にも対応してくれるのは本当にありがたいですよね。

Amazonで商品を見ながら「Siri、この商品の感想を書いて、スクリーンショットを兄に送って、次の木曜の10AMに購入して」と言えば全部処理してくれたり。

義理のお兄さんの名前をど忘れしても「ヘイ、Google。昨日大谷翔平のことでメッセージくれた誰かさんに電話して」と言うだけで事足りる。そんな世界がすぐそこまできているのです。

カオスをまとめるAI

AIをOSに組み込めば、人間×コンピュータのみならずコンピュータ×コンピュータのコミュニケーションも円滑になることが予想されます。

今はアプリをつくって端末で動かすまでには膨大な手作業が必要。プログラムを書いて、時には複数の言語を駆使して、カスタマイズされた非汎用のプロトコルを使ってコマンド送受信が可能になる長い道のりです。でも大規模言語モデルならプログラミング言語の翻訳もお手の物ですからね。

その辺のことをテック業界に精通したソーシャルオーディオプラットフォーム「 Blast Radio」のYousef Ali CEOに取材してみたら、こう語っていました。

パソコンはここ30年ぐらい、メタファーが地層のように積み重なった世界と化している。ファイルシステムがあって、ウィンドウが開くシステムがあって、 アプリのレイヤーが何層もあって、その中にブラウザがあって、その上にはクラウドの全ソフトウェアがある世界。AIがそのすべてをまとめる最終回答になるだろう。

たとえば『このうるさいBluetooth接続をOFFにして』と話し言葉でコンピュータに話せば、この不条理の世界を上手にナビゲートしていってOFFにしてくれるわけね。

冷蔵庫と話せる時代がくる

携帯電話がスマートになれば、ほかの電子機器も全部スマートになるし、AIで携帯の操作がシンプルになれば、それが全製品に波及します。

先述の調査会社のWurmserさんもこう言ってました。

自然言語の処理であれば相互乗り入れもできるし、2つのマシン同士の意思疎通が格段にラクになりますね。

データ量と複雑さを考えると、完全に相互運用可能になるのはまだまだ先だけど、AIが相互をつなぐ役目を担えば何もかもが簡単になるし、こちらは割と早くきそうです。

特にGoogleは、360度どこを見回してもコンピュータがある世界のことを“アンビエント・コンピューティング”という言葉で提唱していますからね。本当にそうなるかはわからないけど、少なくとも冷蔵庫と話はできるようになりますよ。

いや~冷蔵庫と話す未来…。「暴飲暴食やめろ」と言うお節介な冷蔵庫などが生まれて「なんとかしろ!」って問題になる近未来が目に浮かびます…。2024年は家電に倫理規範が求められる年になるかもしれませんね。

思想の偏りとかもありそう

人間の言葉でやりとりする家電となると、話し方が気に入らないと言って騒ぐ人も現れそうです。こないだ「ChatGPTの語り口が左翼っぽい」と怒って独自のチャットボットGrokの開発に動いたイーロン・マスクがいい例(けっきょくGrokも左翼っぽくて二度激怒)。

人工知能とはいえ、チャットボットにも一定のキャラはあります。そのうち人間は物理的なモノより、その素行に愛着を持つようになる気がします。

ワクワクする未知の可能性が生まれる反面、プライバシーやデータ使用、過度依存のリスクがあることも事実ではありますが。(Wurmserさん)

AIが生活に浸透する年

以上、「超有能なロボットの誕生より前にくるのが、AIが生活の隅々に行き渡る未来で、それがはじまるのが2024年」というお話でした。紆余曲折を辿りながらの長い長い変化になるので、気づかないかもしれませんが、来年の今ごろ振り返ってみると後戻りのない変化に驚くかもしれません。