良い意味での脱力ぶり、好評だったけど。
先週スタンフォード大学から、Metaの大規模言語モデル・LLaMAを使った新たなモデル「Alpaca」とそのデモのチャットボットが公開されました。ChatGPTライクなシステムをより手軽に実現できるという触れ込みで反応も上々だったんですが、早くも公開停止されてしまったようです。
The Registerによれば、停止の理由はコストの上昇、安全面の懸念、そして「ハルシネーション」です。ハルシネーションとは、チャットボットがまるで事実のように出まかせを吐き出す挙動のことです。
スタンフォード大学のHuman-Centered Artificial Intelligence Institute(人間中心のAI研究所)は3月13日、Alpacaを使った双方向のデモとともに、学習データやデータ生成プロセスのコード、そしてモデルの微調整に使われた学習用コードも公開しました。
その際のプレスリリースでも、公開テストのリスクを認めるこんな記述がありました。「Alpacaの双方向デモを公開することには潜在リスクがあります。たとえば、有害コンテンツをより幅広く拡散してしまうことや、スパムや詐欺、虚偽情報の障壁を下げてしまうことです」
こうしたリスクを回避するため、研究チームはコンテンツフィルターやAlpacaの言葉を特定する電子透かしを実装したそうです。
リスクを予見してたのに結局デモを止めるってことは、わりと大問題があったんでしょうけど、具体的に何があったかは不明です。スタンフォード大学の広報担当はThe Registerに対し次のようにコメントしています。「デモ公開の当初のゴールは、我々の研究をアクセスしやすい方法で広めることでした。我々はこのゴールはほぼ達成したと感じており、ホスティングのコストやコンテンツフィルターの不備を考慮して、デモを停止しました」
米Gizmodoからスタンフォード大学の人間中心のAI研究所に直接コメントを求めましたが、記事執筆時点では回答はありませんでした。
デモとしては失敗したように見えるかもしれませんが、Alpacaの魅力はゆるキャラっぽい名前だけじゃありません。とくに初期コストの低さは衝撃的です。研究チームがAlpacaの稼働にかけた費用は600ドル(約8万円)だけだし、低性能なマシンでも動き、Raspberry PiやPixel 6でもOKだったという脱力ぶりです。ChatGPTをMicrosoftの何百億もかけたスパコンがぶん回てるのとはえらい違いです。
そんなAlpacaのデモにはもうアクセスできませんが、コードやそれを可能にしたデータは今もGitHubで公開されてるので、腕に覚えがある方は引き続きいろいろ試せます。
「私たちはユーザーの皆さんに対し、Webデモで問題点にフラグを立て、我々が新たな種類の問題を特定するのを助けてくださることをお願いしたいです」プレスリリースにはありました。「我々はAlpacaの公開によって、命令に従うモデル、及びそのモデルと人間的価値観のすり合わせに向けて、さらなる研究を推進していきたいです」