誰でも参加できるオープンソースの大規模言語処理モデル「Open Assistant」開発プロジェクトをLAION AIがスタート

GIGAZINE



画像生成AI「Stable Diffusion」の学習用データセット「LAION-5B」を開発したLAION-AIが、誰でもアクセスできるオープンソースの大規模言語処理モデル「Open Assistant」のデータ収集用フロントエンドを公開しました。

Open Assistant
https://open-assistant.io/ja

GitHub – LAION-AI/Open-Assistant: OpenAssistant is a chat-based assistant that understands tasks, can interact with third-party systems, and retrieve information dynamically to do so.
https://github.com/LAION-AI/Open-Assistant

ChatGPTのような対話型AIを学習するためには膨大なテキストで構成されるデータセットが必要です。そこでLAION-AIは、オープンソースの対話型AIを開発するプロジェクトを立ち上げる上で、「人間が生成した高品質なサンプル」としてAIへの入力テキスト(プロンプト)とそれに対する応答を有志から収集するフロントエンドを立ち上げました。

このフロントエンドはメールアドレスを登録することで使用できるほか、ローカルに開発環境を実行してアクセスすることも可能です。

なお、ローカルで開発環境を実行してアクセスする場合は、DockerをインストールしたPCでOpen Assistantのリポジトリをローカルにクローンし、リポジトリのルートディレクトリでビルドします。コマンドは以下の通り。

git clone https://github.com/LAION-AI/Open-Assistant.git
cd Open-Assitant
docker compose up --build


実際にフロントエンドにアクセスすると以下のような感じ。右上の「Sign In」をクリック。


フロントエンドにはメールアドレスかDiscordのアカウントを登録することでアクセス可能。今回はローカルにビルドした開発環境でアクセスしており、デバッグユーザーとしてもログイン可能だったので、「Continue with Debug User」をクリックしました。


Open Assistantの利用規約が表示されます。


最後まで目を通したら、「Accept」をクリック。


表示されるフロントエンドのダッシュボードはこんな感じ。「Grab a task!」の部分には、Open Assistantの学習用データを収集するためのタスクが複数表示されています。今回はランダムなタスクに挑戦する「I’m feeling lucky」をクリックしてみました。


今回与えられたタスクは、一連の会話の中でAIの返答としてどれが優れているかの序列を決めるというもの。3パターンの回答が表示されたので、優れていると思う回答を上に、微妙だと思う回答を下になるように並べ替えて、「Review」をクリックします。


次に与えられたタスクは、Open Assistantの学習データでの初期入力テキストを新規に入力するというもの。画面の右上にOpen Assistantの対応言語が表示されており、今回は「日本語」なので、日本語テキストを入力して「Review」をクリックしました。


また、初期入力テキストの内容評価を行なうタスクも。今回は自分で入力したばかりの初期入力テキストを評価することになりました。評価を入力したら「Review」をクリック。


左カラムの「Message」をクリックすると、フロントエンドでこれまで入力されたメッセージや新しく生成されたOpen Assitantの返答が表示されます。


Open Assistantは有志のモチベーションを向上させるために、参加者の実績を表示するシステムが採用されています。


ダッシュボードでは、より多くのタスクをこなした人がランキング経緯で表示されました。


LAION-AIはOpen Assistantの展望として、「私たちはChatGPTを複製することにとどまるつもりはありません。メールを書くだけでなく、有意義に業務をこなし、APIを使って情報を動的に調査し、さらに誰もがカスタマイズして拡張できるような、未来のアシスタントを作りたいと考えています。優れたアシスタントを作るだけでなく、コンシューマー向けハードウェアで動作するような小さくて効率的なものにしなくてはなりません」と語っています。

この記事のタイトルとURLをコピーする

Source