GoogleのチャットAI「Bard」はChatGPTのデータでトレーニングされているという指摘も公式は否定

GIGAZINE



GoogleがChatGPTのライバルとして発表したチャットAIの「Bard」は、ChatGPTとユーザーの会話内容を記録するShareGPTのデータを利用してトレーニングされていると指摘されました。しかし、Googleはこの指摘を否定しています。

Alphabet’s Google and DeepMind Pause Grudges, Join Forces to Chase OpenAI — The Information
https://www.theinformation.com/articles/alphabets-google-and-deepmind-pause-grudges-join-forces-to-chase-openai


Google denies Bard was trained with ChatGPT data – The Verge
https://www.theverge.com/2023/3/29/23662621/google-bard-chatgpt-sharegpt-training-denies

Google denies using ChatGPT data to train its Bard AI
https://bgr.com/tech/google-denies-using-chatgpt-data-to-train-its-bard-ai/

Google Rejects Allegations of Training Its Bard Chatbot on Data from ChatGPT
https://winbuzzer.com/2023/03/30/google-rejects-allegations-of-training-its-bard-chatbot-on-data-from-chatgpt-xcxwbn/

BardはChatGPTの対抗チャットAIとしてGoogleがリリースした対話型AIです。実際にどんな会話ができるのかは、以下の記事をチェックすればわかります。

GoogleがChatGPTのライバル「Bard」の一般公開を開始、実際に質問するとどんな答えが返ってくるのか? – GIGAZINE


Googleの親会社であるAlphabetは、傘下のAI研究所であるDeepMindとGoogleのAI開発部門であるBrain AIという2つのグループに、共同でBardを開発させているそうです。開発チームは、Bardの開発速度を上げるためにChatGPTの会話データを利用していた模様。

Bardの開発に携わっていたというAI研究者のひとりは、The Informationに対して「GoogleはBardをトレーニングするデータを、ShareGPTに依存している」と語っています。ShareGPTはChatGPTとユーザーのやり取りを記録するサイトです。

報道によると、Googleの幹部にChatGPTのデータを利用すべきでないと警告したのはJacob Devlin氏で、同氏はGoogleを去りOpenAIに入社したそうです。Devlin氏はBardの回答があまりにもChatGPTに似ているというだけでなく、ChatGPTの会話をBardのトレーニングに利用することはOpenAIの利用規約に違反する可能性があると指摘していたそうです。一方、海外掲示板のHacker Newsでは、「ChatGPTの出力はOpenAIにより著作権で保護されているわけではありません」と、データの利用に法律上の問題はないと指摘する声もありました。


さらに別の情報筋によると、GoogleはDevlin氏の警告を受けたのちChatGPTのデータを利用することを停止した模様。さらに、ChatGPTのデータを利用してトレーニングされたモデルも削除されたと報じられています。

The VergeがGoogleに「BardはChatGPTのデータを利用してトレーニングしているのか?」と質問したところ、同社の広報担当者であるクリス・パパス氏が「BardはChatGPTまたはShareGPTのデータでトレーニングされているという事実はありません」と回答したそうです。ただし、「残念ながら、私が共有できるのはこれだけです」と語っており、過去にBardがChatGPTのデータでトレーニングされたか否かについては回答を避けています。

なお、ShareGPTの「Explore」というページには11万2000件以上の会話が含まれていたそうですが、このページは2023年3月の第4週に削除されています。そのため、削除されたのは「Bardで利用するため」だという指摘もあります。

The cat is finally out of the bag – Google relied heavily on @ShareGPT‘s data when training Bard.

This was also why we took down ShareGPT’s Explore page – which has over 112K shared conversations – last week.

Insanity. pic.twitter.com/34WiLQBD4V

— Steven Tey (@steventey)


なお、GoogleがBardを発表した直後には、社内から急すぎる発表への批判的な声が漏れていました。

Google社員は「Bard」の性急すぎる発表に不満を抱いている – GIGAZINE


この記事のタイトルとURLをコピーする

Source