王様の耳はロバの耳。
AI元年といってもいい2023年。去年のChatGPTリリースを皮切りに、BingにAI搭載、GoogleのBardと一気にAIチャットbotが台頭しています。ChatGPTはリリースから2カ月で1億アクティブユーザーを突破し、史上最速成長アプリとなっており、ユーザー視点でも企業視点でも今最も白熱しているのがAIチャット市場です。が、その裏にはプライバシーや権利の問題が…。
AIトレーニングデータの一部にあなたの文章が?
ChatGPTは言語モデルに支えられており、これが機能し成長するためには莫大なデータが必要です。言語モデルがより多くのデータをトレーニングすればするほど、出力されるテキストはより複雑で確かなものになっていきます。
ChatGPTを開発するOpenAIは、3000億ワードをシステムに取り込んでトレーニングさせたということですが、これらのワードはインターネット上に公開されていた本や記事、ウェブサイトやブログなどから持ってきたもの。公開されていたとはいえ、一部個人的な情報も含むであろうものです。
AIトレーニングデータとしての使用許諾は作者から取られていません。つまり、あなたがポストしたブログや、製品レビュー、ネット記事へのコメントなどが、ChatGPTのトレーニングデータに使われた可能性もあるということ。
トレーニングデータに使われたらどうなる?
自分の文章をChatGPTにトレーニングデータとして使われてしまうことに対する懸念点は、いくつかあります。まず、AIトレーニングに使っていい?と聞かれていないこと。つまり、使用許諾プロセスがなかったということ。
ポストした文章に自分や自分の家族、友人を特定できる内容が含まれていた場合は、プライバシー侵害に当たります。たとえ公に公開されたものであっても、プライバシーを法的にディスカッションする場合、原文のインテグリティ(元の文章外に個人の情報を出さない)として争論の中心となるのだそう。
次に気になるのが、OpenAIは個人情報データを保存しているか否か。している場合、消去を求める方法があるのかが明確にされていないこと。個人がそれをチェックする術が、現段階ではありません。これ、EU一般データ保護規則(GDPR)では、ユーザーの基本の権利になるんですけどね。
もっと言っちゃえば、そもそもChatGPTのトレーニングデータの中には、著作権があるものもあるのでは?ということ。AIに小説について尋ねると、数段落出力してくれます。実際、米Gizmodo編集部がChatGPTにピーター・ケアリー作の『トゥルー・ヒストリー・オブ・ザ・ケリー・ギャング』をリクエストしたところ、数段落返ってきました。これ、著作権ありの文章ですよね。つまり、現段階ではChatGTPは著作権については深く考えていないということです。
もっともっと言うと、ネットからトレーニングデータ拾ってますけど、それに対する報酬は、企業にも、個人にも支払われてはいません。有料版ChatGPT Plusもリリースされ、ここからの収益は2024年には10億ドル(約1340億円)に達すると予想されていますけれど…。トレーニングデータ報酬については、例えばAI画像生成サービスを始めたSHutterstockは、AIのインスピレーションとなった画像の提供者には使用料を支払う計画を発表しています。
ChatGPTのプライバシーに対する脆さ
Amazonが社員にChatGPTにコード共有するなとお達しを出したという報道がありましたが、これは関係者が社外に出るはずのない機密情報(コード)をChatGPT絡みで目にしたことが発端となっています。
つまり、外に出したくない情報は、ChatGPTに教えたらダメなんです。グラマーチェックのつもりでChatGPTに採点したもらったことで、その文章はChatGPTのデータの一部となってしまう、今後のトレーニングデータとして使用されてしまう可能性があるからです。巡り巡って、誰かがChatGPTに投げた質問に、その文章が出てこないとも限りません。
ちなみに認識している人がどれほどいるかわかりませんが、OpenAIのプライバシーポリシーによると、ユーザーのIPアドレス、ブラウザの種類・設定、ChatGPTとのやりとり、ブラウザアクティビティが取得されています。さらに、ユーザーの個人データは(ユーザーへの通知なしで)サードパーティーにシェアされる可能性もあります。
ユーザーが心に留めておくべきこと
ChatGPTはAI転換期のきっかけであり、私たちの仕事、学び、考え方など生活を一変させる技術革新になりうるという意見があります。確かに、そうかもしれません。でも、使用する上でユーザーが決して忘れてはいけないことがあります。それは、ChatGPTを開発するOpenAIは、収益を上げることが目的の1つにある私企業であるということ。人に知られたくないことはネットに上げないという基本的考えはもちろん、AIに秘密を打ち明けてはいけないことも忘れずに。王様の耳はロバの耳、なんですよ。