入力した文章に沿った画像を生成してくれるAI「Stable Diffusion」は、手軽に好みの画像を生成できることから大きな注目を集めています。一方で、AIの学習時に「実在のアーティストが描いたイラスト」が使われている点について「アーティストの権利を侵害している」という意見も寄せられており、「自分の作品が学習に使われていないかな?」と心配している人も多いはず。Stable Diffusionの学習には58億枚超えの画像を収録した大規模データセット「LAION-5B」が使われているのですが、このLAION-5Bに含まれる画像を検索できるウェブアプリ「Have I Been Trained?」が公開されていたので、実際に使ってみました。
Have I Been Trained?
https://haveibeentrained.com/
「Have I Been Trained?」にアクセスすると、ページの中央に検索バーが表示されます。検索は、文字列と画像から実行可能です。
◆文字列で検索
文字列で検索するには、検索バーに検索したい文字列を入力してEnterキーを押せばOK。今回は「うずまきナルト」のローマ字表記「Naruto Uzumaki」で検索してみました。
「Naruto Uzumaki」の検索結果が以下。ファンアートが数多く表示されました。
スタジオジブリの英語表記「Studio Ghibli」で検索した結果はこんな感じ。ジブリ作品の画像も多く学習されていることが分かります。
アーティスト名だけでなく、実在の人物名でも検索可能。AMDのリサ・スーCEOの名前で検索したところ、「CPUをわしづかみするリサ・スーCEOの写真」が大量に表示されました。
◆画像で検索
「Have I Been Trained?」では、画像を用いて検索することで「この画像が学習に使われているか否か」を確認できます。今回は、「モナ・リザ」が学習に使われているか調べてみます。
まず、検索バー内のカメラアイコンをクリック。
次に、検索したい画像を選択すればOK。
「モナ・リザ」の検索結果は以下。「検索画像と99%一致する画像が見つかった」という旨のメッセージが表示されました。
◆LAION-5Bについて
Stable Diffusionの学習に使用されているデータセット「LAION-5B」は58億枚以上の画像を含んでおり、研究目的に使われることを想定して「クリエイティブコモンズ BY 4.0」ライセンスで無料公開されています。「LAION-5B」に含まれる画像はインターネット上から無作為に抽出されており、人間による選別が行われていません。このため、「LAION-5B」にはアーティストの作品が数多く含まれています。
「LAION-5B」の詳細な情報は、以下のページで確認できます。
LAION-5B: A NEW ERA OF OPEN LARGE-SCALE MULTI-MODAL DATASETS | LAION
https://laion.ai/blog/laion-5b/
この記事のタイトルとURLをコピーする