画像生成AIで画風や絵柄を再現できる「Dream Booth」で実際にAIモデルにされた著名イラストレーターとAIモデルの作成者自身にインタビューした貴重な記録

GIGAZINE



Stable DiffusionDALL・E2のような画像生成AIは、ニューラルネットワークの学習のために大規模な画像データセットを使っています。しかし、こうしたデータセットに含まれる画像は著作権の問題をクリアしていないケースが多く、問題視する声もあがっています。そんな中、自分のイラストがAIモデルの追加学習に勝手に使われたというイラストレーターと、そのモデルの追加学習を行った本人へのインタビューが公開されています。

Invasive Diffusion: How one unwilling illustrator found herself turned into an AI model – Waxy.org
https://waxy.org/2022/11/invasive-diffusion-how-one-unwilling-illustrator-found-herself-turned-into-an-ai-model/

勝手に追加学習に使われたのは、さまざまな作品のキャラクターデザインを務めるプロのイラストレーターであるHollie Mengert氏です。Mengert氏はある日、友人やファンからオンライン掲示板サイト・Redditに立てられた以下のスレッドのリンクをメールで受け取ったとのこと。

このスレッドでは、MysteryInc152を名乗るユーザーがMengert氏のイラスト32枚を使い、既存のAIモデルに追加学習を施せる「Dream Booth」を使い、Mengert氏の画風や絵柄を再現できるAIモデルを作成しました。しかし、MysteryInc152の投稿をきっかけにRedditでは大きな議論が巻き起こりました。問題のスレッドには「合法かどうかにかかわらず、何千人もの人々がMengert氏の画風を正確にコピーできるようになったとして、Mengert氏自身はどう感じるだろうか」というコメントもついています。

そこで、ソフトウェアエンジニアのAndy Baio氏は実際にMengert氏にアポイントメントを取り、インタビューを行いました。Mengert氏は「この話を始めて聞いたとき、私は自分の名前がこのAIに載っていることが不審に思えました。もし、こんなことをしていいかと聞かれたとしても、イエスとは言えなかったでしょう」と述べています。

そもそも、Mengert氏がたとえすべての画像の使用を許可したくても、Mengert氏の一存では許可できない状況だったとのこと。AIの追加学習に使われた画像はディズニーやペンギン・ランダムハウスのために制作されたものであり、画像の権利はMengert氏になかったそうです。そのため、Mengert氏の画像で追加学習していいかどうかの判断はMengert氏自身でも下せなかったというわけです。

Mengert氏は、AIモデルが生成したイラストが自分の作品の個性を表現していないと思ったそうで、「AIはブラシの質感や筆致を模倣し、色や形を抽出することができますが、それが必ずしもイラストレーターやデザイナーが仕事を得られる理由にはならないでしょう。筆致や色彩は、アートの中でも最も表面的な部分です。人々が最終的にアートで共感するのは、愛すべき、親しみやすいキャラクターだと思うのです。そして、AIがそれに苦労しているのを目の当たりにしています」と述べています。

また、Mengert氏は「私ならこう描くという判断をAIが下しているとは個人的に思えず、生成された結果との隔たりを感じてしまいました。私のスタイルを模倣しているわけではないのに、私の名前がツールの一部に含まれているような気がして、それが不満でした」と述べ、「このAIを作った人は、私を人間ではなくブランドか何かのように考えていたような気がします。なぜなら、私の描いたイラストが私の人生や経験を反映したものだと考える人であれば、こんなことはやっていないと思うのです。私にとって一番大きな意味を持つのは、私の名前が使われていることです。なぜなら、クリエイターとして様式化されたイメージとして、自分の名前が使われているのはとてもうれしいことだからです。しかし、こういった形で自分の名前がついていることは、結局私にとって非常に不快で侵略的なことなのです」とコメントしました。


一方で、Baio氏はAIモデルを作成したMysteryInc152にも連絡を取りました。MysteryInc152の正体はナイジェリア出身・カナダ在住のエンジニアであるOgbogu Kalu氏。ファンタジー小説やサッカー、漫画やアニメが好きで、画像生成AIの技術にも興味を持っているとのこと。

実は、Kalu氏はMengert氏の作品に詳しくなかったそうです。もともとはRedditでMengert氏の画像とDream Boothを使って追加学習を行っていたユーザーが別にいたそうですが、そのユーザーの作業があまりうまくいってなかったため、Kalu氏が画像セットを改良して調整を行い、あらためてリリースしたとのこと。


Kalu氏はRedditでの議論で、「道徳に基づく議論などありえません。それは恣意(しい)的に制限するものです。あなたが正しいと思うか間違っていると思うかはどうでもいいのです。Stable Diffusionを使って今日の業界の破壊に貢献するかしないかです。Stable Diffusionを使えると思っても、自分が描いたおかしな架空の線のせいで『善人』になってしまう人は、自分を欺いています。機能的な違いはありません」と述べています。

Baio氏がこの意見についてKalu氏に尋ねたところ、Kalu氏は非常に現実的な見解を示したそうです。Kalu氏は学習にイラストを使用することは合法で、法的にフェアユースと判断される可能性が高く、著作権で絵柄を保護することはできないと考えているとのこと。また、Stable Diffusionは写真や絵の画風を忠実に再現出来ますが、元の画像はStable Diffusionに保存されておらず、データセットのデータは100TBを超えるにもかかわらず、AIモデルのデータ自体は4GBで済んでいるとも主張しました。

しかし、Baio氏が「フェアユースであれば、アーティストがどう思うかは法律の観点から見れば関係ないでしょう。しかし、アーティストがこのAIを気に入らない時に、自分たちの作品がどのように使われるかについて発言権を持つべきだと思いますか?」とたずねたところ、Kalu氏は少し考えてから「ええ、それは……それは違います。場合によると思います。このケースは、アーティスト自身の作品を直接使用して彼らに取って代わるという意味とはちょっと違います」と述べたとのこと。

Kalu氏は、「今回のケースで反対の声を挙げている人の多くは、コラージュのように作品をつぎはぎしていると勘違いしていますが、新しいイメージを生み出しているのです。それは過去の鮮やかな記憶を思い出そうとするような、変容的なものなのです」と述べ、「個人的には、この点が変革なのだと思っています。もしそうであれば、アーティストはAIモデルがどのように作成されるのかについて、本当に発言権を持っていないのではないでしょうか」とコメントしました。

その後、Mengert氏がAIについて快く思っていなかったことを知ったKalu氏は、Mengert氏の作品を追加学習したモデルの名前を「hollie-mengert-artstyle」から「Illustration-Diffusion」に変え、「Mengert氏はこのAIに一切関与していません」という文言をReadMeに追加したそうです。

この記事のタイトルとURLをコピーする

Source

タイトルとURLをコピーしました