AdobeのPhotoshopやIllustratorでもテキストベースで画像やエフェクトを生成できるようになるAI「Firefly」では一体どんなことができるのか中の人に見せてもらってきた

GIGAZINE



2023年3月21日、Adobeが独自のジェネレーティブAI「Firefly」を発表しました。Fireflyは、入力したテキストをベースに自動で画像を生成したり、入力したコンテンツと類似のテクスチャや画像を生成したりすることができるというAdobe独自のジェネレーティブAI。FireflyはAdobe Stockの画像や、ライセンスフリーのコンテンツ、著作権が失効しているパブリックドメインコンテンツをベースにトレーニングされているため、既存のジェネレーティブAIのような著作権関連の問題に頭を悩ませる心配がないというのも特徴です。

Adobeが独自のジェネレーティブAI「Firefly」を発表、PhotoshopやIllustratorといったCreative Cloudへの統合も – GIGAZINE


Fireflyは発表と共にプライベートベータ版が公開されているのですが、このベータ版を使ったデモンストレーションを、Adobeの最高デジタル責任者(CDO)である西山正一氏が披露してくれるということで、メディア向けオンライン説明会に参加してきました。

そもそも、AdobeのAIイノベーションへの取り組みは10年以上にわたっています。近年ではAdobe SenseiのようなAIツールをリリースしており、Adobeは既に数百ものインテリジェント機能を提供しているそうです。そんなAdobeのAIツール開発におけるスタンスは、説明責任・社会的責任・透明性を柱にしたAI倫理原則に沿った開発を行うというもので、当然FireflyもこのAI倫理原則に沿って開発されています。また、AdobeのAIツールは「白紙の状態からイメージの実現に至るまでの障壁を取り除く『副操縦士』として、クリエイターが自らの創造性により自信を持てるように後押しすること」であり、クリエイターに取って代わることを目的に設計されたツールではないと西山CDOは強調しています。

そんなAdobeが開発している最新のジェネレーティブAIがFireflyです。Fireflyは、「商業利用に特化した画像生成」を行えるように設計されているのが特に重要なポイントだそうです。Fireflyの最初のモデルはAdobe Stockが収録する画像、オープンライセンス画像、著作権が失効したパブリックドメイン画像でトレーニングされています。なお、FireflyはPhotoshopやIllustrator、 Experience Managerなどのツールに搭載される予定です。


Fireflyは、企業の所有するアセットを使ってFireflyをトレーニングするといった、カスタムトレーニングが可能なAIを目指しています。さらに、Adobe StockやBehanceで行ってきたような「アセットを提供してくれたクリエイターに対して収益を還元する」構造を、Fireflyにおいても模索中だそうです。ただし、記事作成時点では詳細について発表できることはないとのこと。


Fireflyではコンテンツ認証イニシアチブ(CAI)のコンテンツクレデンシャル機能を用いることで、生成コンテンツの透明性を確保します。具体的には、Fireflyで生成した画像には自動的に「AIで生成された画像」であることがコンテンツクレデンシャルに添付され、「Do Not Train」というタグが付けられた画像はFireflyのトレーニングに利用しないなどが挙げられています。


プライベートベータ版はウェブツールとしてリリースされており、使える機能は「テキストからの画像生成(Text to image)」および「テキストエフェクト(Text effects)」の2つのみ。Adobeはプライベートベータ版について「あらゆるスキルレベルのクリエイターに作品を作っていただくだけでなく、共有・実験・フィードバックを促進することが狙い」と説明しています。


「テキストからの画像生成」


UIは以下の通りで、ユーザーが生成した画像が並んでいます。画面下部にあるテキストボックスにプロンプトを入力すると、指示に沿った画像を生成することが可能。


ベータ版ではプロンプトをベースに4つの候補画像が生成され、画面右側にあるパラメーターで画像の仕上がりを調整可能。


テキストエフェクトでは、入力した文字にFireflyを使ってエフェクトを追加することができます。エフェクトを追加したい文字列は「Input text」部分に入力し、どのようなエフェクトをかけたいかは画面下部のテキストボックスに入力します。画面右側にあるパラメーターを使うことでエフェクトの種類だけでなく、フォントを変更することも可能。


Fireflyと他のジェネレーティブAIの違いは以下の5点に集約されるそうです。

・商用利用に特化した画像生成を念頭に設計
・最高品質のアセットを使用してトレーニング
Adobe Creative CloudAdobe Experience CloudAdobe Document Cloudでの統合されたワークフロー
・クリエイター重視のアプローチ:カスタムトレーニングや収益の還元
・コンテンツクレデンシャル機能(コンテンツ認証イニシアチブ:参加団体・企業900以上)を通じて、デジタルコンテンツの透明性を提唱


さらに、Fireflyの今後の展開としていくつかの利用コンセプトも西山CDOが公開してくれました。

例えばPhotoshopの場合、「水中都市」と入力するだけで画像にオブジェクトを追加できるような機能の実現が計画されています。


Illustratorの場合は、イラスト、アートワーク、グラフィックデザイン制作の役に立つような機能をFireflyで提供します。具体的には、手書きのフォントをFireflyを使ってベクター化するなどが提唱されています。


Premiere Proの場合は、動画編集機能のひとつとしてFireflyが活躍する可能性があります。例えば、「シーンを冬の日に変更」と入力することで、動画のワンシーンをまとめて冬に変更してしまうことが提案されていました。


Substance 3Dでは、3Dモデルの制作などにFireflyを応用することが計画されています。具体的には、入力したテキストをベースに3Dモデルを作ったり、作成した3Dモデルのテクスチャを変更したものをFireflyが提案したりなどが期待されます。


デザインツールのExpressでは、マーケティング画像やSNS投稿に利用できるテンプレートをFireflyで作成することが期待されています。


さらに、Adobeは2023年3月21日に開催されたAdobe Summitの中で、Adobe Experience CloudにAdobe Sensei GenAIサービスを統合することを発表しました。


Adobe Sensei GenAIサービスは、Adobe Experience Cloudにネイティブに搭載され、マーケティングワークフローのどこからでもアクセス可能なジェネレーティブAIサービスとなります。Adobe Sensei GenAIサービスは、マーケターにとっての副操縦士となり、完全なクリエイティブコントロールによりブランドのトーン&マナーを維持したまま、生産性と効率性を大幅に向上させることを目指しています。なお、Adobe Sensei GenAIサービスの統合を最初に予定しているAdobe Experience Cloud製品は、Experience ManagerJourney OptimizerCustomer Journey AnalyticsMarketo EngageReal-Time Customer Data Platformです。


そして、FireflyもExperience Manager(AEM) AssetsおよびAdobe Expressと統合される予定です。Adobe Experience Cloudに搭載されたFireflyは商用利用に問題ないコンテンツを生成してくれ、さらにFireflyが生成した画像のパフォーマンスに関する消費者インサイトを取得することができるたので、Fireflyで生成したコンテンツのビジネス効果を評価するフィードバックループを構築することも可能となります。


なお、Adobe Sensei GenAIサービスはMicrosoft Azure OpenAIやオープンソースのFLAN T-5をはじめとする大規模言語モデル(LLM)を活用しているため、ひとつのLLMに依存せずビジネスニーズを満たすようなカスタマイズが可能となります。具体的には、マーケティングコピーを作成したり、チャット体験を提供したり、オーディエンスおよびジャーニーの作成を担当したり、キャプション生成を担当したりすることが可能になる模様。


さらに、Fireflyのデモンストレーションも西山CDOにより披露されました。なお、デモンストレーションで使用されたのはAdobe社員向けに提供されているベータ版であるため、プライベートベータ版とは微妙にUIが異なる可能性があるとのこと。

プライベートベータ版で提供されるのは「Text to image」と「Text effects」の2つのみで、テキスト入力は英語にのみ対応しています。


「Text to image」で、「ヨーロッパの観光客が東京の道路でマリオカートを楽しんでいる様子」と入力すると、以下のような画像が生成されました。知的財産(IP)を侵害するような要素が生成されないのが特徴だそうで、世界的に有名なキャラクターの名前を色々入力してみたものの、「IPを侵害するような画像が生成されることはなかった」と西山CDOは語っています。


「Text effects」で、「Adobe Summit」という文字に「ラスベガスの夜」というエフェクトを追加するよう入力すると、生成されたのが以下の画像。


エフェクトを「ラスベガスのスロットマシーン」に変更すると、こうなりました。


というわけでデモンストレーションが終わったので、質疑応答(Q&A)がスタート。

Q:
生成したものにはFireflyで生成したことを示す情報が入るそうですが、Fireflyで生成した画像をPhotoshopなどで事後的に編集・合成などを行った場合は、この情報はどうなるのでしょうか?

A:
Adobeのコンテンツクレデンシャル機能は画像の加工履歴を記録する機能です。「Fireflyで生成した」という情報だけでなく、「Photoshopで加工された」という情報も記録されます。ただし、コンテンツクレデンシャル機能は記事作成時点では開発段階にあるため、これ以上の詳細を明らかにすることはできません。

Q:
クリエイターへの収益還元について。現在、Adobeで収益還元が行われているサービスはAdobe Stock以外にありますか?

A:
具体的にはAdobe Stockのみとなりますが、(Creative Cloud デスクトップアプリ内の)マーケットプレイスでプラグインなどを販売することは可能です。Behanceはコンテンツを売買するサービスではなく、クリエイター向けのLinkedInのように「クリエイターとクリエイターに仕事を発注したいと考えている企業」をつなげるサービスなので、Adobe Stockやマーケットプレイスとは異なります。

Q:
Adobe Stockの中に権利関係が怪しいと指摘されている画像もありますが、これらをトレーニングに使用しているならば本当にFireflyを安心して商用利用できるのでしょうか?また、Adobe Stockの画像を使用したことで第三者から権利侵害を申し立てられた場合、規約によりAdobeから補償を受けられると思いますが、Fireflyで生成した画像が同じように権利侵害を申し立てられた場合には、これも補償の対象となりますか?

A:
Adobe Stockに限らずフォトストックサービスにはコンテンツを審査するスキームがあります。この審査するスキームが100%完全なものかと言われると、必ずしもそうではないというのが正直なところです。もちろんスキームをベースに権利関係が怪しいものを弾いているというのは大前提にありますが、先ほど言った通り100%ではありません。そのため、その万が一が発生した時のために補償が設けられています。Fireflyにおいても同様なので、補償対象となる予定ですが、あくまで現時点ではFireflyはプライベートベータ版であるためサービス提供時にどうなるか回答することは難しいです。ただし、こういった点も含めて透明性を担保するよう設計されているという点を強調したいです。

Q:
Fireflyの名前の由来は?

A:
公表していません。

Q:
FireflyのトレーニングのベースとなるAdobe Stockには、すでに外部のジェネレーティブAIが生成した画像も含まれていると思います。これらはトレーニングのデータセットに含まれますか?含まれる場合、権利関係はクリアになっているのでしょうか?

A:
Fireflyのトレーニングに外部のジェネレーティブAIが生成した画像が含まれるか否かをクリアにお答えできる立場にないというのがひとつ。現状把握しているのは、Adobe Stockが学習ソースであり、この中の数億点の画像がトレーニングのソースとして利用されているという点です。これはAdobe Stockのすべての画像をトレーニングに利用しているというわけではありません。ただし、前述の通り、権利関係がクリアになっているということが大前提で画像はトレーニングに利用されており、万が一の場合には補償しますというスタンスで開発が行われているはずです。

Q:
Premiere Pro等のデモはものすごく実現難度が高そうに感じましたが、できたらいいな程度の段階なのか、それとも技術的にめどは立っているというレベルなのでしょうか?

A:
目指しているのがこうという話で、どの段階まで開発が進んでいるかは返答しかねます。

Q:
日本語対応について。

A:
日本語を含む英語以外の言語への対応も予定していますが、日程は未定です。

Q:
Fireflyで作成したコンテンツの著作権はAdobe側にあるのかクリエイター側にあるのでしょうか?

A:
検討中です。

Q:
Adobe Stockには「ジェネレーティブAI」というタグがありますが、Fireflyで生成されたコンテンツにも同様のタグがつくことになりますか?

A:
Yesのはずですが、まだベータ版なので100%の断言はできません。

Q:
サービスインの時点で日本語に対応するか?

A:
希望はそうですが断言しかねます。

Q:
テキストエフェクトはひらがなや漢字に対応しますか?

A:
現時点では未対応ですが、今の段階でも日本語を文字ではなく画像として認識しているので、日本語にエフェクトをかけることは可能です。ただし、書体を変えるなどの全機能を利用することはできません。


Q:
Stockにある素材はどのようにトレーニングに使う許諾を得たのでしょうか?元々そういった項目があったのでしょうか?

A:
その通りです。Adobe製品の開発に利用する旨の記述があります。

Q:
Fireflyのロードマップなどあれば教えてください。

A:
現時点で言えるのは今回発表した内容のみです。

Q:
ジェネレーティブAIが生成した画像は著作権が発生しないという方向で議論が進んでいますが、商用利用の場合は企業が利用する上で懸念ポイントとなるのではないでしょうか?

A:
Fireflyが製品化した際にどのようなライセンスになるかが不明なため、クリアにお答えすることは難しいところではあるのですが、Adobe Stockの場合はロイヤリティフリーというライセンス形態となっています。ロイヤリティフリーであるため著作権侵害は起きませんが、競合他社と同じ画像を使用してしまうなどのリスクはカバーできません。これと同じように、Fireflyは「商用利用する上でリスクがない」というAdobeが考える範囲で設計しているというだけで、我々の設定した権利ラインを企業側が「リスクあり」と判断する可能性は十分に考えられるとは思います。ただし、現時点ではそこまで踏み込んだ回答はしかねるという状況です。

この記事のタイトルとURLをコピーする

Source