文章(プロンプト)を入力するだけで画像を生成してくれるAI「Stable Diffusion」のバージョン2.0が2022年11月24日に正式リリースされました。そんなStable Diffusion 2.0を簡単に試せるウェブサイトが公開されていたので、実際に画像を生成して従来のStable Diffusion 1.4の生成結果と比較してみました。
Stable Diffusion 2 | Baseten
https://app.baseten.co/apps/VBlnMVP/operator_views/nBrd8zP
上記のリンクにアクセスすると、以下のような画面が表示されます。
画像を生成するには、下部の入力エリアにプロンプトを入力してから右側の「Generate」をクリックすればOK。今回は上記の入力例に記されているプロンプト「A lion wearing a cowboy hat」を入力してみました。
生成結果はこんな感じ。約30秒で「カウボーイハットをかぶったライオン」の画像を出力できました。同じプロンプトでもう一度生成したい場合は「Generate」をもう一度クリックします。
生成結果はこんな感じ。今度はモノクロ調のライオンの画像を生成できました。
同じプロンプトを用いてStable Diffusion 1.4で画像を6枚生成した結果が以下。Stable Diffusion 1.4で生成した画像には「カウボーイハットをかぶっていない」「毛並みの表現が大ざっぱ」といった問題が確認され、Stable Diffusion 2.0との品質差がよく分かります。
次に、「girl with long pink hair, instagram photo, kodak, portra, by wlop, ilya kuvshinov, krenz, cushart, pixiv, zbrush sculpt, octane render, houdini, vfx, cinematic atmosphere, 8 k, 4 k 6 0 fps, unreal engine 5, ultra detailed, ultra realistic」というプロンプトを入力してStable Diffusion 2.0で生成した画像が以下。Stable Diffusion 1.4では「人間の頭が見切れる」という問題が頻発するのですが、Stable Diffusion 2.0ではフレーム内に被写体がバッチリ収まっています。
同じプロンプトを入力してStable Diffusion 1.4で生成した画像が以下。Stable Diffusion 2.0で生成した画像と比べて輪郭がぼけていることが分かります。
「1girl, solo, smile, bow, jacket, :d, controller, hairband, holding, bowtie, bangs, blazer, shirt, purple eyes, open mouth, school uniform, looking at viewer, game controller, purple hair, upper body, blue jacket, holding controller, long sleeves, short hair, holding game controller」というプロンプトを入力してStable Diffusion 2.0で画像を生成するとこんな感じ。指の形やコントローラーの形は不自然です。
Stable Diffusion 1.4での生成結果はこんな感じ。顔がフレーム内に収まりつつ「コントローラーを持った紫の髪の毛の女の子」という指示を守れたのは右下の1枚のみ。
次に、イラスト風の画像を生成するために上記のプロンプトに「anime style」という語句を加えてStable Diffusion 2.0で生成した結果が以下。等身大ボードに照明を当てているような不思議な画像になりましたが、プロンプトの指示はほとんど守れており、輪郭もクッキリしています。
Stable Diffusion 1.4での生成結果は以下。やはりStable Diffusion 1.4では顔をフレームに納めるのが苦手で、輪郭もボケがちなようです。
Stable Diffusion 1.4でプロンプトに合った高品質画像を生成するには「複数のシード値で画像を生成して高品質な画像を生成できるシード値を選びだし、そのシード値で数百枚生成してから選別」という作業が必要なのですが、Stable Diffusion 2.0ではランダムなシード値でもプロンプトの指示通りの高品質な画像をサクッと生成可能でした。
この記事のタイトルとURLをコピーする