近年、文章(プロンプト)を入力するだけで画像を生成してくれるAI「Stable Diffusion」が大きな注目を集めていますが、Stable diffusionは基本的にNVIDIA製のGPUで計算を行うように設計されており、他社製のGPUで計算を行うことは想定されていません。しかしプログラマーのrahulunair氏が開発した「stable_diffusion_arc」が、Intel製のGPUである「Intel Arc」でStable Diffusionを動作させることに成功しています。
GitHub – rahulunair/stable_diffusion_arc: Stable Difussion inference on Intel Arc dGPUs
https://github.com/rahulunair/stable_diffusion_arc
Stability AIが公開している「Stable Diffusion」は、入力した文章(プロンプト)に沿った画像を生成できるAIです。「海辺で遊ぶクマ」や「アイスクリームを食べる少女」などのキーワードから想像以上のクオリティーで画像が生成されます。
Stable Diffusionを使用するにはNVIDIA製のGPUを搭載したコンピューターを用意する必要があるため、当初は使用のハードルが高く、誰でも手を出せるものではありませんでした。しかし、Stable Diffusionはオープンソースでの開発が進められ、比較的低スペックのコンピューターでの動作やCPUだけでの動作、スマートフォン上のアプリで動作させることなどに成功しています。
今回、rahulunair氏はIntel Arc A770の16GBモデルを使用してStable Diffusionを動作させています。
Intel ArcでStable Diffusionを動作させるには、機械学習ライブラリであるPyTorchもしくはTensorFlowが必要です。Intel ArcでPyTorchを使用するには、Intel extensions for PyTorchまたはipexの最新版が必要とのこと。
最初に画像を生成する際には約60秒、それ以降は約30秒必要とされています。
以下はIntel ArcでPyTorchを用いてStable Diffusionを動作させ、生成した画像です。また、この画像のプロンプトは「vivid red hot air ballons over paris in the evening」とのこと。
また、以下の画像はTensorFlowを用いた画像です。プロンプトはPyTorchと同じ「vivid red hot air ballons over paris in the evening」です。
なお、「Intel ArcのセットアップはすべてLinux上で行いました」とrahulunair氏は述べています。
この記事のタイトルとURLをコピーする