マックス・プランク情報学研究所やMIT、ペンシルベニア大学などの研究グループは、画像内の任意の場所をドラッグして画像を生成できるAI「DragGAN」を発表した。
DragGANは、画像内の変更したい場所をドラッグすることで、動物や車、人物、風景などのポーズや形状、表現、レイアウトを変更できるAIモデル。動物の表情や車の寸法を変更できるだけでなく、3Dモデルのように画像内の被写体を回転させることもできる。
同モデルはドラッグ操作によるユーザー対話型の方法を採用することで、従来の方法と比べてより柔軟かつ高精度にGAN(Generative Adversarial Networks、敵対的生成ネットワーク)による画像生成が行なえるという。
画像の出典:2023 Max Planck Institute for Informatics, CC BY-NC 4.0
コメント