https://x.com/lakeside529/status/1960524929746788764?t=XXYxDFuCG5pQzUzQOnsmrw&s=19
キャラ5人の立ち絵を渡して「この子達がみんなでピクニックをしている画像を作成して。」と指示した結果、かなり破綻が少ない結果が出てる
こういうキャラ複数人の一貫性保持は長らく画像生成AIの課題だったから、これがここまで行ったのはゲームチェンジャーすぎる
Google 2.5FlashImagePreview (nano-banana)なるものを使ってる
やっぱりこういう分野はデータ持ってるGoogleが強えなあ
Permalink |記事への反応(3) | 17:27
ツイートシェア
あ、これOpenAIの後追いやってるのか マルチモーダルモデルで出力するっていう どおりでねえ
すげぇえええ コレって完全にオリジナルのキャラでも行けるって事でしょ ラノベの挿絵とか簡単に作れそうだね。 キャラデザも挿絵も破綻なく作れそう
抜き身の剣を乱雑に置くな