今話題の画像生成AIは、文字を入力として画像を生成するが、その文字列のことをpromptという。
自然言語でも生成出来るが、クオリティを上げるにはpromptを理解するしかない。
その参考文献として、DALL-E2 promptbookというのがある。
アニメ風の画像を生成するのに、「In the style ofStudio Ghibli」を入れれば良いと、日本語で検索すると出てくると思うが、
なんでジブリ?と思った人は居ないだろうか?
おそらくDALL-E2 promptbookに書かれているので、それで試しているところから広まったのだろう。
さて自分が欲しい画像をどうやって表現するのかだが、DALL-E2 promptbookを見ると、美術史とも呼べる単語が並んでいる。
Pixar、1990s Disney, cel shading辺りはわかるが、Mythologicalmap、Fayum portraitなどなど。
アーティスト名についても、
「Inspired?TryGoogle's Arts & CultureHub to find 13,000more artistsyou can work with.」と
自分が生成したい画像が出てこなくて悩んでいるときに、誰と誰の画風を合わせればいいかや、どの美術カテゴリーに入っているか、
教養が試される。
映画やテレビのプロンプトをハックしろとDALL-E2 promptbookには書かれてるいるが、これも教養の類だろう。
ファッションもそうだ。
>> 異世界転生モノとしてファッションの絵を描く場合、ドレスや装飾の名前をプロンプトに入力出来るだろうか? << そんな必要なときちょっと調べれば分かることを教養だとか...