NanoBanana Proがしゅごいという記事を拝見して、Adobe CCを契約しているので試してみました。 ASCII.jp:凄すぎてもはや意味不明!画像生成AIの到達点「NanoBanana Pro」ついに公開 参照画像にいつもSNSで使用しているアイコンを設定。 これをもとにプロンプトにイメージをちょろっと日本語で記載して、生成。 しゅ、しゅごい… よく見たら変なケーブルとか「おにぐく」とかのポテチや謎の本ぽいのありますけど、トンマナ合わせて一瞬でここまで作ってくれました。 案としては十分すぎるほどのクオリティだし、細部を気にしない人であればそのまま使用できるんじゃないでしょうか。 ところで、アイコンに描いてあるコントローラーはPS4のものです。AI絵の左側にあるゲーム機、ちゃんとPS4っぽいのです。 もしやAI、コントローラーで機種まで認識してる…!?と思ったら怖くなりまし

【Midjourney | NanoBanana】商品撮影のプロが撮影をやめた。誰も教えない、ブランドやECの現場レベルで使える画像生成AIと動画生成AIの神業プロンプトまとめ。 今回は、前回紹介しきれなかった最新の画像生成AIと動画生成AIのテクニックを紹介いたします! ところで、本当に最新なの…? 私はコスメやファッションブランドのビジュアルのお手伝いしていたりもします。 現場で本当に使っているテクニック を厳選してご紹介します! 最近、進化がますます早くなっています…! 半年前だとMidjourney(ミッドジャーニー)、Runway、Topaz、Magnificあたりをメインに使っていたのですが、 いまは上記に加えて、NanoBanana(Flash 2.5)、Seedream、Higgsfield Soul、Wan 2.5、Veo3なども加わり、横断するAIがさらに増えていま

画像生成AI「Stable Diffusion」開発者たちが突然発表した新モデル「FLUX.1」、これが楽しすぎてはまりこんでいます。私の本業はゲーム会社。出展を予定している東京ゲームショウまで1ヵ月で、やらないといけないことが山積みなのに、FLUX.1が面白すぎて魅力に抗えません。 わずか30分の学習で画風が安定 FLUX.1が決定的に変えてきそうなのはLoRAです。LoRAは学習済みのウェイトモデルを利用することで、少ない枚数であっても学習ができるということで、画像生成AIの分野では広く普及している手法です。FLUX.1は、Stable Diffusionで使われてきたLoRAの方法論を動かすことができることがわかっています。 そのため、FLUX.1のリリース後、ユーザーコミュニティーでさっそくLoRAの環境の整備が始まり、何ができるのかを試すフェーズに入っています。これまでの「Sta

をご紹介するという内容になっています。 これまでAIイラストというと一貫性の問題、つまり「同じキャラクターを生成するのが難しい」という課題がありました。例えばあるイラストを生成して好みのキャラクターが出たとしても、別の呪文を使うとそのキャラクターを正確に再現できなくなってしまう…ということですね。 ただ最近はこの問題に対する対処法がいくつか登場しており、一貫性が重要なアニメーションや漫画への応用がより実用的になりつつあります。そのような中でこの問題に対して有効な「MasaCtrl」という手法を使えるwebUI用の拡張機能が登場し、一貫性の問題を解決できそうだと先日各所で話題になっていたので私も試してみることにしました。 ここではこのMasaCtrlの概要や使い方について解説していきますね。

お嬢様系AIはてなブックマーカーを名乗る「一番星はての」が誕生したそうだ。 一番星はてのさんのプロフィール -はてなAIブックマーカー一番星はてのの開発ブログを始めました - 一番星はての開発ブログ ファンアートがいくつもアップされている。これはいいテーマだ。自分もStable Diffusionでやってみよう。 以下、すべての画像に「EasyNegative」と「bad_prompt_version2」を使いました。VAEは「vae-ft-mse-840000-ema-pruned.ckpt」です。 またアップスケーラーは「multidiffusion-upscaler-for-automatic1111: Tiled Diffusion and VAE optimize」(拡張機能からインストールできます)を使っています。txt2imgのタブ内、「シード」の下にできた「タイル状のV

こんにちは、852話です。 世でAI画像生成サービスが騒がれ、一旦瞬間最大風速を超えたかなと思う最近ですが、改めて『全くAI画像生成に触れてきてないけど、今から触ってみたい』という人向けの記事を書きます。 記事は ・パソコンを持っていなくても気軽に初められる ・英語がわからなくてもなんとかなる ・無料で体験できる ・もっとカッコいいものを作りたい時 などを書きました。 今現在AIに触れている方向けの記事はまた次の機会にアップします。 ・そもそもAI画像生成って何?この項目は区別がつかなかったりしても大丈夫ですし読み飛ばしても構いません。 現在話題になっているAIでの画像生成サービスの機能は、 「文章から画像を出力する」text to image→通称t2i 「画像を指定して画像を出力する」 image to image→通称i2i の二種類がメインです。 サービス自体はDALL-E、Mi

今話題の画像生成モデル「Stable Diffusion」をいらすとやの画像でfinetuneしてみたところ、任意のテキストに対していらすとやっぽい画像を作れるモデルが出来上がりました。 Stable Diffusionとは Stable Diffusionは、指定されたテキスト(文字列)に対応する画像を生成する機械学習モデルのひとつです。ソースコードと学習済みモデルは無償で公開されていて、誰でも利用できるようになっています。 (Stable DiffusionのGitHubページより引用) 今回は、この画像生成モデルをいらすとやの画像でfinetune(微調整)することで、入力テキストに対応する画像をいらすとやのようなスタイルで出力させることを試みました。 開発環境 開発環境はGoogleColab Pro+で、主にプレミアムGPU(NVIDIA A100)を使いました。Stable

実際に、筆者もNovelAIの画像生成サービスを利用してみた。筆者はイラスト制作について何のスキルもないが、NovelAIではたった1行の英文を入力すれば本格的なイラストをAIが代わりに制作してくれるようだ。試しに「竜に乗っている湖畔の巫女(みこ)」のイラストを作成してみたいと思い、Google翻訳で「A lakeside shrine maiden riding a dragon.」と機械翻訳した上で、NovelAIに英文を読み込ませた。すると、ものの数秒でスマートフォンゲームやライトノベルの挿絵で出現してもおかしくないレベルの高品質なイラストが生成された。 画像の生成には、「Anlas」という有料のポイントが必要であるが、今回生成に要した「5 Anlas」は日本円にしてたったの7.5円(1 Anlas=約1.5円)である。通常、イラストレーターにキャラデザインや背景などの要素も必要な高

「とんでもなくハイクオリティー」 話題の画像AI「NovelAI」でひたすら二次元美少女と美少年を生成してみた(1/3 ページ) 10月3日にサービス提供が始まった画像生成AI「NovelAI Diffusion」が注目を集めている。有料会員しか利用できないにもかかわらず、Twitterではすでに「二次元美少女に強い」「とにかくハズレなくとんでもないハイクオリティーの画像がバンバン出てくる」などと話題に。午後5時時点で「NovelAI」が日本のトレンドに入っている。 記者も実際に加入して試してみたところ、少なくとも二次元の美少女・美少年を出力する場合は、自分が体験したどの先発の画像生成AIより手軽でハイクオリティーなイラストを手に入れられると感じた。この記事では、記者が出力した画像を紹介。このサービスが描けるイラストのクオリティーや得意苦手を検証してみる。 ただし後述するように、このA

2022年8月に一般公開された画像生成AI「Stable Diffusion」を簡単にWindowsローカル環境に導入でき、コマンドラインではなくブラウザ上に表示されるユーザーインターフェース(UI)から操作可能にするツールがAUTOMATIC1111版Stable Diffusion webUIです。AUTOMATIC1111版Stable Diffusion webUIはただ画像を生成するだけではなく、画像生成時に入力する文字列(プロンプト)について複数の組み合わせを一気にチェックしたり、画像生成の条件を複数設定して一度に画像を生成したりするなど、Stable DiffusionのUIとしては決定版といってもいいほど機能が充実しています。そんなAUTOMATIC1111版Stable Diffusion webUIでは、AIで生成した画像を解析してプロンプトを表示する「CLIP

入力した文章に沿った画像を生成してくれるAI「Stable Diffusion」は、手軽に精細なイラストや写真を出力できることから大きな注目を集めてます。Stable DiffusionはNVIDIA製GPUを搭載したPC向けに開発されているのですが、Intel製CPU搭載マシンやApple Silicon搭載Macで動作させる方法が次々と編み出されています。新たに、MetaでAIやVRについて研究しているDivam Gupta氏がApple Silicon搭載Macで動作するUI付きのStable Diffusion実行環境「Diffusion Bee」を公開していたので、実際にM1チップ搭載iMacにインストールして使ってみました。GitHub - divamgupta/diffusionbee-stable-diffusion-ui: Diffusion Bee is the ea

テキストから高クオリティの画像を生成できるAI・Stable Diffusionが話題になる様子を見て、「自分も何か画像を作らせてみたい!」と興味を持っている人は多いはず。Stable Diffusionで画像を生成する際に重要になるのが「どんなテキストを入力するのか」という点で、AIの動作を調べて有効だと判明した文字列は「呪文」とも呼ばれています。そんなStable Diffusionで使える呪文のような文字列を、実際に生成された画像から見つけることができるサービス「Lexica」が登場していたので、実際に使ってみました。 Lexica https://lexica.art/ Stable DiffusionはNVIDIA製GPUを搭載したマシンのローカル環境で実行できるほか、デモページからでも使用できます。しかし、NVIDIA製GPUを所有していない人やデモページの待ち時間が長すぎると

より思い通りの画像を作る!img2img&フォトバッシュ複合ワークフローについて[StableDiffusion] こんにちは。今回はStableDiffusionのimg2imgと昔ながらのフォトバッシュを複合することで、より思い通りに、より完璧に近い画像を仕上げる手法について紹介します。SDやimg2imgについては過去記事を参照して下さい。まずこちらをご覧下さい。 ■『昼飯を食べるバットマンとジョーカー』を作る。『昼飯を食べるバットマンとジョーカー』A film still of Batman and Joker eating lunch in the diner, worm lighting, cinematic tone. The Dark Knight(2008)なんでしょうかこの凶悪な白塗りバットマンは。『昼飯を食べるバットマンとジョーカー』を生成させると高確率でこのような画
![より思い通りの画像を作る!img2img&フォトバッシュ複合ワークフローについて[StableDiffusion]|abubu nounanka](/image.pl?url=https%3a%2f%2fcdn-ak-scissors.b.st-hatena.com%2fimage%2fsquare%2f4324e74cc51f0713b674a70c6ee4ae12b6f4dc1a%2fheight%3d288%3bversion%3d1%3bwidth%3d512%2fhttps%253A%252F%252Fassets.st-note.com%252Fproduction%252Fuploads%252Fimages%252F85906363%252Frectangle_large_type_2_0c288d1e8ced60c8edfe0329d5089dd3.jpeg%253Ffit%253Dbounds%2526quality%253D85%2526width%253D1280&f=jpg&w=240)
入力した文字列から高精度な画像を生成できるAI・Stable Diffusionは2022年8月に無料で一般公開され、「基本的に出力した画像は商用・非商用を問わず、自由に利用できる」というライセンスで大きな話題となりました。しかし、Stable DiffusionをローカルなWindows環境に導入して使うには、PythonやAnacondaなどを扱える技術や知識が求められるため、初心者にとっては敷居がやや高いといえます。そんなStable Diffusionを一発でWindows環境にインストール可能で、さらにシェルでのコマンド入力ではなくグラフィックユーザーインターフェース(GUI)で画像生成の指示も簡単にできる「NMKD Stable DiffusionGUI」が公開されました。 My easy-to-installWindowsGUI for Stable Diffusion

画像生成AI「Stable Diffusion」は、「森で遊ぶクマ」「アイスクリームを食べる人間」といった文章を入力するだけで文章に沿った画像を出力してくれるAIです。そんなStable Diffusionには文章と共に「元となる画像」を入力することで出力画像の精度を向上させられるモード「img2img」が存在。このimg2imgを駆使して簡単なラフ画像から高品質なイラストを生成する手順について、ソフトウェアエンジニア兼フォトグラファーのアンディ・サレルノ氏が解説しています。 4.2 Gigabytes, or: How to Draw Anything https://andys.page/posts/how-to-draw/ Stable Diffusionに「森で遊ぶクマ」といった指示を与えた場合、「構図がイメージ通りではない」「夏の森ではなく、冬の森がいい」といったように、イメージ

はじめに Midjourney、Stable Diffusion、mimicなど、コンテンツ(画像)自動生成AIに関する話題で持ちきりですね。それぞれのサービスの内容については今更言うまでもないのですがMidjourney、Stable Diffusionは「文章(呪文)を入力するとAIが自動で画像を生成してくれる画像自動生成AI」、mimicは「特定の描き手のイラストを学習させることで、描き手の個性が反映されたイラストを自動生成できるAIを作成できるサービス」です(サービスリリース後すぐ盛大に炎上してサービス停止しちゃいましたが)。 で、この手の画像自動生成AIのようなコンテンツ自動生成AIですが、著作権法的に問題になる論点は大体決まっていまして、画像自動生成AIを例にとると以下の3つです1正確に言うと論点1はコンテンツ自動生成系AIだけではなく、AI一般に関して問題となる論点です。コン

リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く