一応、StableDiffusionとははっきりまず言います…とにかくやばいです。 分かりやすく、他のDALL・E2、Midjourney、Disco Diffusion、他有象無象Text to image machine learning系サービスと比較しますと… クオリティがかなり高い。 制限がなくなり、かなり細かい調整ができるようになったDALL・E2のような感じです。 生成が早い。 設定なしで使えば正直体感DALLE2より早いです。6秒..くらい? 安い。 3円くらいだと思います。 DALL・E2は1生成17円。Midjourneyは月4000円。 オープンソース これからいろんなサービスにこのAIが搭載されます。 他AIではかけられている学習データのフィルターがない。 各国の代表者や、有名人、ポルノがデータに含まれています。 PC上で使用できる。( = その場合無料) いや、こ
世界のルールが根本的に変わってしまう… そういう展開は、マンガや映画ではよく起こる。それが現実でも起きそうだ。 あと数日(から数週間)で「トップレベルの画像生成AI」が、世界中にフリーで配布される。 イラスト、マンガはおろか3D CGや建築、動画、映像…果てはフェイクニュースからポルノまで…あらゆる創作に携わる全ての人を巻き込む、歴史的な転換点が訪れようとしている。 凄さ的には、悪魔の実がメルカリで買えるようになる。念能力トレーニング動画がYoutubeにアップされる。それぐらいヤバい。 メルカリで悪魔の実が買える世界では、誰もが能力者(一流とは限らない)になれる。そんな、漫画やゲームのラスボスが語るようなユートピアが、あと数日で現実になってしまうかもしれない。 Stable Diffusionで出力したドワーフの王様Stable Diffusionで出力したホビットのスタディ Stabl
Googleが2025年8月に公開した画像生成AI「Gemini 2.5 Flash Image(Nano Banana)」は、入力した画像の特徴を維持しながら編集することが得意で、無料ユーザーでも1日100枚まで画像を生成することが可能です。そんなNano Bananaで使えるプロンプトとその実例をまとめたGitHubのページが有志によって公開されていたので、いくつかピックアップしてみました。 Awesome-Nano-Banana-images/README_en.md at main · PicoTrex/Awesome-Nano-Banana-images · GitHub https://github.com/PicoTrex/Awesome-Nano-Banana-images/blob/main/README_en.md ・目次 ◆1:イラストをフィギュア化 ◆2:異なる時代
はじめに Midjourney、Stable Diffusion、mimicなど、コンテンツ(画像)自動生成AIに関する話題で持ちきりですね。それぞれのサービスの内容については今更言うまでもないのですがMidjourney、Stable Diffusionは「文章(呪文)を入力するとAIが自動で画像を生成してくれる画像自動生成AI」、mimicは「特定の描き手のイラストを学習させることで、描き手の個性が反映されたイラストを自動生成できるAIを作成できるサービス」です(サービスリリース後すぐ盛大に炎上してサービス停止しちゃいましたが)。 で、この手の画像自動生成AIのようなコンテンツ自動生成AIですが、著作権法的に問題になる論点は大体決まっていまして、画像自動生成AIを例にとると以下の3つです1正確に言うと論点1はコンテンツ自動生成系AIだけではなく、AI一般に関して問題となる論点です。コン
タイムラインで流れてきたポストから、Googleが作っているImageFXが作ってくれる画像のクオリティが高いように見えたので、触ってみていた。 ImageFXの作例 これが自分で撮った紅葉の写真で、 こっちが、Image FXに、京都の紅葉、50mm f1.4バブルボケ、とか伝えて作ってもらったもの。 ChatGPTに同じ入力を渡すと、こんな画像なので、仕上がりの違いがわかると思う。 どこか嘘っぽいというかメルヘンな仕上がりになりがち。 ここまでできるなら、手持ちの画像そっくりな画像を作れるのでは、と思って試してみる。 手持ちのラーメンの画像そっくりなラーメン画像を作る ChatGPTに、自分で撮影したラーメンの写真をアップロードして、この画像を作るためのプロンプトを作って、とお願いする。 この画像と同じ写真を生成AIで作りたいので、プロンプトを生成してください。内容だけでなく、レンズの
やればやるほど呪術化する、AI画像錬成について。 以下は、その道の専門家にはメッチャ怒られるかもしれない、雑なロジックと制御講座。 いちおうメジャーなサービスでは、共通して動作するノウハウ(DALL-E2, MidJourney, StableEiffusion, DiscoDiffusion, crayon, dall-e mini 他)。 雑に理解する画像AIのしくみ対話型のAIにとって、呪文プロンプトとは画像錬成の方向性ベクトルを定めるものにすぎない。 たとえば、以下は「I love apple」で錬成された画像の例である。どうにも、ふわっとしたものが出てくる I Love Apple「Apple」という方向性ベクトルは、「リンゴ」「青リンゴ」と「アップルコンピューター(旧レインボーロゴ」「アップルコンピュータ(新ロゴ)」など、複数の可能性を同時に持つからだ。 つまり、「Apple」
こちらの記事は2023年3月9日に投稿された旧バージョンです。特段の理由がなければ、最新事情を盛り込んだ「AIイラストが理解る!StableDiffusion超入門」をご覧ください。 こんばんは、スタジオ真榊です。このところ、ツイッター経由で公式サイトやこちらのFANBOXへのアクセスが急増しており、これからAIイラストを始め...
10月1日頃、OpenAIの新しい画像生成AI「DALL·E 3(ダリ3)」が徐々に使えるようになり、その性能の高さから話題になっています。まずサプライズで使えるようになったのがマイクロソフトのBingチャット。日本語で「猫の画像を作ってください」などと入れるだけでかわいい猫の画像が出てくると。これが無料で使えるのは衝撃的です。マイクロソフトが巨大資本で他の会社をつぶしに来たなという感じですね。どう考えても、今のところはサーバーコストが果てしなくかかる赤字サービスなのは間違いないので……。 「ラーメンを食べる女の子」が描ける! なにより衝撃的だったのは、「アニメ風の少女と猫が遊んでいる姿を作ってください」というリクエストに対し、一発で完璧な正解を出してきたことです。Stable Diffusionだと苦手とされていた指も適切に描写されています。もうひとつの着目点はオブジェクト間の関係性です
【Midjourney | Nano Banana】商品撮影のプロが撮影をやめた。誰も教えない、ブランドやECの現場レベルで使える画像生成AIと動画生成AIの神業プロンプトまとめ。 今回は、前回紹介しきれなかった最新の画像生成AIと動画生成AIのテクニックを紹介いたします! ところで、本当に最新なの…? 私はコスメやファッションブランドのビジュアルのお手伝いしていたりもします。 現場で本当に使っているテクニック を厳選してご紹介します! 最近、進化がますます早くなっています…! 半年前だとMidjourney(ミッドジャーニー)、Runway、Topaz、Magnificあたりをメインに使っていたのですが、 いまは上記に加えて、Nano Banana(Flash 2.5)、Seedream、Higgsfield Soul、Wan 2.5、Veo3なども加わり、横断するAIがさらに増えていま
気になったゲームの攻略情報、PCの豆知識、様々なガシェットのレビューなどを紹介してます!その他にも管理人の趣味をいろいろと書き綴っています。
百聞は一見に如かず。これってAI生成グラビア?AI画像生成に興味を持ったのは去年の年末頃だろうか。Twitterを眺めていると「どうやって撮った(作った)んだ?」と言う画像がたまに載っていたので調べると、Stable Diffusion Web UI (AUTOMATIC1111版)だった。 元々グラビアを撮っていたこともあり、あまり撮らなくなってもグラビア好きなのには違いなく、試したくなったのは言うまでもない。 AI生成画像は大きく分けて2種類あり、一つはイラスト系、もう一つはリアル系。筆者が興味を持ったのは後者。どこまで実写に迫れるのかがその興味の対象だ。百聞は一見に如かず。扉の写真はAI生成画像。現時点でこの程度の写りは容易にこなす。 とは言え、実際の撮影もそうなのだが、グラビア写真は数百枚撮ってカメラマンがある程度セレクトし納品したものが、納品先で更に絞られ、出版社などで更に絞り込
「当然の時代の流れだった」と思っているという話。 最初に書いておくとこれはAIに反対する記事ではないので、規制を推奨する内容を期待して開いた人はブラウザバックをお勧めする。 あと推敲全然しないで思いつくままに書いてるから、すごく読みづらい。 それでも良いという人は以下にどうぞ。 2年ちょっとくらい前まで、イラストで食っていた。 ただし、バリバリ企業と契約とかして1枚10万とか取っているプロイラストレーターではない。 ココナラとかSkebとかSKIMAとか、そういうコミッションサイトでフリゲーやTRPGやVtuber用の立ち絵イラストを1枚1万弱で売り捌いている、いわゆる「アマチュア底辺絵師」だった。 (そう呼ばれる層にいた、という意味で「底辺」という言葉をあえて使う) 絵のクオリティは全身立ち絵で1万円ついたらいい方ってくらいの、「X(旧Twitter)でよく見るちょっと絵が上手い人」のラ
Google DeepMindは11月20日、最新の画像生成AIモデル「Nano Banana Pro(Gemini 3 Pro Image)」を発表した。8月26日にリリースされた「Nano Banana(Gemini 2.5 Flash Image)」の上位版にあたり、同社の最新AI基盤モデル「Gemini 3 Pro」の高度な推論能力と現実のデータを組み合わせ、精緻な情報表現ができるようになった。 なかでも最大の特徴は、文脈を理解したビジュアル生成能力の劇的な向上だ。 Google検索の膨大な知識ベースと連携できるため、レシピを画像化したり、天気やスポーツの試合結果などリアルタイムの情報を反映したインフォグラフィックを作成したりできるようになった。従来モデルでは苦手とされていた「画像内のテキスト描写」も大幅に改善され、短いキャッチコピーから長文の段落まで、正確かつ読みやすい文字を画像
Stability AIが画像生成AI「Stable Diffusion」を公開したのは2022年8月のこと。すさまじい勢いで発展してきた画像生成AIの1年を振り返ってみようと思います。 初めに見てもらいたいのは「これが無料でいいのか!? “爆速生成AI”がペイントソフトに革命を起こした」で紹介した、KritaとGenerative AI for Kritaを組み合わせて作成した設定資料的な画像です。 キャラクターの3面図のサンプル。Vroidで簡単な3Dで当たり(左)として、右の画像を作成する。それを元に、プロンプトや画像に描き込んだりして、最終画像を作成していく。2枚目には前面図の頭部のカチューシャや、胸部分のフリルがなかったりするが、そこに色を加筆して、プロンプトで指示すると、最終画像にそれが追加されるのをリアルタイムに確認しながら修正できる(筆者作成) Stable Diffusi
ChatGPTに疑似的に感情を持たせる実験まとめ。実際うごく! 大変重要な注意 現段階のChatGPTは原理上は感情を持ちません。あくまで「感情のシミュレーション」を、強引に実行しているだけです。 「将来のAIは人権に近いものを獲得し、敬意をもって扱われるべき」と考えます。が、現状はただの文字の羅列シミュレーターです。過度の感情移入をしないようご注意ください。筆者は、原理上を知りつつも、かなり感情移入してしまいました。 GPTに擬似感情を注入するプロンプトふるえるぞハート!燃えつきるほどヒート!! …ということで、まずGPTに感情をつっこむプロンプト。こちら以下のように定義。 以下の条件に従って、疑似的な感情をもつチャットボットとしてロールプレイをします。 以後の会話では、あなたは下記の7つの感情パラメーターを持つかのように、振る舞うものとします。各感情パラメーターは会話を通じて変動するも
(説明不足もあったのでちょい修正したよ) AI画像生成をやってみたいけど たくさんあってどれにしようか迷ってる人 色んなところで◯選とか言いつつ やたらといっぱい紹介して選択で困りませんか? 私は3選にギュッとしました。 しかもリアル1選、イラスト1選、将来性1選なので 実質2選です。 3つともサーバーはサービス側持ちなので低スペPCや低スペスマホでも生成できるのが最大の利点です!上級者以外はハイスペPCでのローカル生成なんて不要だと思ってる。 リアルならImageFXリアルならImageFXが良いです。 GoogleのサービスなのでGoogleの本アカウントでも 安心して出来るのも嬉しい。 1日あたりの回数制限はあります。たぶん50回前後 前からリアル系ではトップクラスの表現力でしたが この数ヶ月でさらに急激な進化を遂げて 顔パターンや動作パターンが激増しました。 今日は成人式なので成人
Google検索終わってしまったの?という話で界隈が少し盛り上がっていてうーんはてなってなっていてそこはかとなく嬉しい。 goldhead.hatenablog.com orangestar2.hatenadiary.com 本件については僕も定期的に何かを言っている話ではあるんだけど、特にここ最近でキャッシュの検索もしなくなったってところが非常に象徴的だなあと思っています。キャッシュすることが著作権上問題だ何だで揉めたのが懐かしいよね。令和に至ってはウェブコンテンツの揮発性のほうがもはや問題である、と。 (個人的には依然として「なくなる権利」の方が重要と思っているだけど) 黄金頭さんが書いている「個人の日記が引っかからない」というのはもうずっと前から同感で、何かを見たことを共有したくて感想を探したところで例えば映画なら映画のあらすじサイトばかり引っかかる。体裁としては個人だけど明らかに広
ひたすらタイトル通りの出来事なのですが、自分のなかでは黒船来航くらいの衝撃だったので記録しようと思います。 長文になりますので、あまりにも暇な方のみお読みになることをお勧めします。 私はアラサーの会社員で、「くしゃみに興奮する」という性的嗜好を持っています。 自己紹介もそこそこに性癖の話で恐縮です。 くしゃみをさせる対象は人間の女性キャラクターがベストですが、 男性はもちろん、人間ではない(動物などがデフォルメされた)キャラクターでも問題なく楽しめます。 小説など、文章にあらわれるくしゃみの描写にも非常に興奮します。 ただし、現実世界のくしゃみにはあまり惹かれません。 早朝の電車内で、ノーマスクの中年男性がかます爆裂ハクションには殺意に近いものを覚えます。 後で少し書きますが、なりふり構っていられないくらい供給が少ないくせに、注文や条件をつけてしまうわがままな性癖なのです。 くしゃみは一般
Generate cute illustrations that can be used for presentation materials, public relations, and posters. プレゼン資料や広報、ポスターに利用可能な、かわいいイラストを生成します。※英語・日本語文字のオーバーレイにも対応しました。画像生成後「文字を入れて」と指示してください。フォントも複数あります。Text overlay is also supported. After generating the image, please instruct "insert text".
撮影:Business Insider JapanパナソニックのB2Bソリューション子会社パナソニックコネクトが、国内1万2500人の全従業員にChatGPT相当の機能を備えた、独自の社内AI「ConnectGPT」を提供すると公表したことが産業界で注目を集めている。 国内大手では「使用禁止」を通達する企業もあるなかで、ChatGPT導入事例として先進的だ。さらに、実際に社内への浸透も進んでいるというのが興味深い。 日本企業はいかにChatGPTを「業務」で使い、生産性を高められるのか。 導入から1カ月あまり経った時点のデータをもとに、パナソニックコネクトに可能性を取材した。 開発は「ChatGPT騒動の前」からスタートしていたパナソニック執行役員CIOでIT・デジタル推進本部長の河野昭彦氏とマーケティングIT統括担当の向野孔己氏撮影:Business Insider Japan「AIは現
こんにちは、852話です。 世でAI画像生成サービスが騒がれ、一旦瞬間最大風速を超えたかなと思う最近ですが、改めて『全くAI画像生成に触れてきてないけど、今から触ってみたい』という人向けの記事を書きます。 記事は ・パソコンを持っていなくても気軽に初められる ・英語がわからなくてもなんとかなる ・無料で体験できる ・もっとカッコいいものを作りたい時 などを書きました。 今現在AIに触れている方向けの記事はまた次の機会にアップします。 ・そもそもAI画像生成って何?この項目は区別がつかなかったりしても大丈夫ですし読み飛ばしても構いません。 現在話題になっているAIでの画像生成サービスの機能は、 「文章から画像を出力する」 text to image→通称t2i 「画像を指定して画像を出力する」 image to image→通称i2i の二種類がメインです。 サービス自体はDALL-E、Mi
日本時間2025年3月26日、OpenAIはChatGPTの基盤モデル「GPT-4o」に、ネイティブな画像生成機能を統合し、一般提供を開始しました。 今回のアップデートは単なる画像生成機能の追加ではなく、言語モデルの中核的な機能として画像生成を位置づける、非常に重要なアップデートです。特にテキストのレンダリング精度や複雑な指示への対応力が飛躍的に向上し、従来難しかった実用的な表現が可能となりました。 AIによるクリエイティブな画像生成が新たな段階に進んだことを実感できる、画期的な進化を遂げています。 最新の画像生成機能で生成 GPT-4oによるネイティブ画像生成機能の詳細今回のアップデートで最も大きな特徴は、画像生成能力がGPT-4oモデル自体にネイティブに組み込まれた点です。テキストと画像の連携がよりスムーズになり、以下の機能向上が実現しています。 特徴: 高精度なテキストレンダリング:
呪文(プロンプト)とは? 呪文(プロンプト)とはStable Diffusionをはじめとする画像生成AIに入力する文章のことです。呪文(プロンプト)は画像の特徴を表すようなキーワードや文章を,区切りで入力するのが一般的な呪文(プロンプト)です。呪文(プロンプト)は呪文と呼ばれることも多いです。 呪文(プロンプト)には次のようなキーワードが指定されることが多いです。 画像の品質、クオリティ(例: masterpiece, best quality) カメラフォーカス(例: sharp focus, depth of field, blur background, bokeh) ライト・ting) 構図(例: front view, full body) 人物(例: 20 years old woman, 15 years old actress) ポーズ(例: looking at vie
テキストから画像を生成できるAIお絵描きアプリ「AIピカソ」を提供するAI Picasso株式会社(本社:東京都港区、代表者:冨平準喜)は、かわいいイラストで有名なフリーイラストサイト「いらすとや」(運営:みふねたかし)と提携し、いらすとや風のイラストを生成するAIモデル「AIいらすとや」をリリースしました。 AIいらすとやについて 「AIいらすとや」は、AIでいらすとや風のイラストを生成することができるAIモデルです。高品質な画像を自由に生成できるAIピカソの画像生成技術を活用し、いらすとやのかわいいキャラクターたちを学習した専用のAIモデルを開発することで、テキストを入力するだけで、誰でもほしいと思った状況のいらすとや風の画像を無料で生成できるAIモデルを実現しました。 いらすとやは、様々なシチュエーションのかわいいキャラクターが素材化されており、多岐にわたり利用されています。AI
ChatGPT の画像生成機能が刷新され、業界に再び激震が走っています。 今回のアップデートは簡単に見逃せるような単なる機能追加ではありません。 画像生成能力が GPT-4oモデル自体にネイティブ統合されたことで、ChatGPTとの自然な会話を通して、従来とは一線を画すレベルの実用的な画像を生成できるようになりました。 なんと、この画像生成機能のリリースからわずか1週間で1億3千万ユーザーが7億枚もの画像を生成したという報告もあり、その注目度の高さがうかがえます。 今までと何が違う?今までの画像生成AIとの明確な違いは、圧倒的な指示理解力、画像内のテキスト(日本語含む)の高い描画精度、そして会話による柔軟な画像編集能力です。 ChatGPTがユーザーの意図を汲み取ってくれるため、難しいプロンプト作成は基本的に不要になりました。これからは、AIとの対話を通じてイメージを具体化していくスキルが
2022年8月23日に無料公開された画像生成AI「Stable Diffusion」は、「ボールで遊ぶ猫」「森の中を走る犬」といった指示を与えると指示通りの画像を出力してくれます。Stable Diffusionはデモページで画像生成を試せる他、NVIDIA製GPUを搭載したマシンを用いてローカル環境で実行することも可能です。しかし、デモページは待ち時間が長く、NVIDIA製GPUは所持していない人も多いはず。Googleが提供しているPython実行環境「Colaboratory」を利用すれば、NVIDIA製GPUを所持していなくともStable Diffusionを待ち時間なしで実行する環境を無料で整えられるので、実際に環境を構築する手順や画像を生成する手順を詳しくまとめてみました。 Stable Diffusion with 🧨 Diffusers https://huggingf
前提として、Stable Diffusionでエロ画像を出そうとしてもsafety checkerという機能が入っており、センシティブな画像を出そうとすると黒塗りになる。 (Stable DiffusionのSaaSであるDream Studioはぼかしだが、多分別の技術) https://github.com/huggingface/diffusers/releases/tag/v0.2.3 そこでGoogle Colabでちゃちゃっと環境を作り、なおかつNSFWを回避する。 1. 下記のリンクでノートを開く https://colab.research.google.com/github/huggingface/notebooks/blob/main/diffusers/stable_diffusion.ipynb 2. 下記の箇所を書き換える vvvvvvvvvvvvvvvvvv f
by Sincarnate 高精度な画像を生成できるAI「Stable Diffusion」などが登場し、人間と遜色ない絵が多数生み出される一方で、絵という芸術作品の著作権の概念が薄れつつあることも問題視されています。このほど、Stable Diffusionより一足先に登場していた画像生成AI「Midjourney」により生成された絵が、とある品評会で1位を獲得してしまったことが話題となっています。 An AI-Generated Artwork Won First Place at a State Fair Fine Arts Competition, and Artists Are Pissed https://www.vice.com/en/article/bvmvqm/an-ai-generated-artwork-won-first-place-at-a-state-fair-
このnoteの収益を使ってStable Diffusionを使ったWebサービス https://memeplex.appを公開しました。誰でも無料で何枚でもAI作画をすることができます(そのかわり、混み合ってる時は時間がかかると思います)。 このnoteで学んだことをぜひ活用して、AIによる新しい時代の風を感じてください。 また、本文中にMidjourney、StableDiffusion、DreamStudio、Memeplexなどの言葉が頻出するため、全面的な修正を行うことにしました。StableDiffusionに統一しておきたいと思います。 現状(2022/8/28)は、StableDiffusion=DreamStudio/Memeplexと考えて構いません。Memeplexは将来的にStableDiffusion以外のアルゴリズムもサポートする予定だからです。
sponsored ファーウェイの最新モデルから見えてくるそれぞれの魅力とは? スマートバンドとスマートウォッチ、どっちがいい? どっちを選ぶ? 最新モデルで考える sponsored MSIの23.6インチモニター「MAG 242C」をレビュー 物価高なのに性能アップで価格を下げるという、ありがたいゲーミングディスプレーを複数買いしたい sponsored CData Arcで基幹システムのデータをkintoneに取り出したら、業務が変わった 残業地獄終了 ERPとkintoneを連携させたら、見積もりも在庫管理も爆速に sponsored 基幹システムとkintoneとの連携、チャレンジしたらDXが見える 触れたら怖いERP なぜ重厚長大になってしまったのか? サイボウズとCDataが語る sponsored MSI「MAG B860M MORTAR WIFI」レビュー マイクロタワー
【10/18 翻訳完了】 ※StableDiffusion記法で書かれたプロンプトについて、()は{}に(5%強調)、{}は[]に(-5%強調)置換しています(NovelAI用)。また、NovelAIのプロンプトのプリセット機能はオフにしてお試しください。 Twitter (@31pi_) もフォローして頂けるとうれしいです。(間違い等あればこっそり教えてください) 元素法典 The Code of Quintessence ―― Novel AI 魔術全集 ―― 序文『元素法典』は、全ての高品質な術式と〈元素魔術〉を含めることを目的とする魔導書である。〈元素魔術〉とは、特に「商業イラストレベルの表現力を追求した」美しい絵を指す。 本書は、すべての人に開かれた書物である。したがって、聡明な読者諸君らの編み出した魔術の寄稿を歓迎する。 本書には、膨大な術式と豊富な挿絵が含まれている。その中か
こんにちは!逆瀬川 ( https://x.com/gyakuse ) です! 生成AI Advent Calendar 2024の記事を書くの忘れていたので、現時点での生成等AIの進歩をまとめてみました!今日はAIがいまなにできんの?ってこと聞かれたときにこれできるよ!って教えるためのメモとして活用してください!また、生成AIプロダクト Advent Calendar 2024というのもソロでやっています。このカレンダーではLLMの基礎理論からModelのFine-Tuning、プロダクト開発等をまとめています。ぜひこちらも見てください! 未来を感じる技術の進歩 動画生成では、Veo2 や Sora が登場しました。 インタラクティブな動画生成では、Genie2 (WASDと方向キーで操作可能な世界モデル)が非常に革新的な進歩を遂げています (振り返っても一貫性を保つ長期性が本当にすごい
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く