NanoBanana Proで作成した当連載登場モデルの明日来子さん。2024年1月に1枚の画像から始まった彼女は、ついに自由に服もポーズも登場場所も変えられるようになった(筆者作成) 今回のテーマは、2025年の画像・動画生成AIまとめです。2022年に誰でも利用可能な形で登場した画像AI、動画AIは、ついに長年の課題だった“一貫性の壁”を突破しました。シーンや状況を変えても、登場人物の顔や服装に連続性を保ったまま、表現を変えたり、別の服装にしたり、角度を変えたりといったことが容易にできるようになってきました。8月に発表されたグーグルの「NanoBanana」、それをさらに上回る性能の11月の「NanoBanana Pro」が最大級の驚きでした。画像AIではバイトダンス「Seedream」、アリババ「Qwen-Image-Edit-2509」などが、動画AIではOpenAI「Sor

NanoBanana Proで遊べるプロンプトをXで公開しています。我ながらどれもこれも実用性には欠けるものの、独創性はあるものばかりではないかと思っています。 公開プロンプトの数が増えてきたので、まとめ記事にしました。プロンプトは各紹介記事中のXのポストで公開しています。 ◆フィギュア化+製品紹介レイアウトプロンプトとスカウタープロンプト フィギュア化+製品紹介レイアウトプロンプト 参照画像のキャラクターをフィギュア化し、これの製品紹介風にレイアウトします。メーカーロゴ、部分拡大図、商品ロゴを配置できます。 公開しているプロンプトなので自由に使っていただいて構いませんが、ロゴ指定部と商品名指定部は自分のオリジナルに変えていただきたいです…。「〇〇NEN」とか「〇〇ガールズ」とか、ほぼそのまま使っている人がいます。 【フィギュア化+製品紹介レイアウトプロンプト】は「やってみたらできた」程

老舗文具メーカーのサクラクレパスは12月9日、スペインで開催されたイベント「Manga Barcelona(マンガバルセロナ)」で使用した販促ポスターに参加者の一部から「生成AIで作ったものではないか」と疑問が投げかけられた件で、公式見解を発表した。ポスターの使用を停止し、撤去するという。 生成AIの使用については「当該販促物の制作・発注に関与したグループ会社に対し、現在事実確認を行っている」として結論を避けた。「精査の上で必要な措置を講じる」。 ただし、当該イラストに描かれた製品のロゴマークが自社の表示規定に反するものであったこと、また描かれていた自社製品のデザインが実際とは異なることを確認したため、撤去を決めた。「重く受け止め、事実確認を進める」としており、調査結果や再発防止策を改めて公表する考えだ。Manga Barcelonaは、日本のマンガやアニメ、ゲームなどをテーマにした人気

こんにちは、Google のAI「Gemini(ジェミニ)」の公式note 編集部です。 パワーアップした Gemini の画像生成、すでに使われていますか? NanoBanana Pro 🍌が新登場! Gemini の画像生成が劇的進化:日本語 🇯🇵のテキスト描写、文化理解、細部の表現、スタイル変換など、クリエイティブ表現がかつてないレベルに。 最高性能の画像生成モデルを、Gemini アプリの「思考モード (thinking)」より今すぐ体験 ✨ 無料プランでも 1… pic.twitter.com/Vohjzb8ktt —Google Japan (@googlejapan) November 20, 2025 生成された画像の日本語精度が向上し、複雑な図解の生成を簡単なプロンプトでできるようになったり、4 コマ漫画を作成できたりと、連日SNS や Web メディア

NanoBanana Proで遊べるプロンプトを立て続けに公開してきました。我ながらどれもこれも実用的には欠けるものの、オリジナリティはあるものばかりではないかと思っています。 数日の間にたくさん公開したので、今日は記事をまとめておこうと思います。 【フィギュア化+製品紹介レイアウトプロンプト】と【スカウタープロンプト】 まず、最初のプロンプト公開記事では【フィギュア化+製品紹介レイアウトプロンプト】と【スカウタープロンプト】を公開しました。 フィギュア化+製品紹介レイアウトプロンプト 参照画像のキャラクターをフィギュア化し、これの製品紹介風にレイアウトします。メーカーロゴ、部分拡大図、商品ロゴを配置できます。 ゴミを拾いながら気を溜める。フィギュア公開しているプロンプトなので自由に使っていただいて構いませんが、ロゴ指定部と商品名指定部は自分のオリジナルに変えていただきたいです…。 スカ

11月20日に、グーグルの画像生成AI「NanoBanana Pro」がリリースされました。あまりにも性能が高くて、その上、汎用性も高いために、これまでの常識をまたもひっくり返す存在になりました。SNS上では、画像生成AIの話題はNanoBanana Pro一色になりました。その潜在能力の高さから、毎日のように新しい使い方の発見が続いています。なにより、画像生成AIの大きな壁であった同じキャラクターを出し続けられない「一貫性の問題」を完全に乗り越えたモデルと言えます。そのすごさをご紹介します。 使い捨てカメラの画質を再現 SSSS_CRYPTOMANさんが発見したプロンプトは、NanoBanana Proの潜在能力の高さを示すものでした。プロンプトは「低画質な使い捨てカメラで撮影した1枚の日常写真。日本の高校生が撮影した下手くそな写真。」というものです。これによって、撮影すると、90

高速化省メモリ技術 上記の生成フロー番号で適用箇所を示しどのような高速化や省メモリ化技術が適用されているか解説します。 ノード間キャッシュ 起動オプション 起動オプションの処理はcomfy/cli_args.pyで実装されています。 例えば、--cache-classicオプションをつけた場合、args.cache_classic 変数に対応付けされ、オプションに基づく処理の分岐を行う際にこの変数が活用されます。 ノードの実装 ノードはnodes.pyとcomfy_extras以下で実装されています。 ノード間の処理 ワークフローの実行はexecution.py で実装されています。ノード単位で処理が行われ、ノードの実行結果をキャッシュするようになっています。 同じワークフローを 2 回目以降実行する際に、変更されていないノードの実行結果がキャッシュに存在するならそのノードを実行することを

ヤングジャンプ新人漫画大賞 @yj_comicaward 大賞賞金100万円+連載権!月間ベストはボイコミ化!毎月末日締め!週刊 #ヤングジャンプ の「#ヤングジャンプ新人漫画大賞 」🏆💪漫画家志望の方、漫画好きの方に嬉しい情報を随時発信中! [毎週、歴代受賞作や特集記事、質問箱を公開!🔥]編集部公式X▶︎@young_jump youngjump.jp/comic_award/ ヤングジャンプ新人漫画大賞 @yj_comicaward 佳作+月間ベスト賞+初投稿 🎉計43万円獲得🎉 『御国の羽々斬様』 森永侮瑠戊ン 非常に画力が高くサービス精神もあり、アクションにお色気と読者を飽きさせない努力を節々から感じます。一方で、キャラクター設定やストーリー、構成面では改善の余地が多くあり、特に状況設定が複雑すぎる上に説明が不明瞭なためすんなり読めない点はもったいないと感じました。 作品

2014年から先端テクノロジーの研究を論文単位で記事にして紹介しているWebメディアのSeamless(シームレス)を運営し、執筆しています。 1週間の気になる生成AI技術・研究をいくつかピックアップして解説する連載「生成AIウィークリー」から、特に興味深いAI技術や研究にスポットライトを当てる生成AIクローズアップ。 今回は、Googleが発表した画像生成および編集モデル「NanoBanana Pro」(Gemini 3.0 Pro Image)を取り上げます。 度肝を抜くような生成結果が出力されるAIモデルが登場すると、界隈の人たちがこぞって試し、Xで成果物を共有する現象が起きます。以前にも、OpenAI「o3-mini-high」が登場した時には、軽量で低料金、コード生成が強いという理由で、プロンプトから一発出しでゲームを生成する共有祭りが始まりました。 関連記事:OpenAI「o

こんにちは、けいすけです。AI画像生成の世界で大きなアップデートがありました。 NanoBanana Pro(ナノバナナプロ)です。 ぼくは普段からAI漫画制作に画像生成AIを使っているので、さっそく試してみました。 今日はその第一印象をまとめます。 NanoBanana Proって何?NanoBanana Proは、Gemini 3の公開に合わせて登場した画像生成AIです。 正式には「Gemini 3.0 Pro Image」というモデルみたいです。 従来のNanoBanana(Gemini 2.5 Image)とは明確に違う手応えがありました。 ぼくは漫画制作でずっとNanoBananaを使ってきたので、この進化はほんとに嬉しいです。 何が改善されたのか日本語フォントがほぼ破綻しないこれが一番の改善点です。 従来は日本語の文字が崩れて、編集ソフトで打ち直す必要がありました。

11月17日にxAIが新基盤モデル「Grok 4.1」をリリースしましたが、今回は、同社の画像生成AI「Grok Imagine」の話題です。10月に「Sora 2」リリースと同時くらいのタイミングでv0.9がリリースし、動画生成の性能が大幅に引き上がっていると話題を呼びました。その後もすごいペースでアップデートをかけていて、使い勝手がどんどん改善されるなど、内部的にかなり変わってきています。静止画も動画も作成がすごくラクなのが特徴で、評価が高まっていますね。これまで手軽に動画を生成するサービスといえば「Midjourney」の独壇場でしたが、それよりさらにラクになっています。クレジットの制限もゆるく、Xのプレミアムプラン(月額918円)に入っていれば1日20〜30本程度の動画を生成できる価格の安さも魅力です。一部機能はXでも利用できますが、この記事は、Grokのサイトやスマホアプリででき

NanoBananことgemini-2.5-flash-imageの新モデル、gemini-3-pro-image-preview、通称NanoBanana Proがリリースされました。Xでは、これを利用した作例投稿やプロンプト共有がとても盛り上がっていますね。 GeminiでNanoBanana Proを使用する場合、無料版(Google Workspace Starter含む)と有料版(GoogleAI Pro以上・Google Workspace Standard以上)では、1日当たりの生成上限回数が異なります。 無料版:3回 有料版:100回※画像生成に限らず「思考モデル」での利用回数と合算とのこと。例えば、画像生成以外で50回質問と回答を行った場合、画像生成は残り50回になるようです。 わたしもいくつかプロンプトを作成し、共有しています。せっかくなので、noteでも共有

NanoBanana Proがしゅごいという記事を拝見して、Adobe CCを契約しているので試してみました。 ASCII.jp:凄すぎてもはや意味不明!画像生成AIの到達点「NanoBanana Pro」ついに公開 参照画像にいつもSNSで使用しているアイコンを設定。 これをもとにプロンプトにイメージをちょろっと日本語で記載して、生成。 しゅ、しゅごい… よく見たら変なケーブルとか「おにぐく」とかのポテチや謎の本ぽいのありますけど、トンマナ合わせて一瞬でここまで作ってくれました。 案としては十分すぎるほどのクオリティだし、細部を気にしない人であればそのまま使用できるんじゃないでしょうか。 ところで、アイコンに描いてあるコントローラーはPS4のものです。AI絵の左側にあるゲーム機、ちゃんとPS4っぽいのです。 もしやAI、コントローラーで機種まで認識してる…!?と思ったら怖くなりまし

Google DeepMindは11月20日、最新の画像生成AIモデル「NanoBanana Pro(Gemini 3 Pro Image)」を発表した。8月26日にリリースされた「NanoBanana(Gemini 2.5 Flash Image)」の上位版にあたり、同社の最新AI基盤モデル「Gemini 3 Pro」の高度な推論能力と現実のデータを組み合わせ、精緻な情報表現ができるようになった。 なかでも最大の特徴は、文脈を理解したビジュアル生成能力の劇的な向上だ。Google検索の膨大な知識ベースと連携できるため、レシピを画像化したり、天気やスポーツの試合結果などリアルタイムの情報を反映したインフォグラフィックを作成したりできるようになった。従来モデルでは苦手とされていた「画像内のテキスト描写」も大幅に改善され、短いキャッチコピーから長文の段落まで、正確かつ読みやすい文字を画像

【Midjourney | NanoBanana】商品撮影のプロが撮影をやめた。誰も教えない、ブランドやECの現場レベルで使える画像生成AIと動画生成AIの神業プロンプトまとめ。 今回は、前回紹介しきれなかった最新の画像生成AIと動画生成AIのテクニックを紹介いたします! ところで、本当に最新なの…? 私はコスメやファッションブランドのビジュアルのお手伝いしていたりもします。 現場で本当に使っているテクニック を厳選してご紹介します! 最近、進化がますます早くなっています…! 半年前だとMidjourney(ミッドジャーニー)、Runway、Topaz、Magnificあたりをメインに使っていたのですが、 いまは上記に加えて、NanoBanana(Flash 2.5)、Seedream、Higgsfield Soul、Wan 2.5、Veo3なども加わり、横断するAIがさらに増えていま

2022年8月、StabilityAIがテキストから画像を生成するAIモデル「Stable Diffusion 1.0」を公開。これまでテキスト中心だったAI分野に大きな衝撃を与えた。高性能なサーバーを使わずとも、個人のPC上で高品質な画像を生成できるという事実は、多くのクリエイターに強いインパクトを残した。 ただし当時は、要求されるマシンスペックが高く、環境構築にも技術的な知識が必要だった。そのため「面白そうだが難しそう」と感じて、実際に導入するまでには至らなかった人も少なくない。 しかし、その状況は次第に改善していく。2023年7月にStabilityAIが公開した「Stable Diffusion XL(SDXL)1.0」によって、1024×1024ドットの高解像度画像生成が実現。12GBのVRAMを搭載したGPU(RTX 4070クラスなど)があれば、安定して実用的に利用できる

中国の大手テクノロジー企業であるテンセントが生成AIモデル「Hunyuan World 1.1(HunyuanWorld-Mirror)」を公開しました。HunyuanWorld-Mirrorは画像を元に深度を再現した3D空間を生成することが可能。さらに、単一の画像だけでなく複数のアングルからの画像や動画の入力にも対応しています。 腾讯混元3D https://3d-models.hunyuan.tencent.com/world/ HunyuanWorld-Mirrorの生成例が以下。1枚の画像をもとにグリグリ動かせる3D空間を生成可能です。 生成された3D空間を横から見るとこんな感じ。トンネルの奥行きが再現されています。 実写風の画像だけでなく、アニメやイラスト風の画像にも対応しています。 ただし、画像に含まれる情報をもとに3D空間を構築しているだけなので、画像に含まれていない部分を補

芸能人の画像をもとに、生成AIを使って「性的ディープフェイク」と呼ばれるわいせつな画像を作成し、インターネット上で閲覧で…

Safetensors とは Safetensors は HuggingFace が開発している、主にテンソルを安全・高速に読み書きできるファイルフォーマットと、それを扱うためのライブラリです。 提供されているPython ライブラリでは、PyTorch や Tensorflow などとの互換性があるほか、pickle 形式のような任意のコードを実行する機能がなく比較的安全なため、最近の深層学習系のモデルはこの形式で配布されることが多くなりました。 構造 Safetensorsのファイル構造の説明 [1] Safetensors はシンプルな構造をしています。大きく分けて ヘッダーサイズ領域 (8 bytes)、ヘッダー領域 (N bytes)、バッファ領域 (残りの部分) に分かれています (それぞれの領域の公式名称が不明なので、この記事では勝手に呼びやすい名前で呼んでいます)。ヘッダ

リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く