Google DeepMindは11月20日、最新の画像生成AIモデル「NanoBanana Pro(Gemini 3 Pro Image)」を発表した。8月26日にリリースされた「NanoBanana(Gemini 2.5 Flash Image)」の上位版にあたり、同社の最新AI基盤モデル「Gemini 3 Pro」の高度な推論能力と現実のデータを組み合わせ、精緻な情報表現ができるようになった。 なかでも最大の特徴は、文脈を理解したビジュアル生成能力の劇的な向上だ。Google検索の膨大な知識ベースと連携できるため、レシピを画像化したり、天気やスポーツの試合結果などリアルタイムの情報を反映したインフォグラフィックを作成したりできるようになった。従来モデルでは苦手とされていた「画像内のテキスト描写」も大幅に改善され、短いキャッチコピーから長文の段落まで、正確かつ読みやすい文字を画像

アニメイト系フロンティアワークスとKaKaCreationが共同で制作するTVアニメ『ツインズひなひま』が、2025年3月29日深夜3時38分よりMBSで放送開始されることが決定した。平塚紗依と伊駒ゆりえが主人公姉妹を演じる。 【画像】AIがサポートする新作アニメはどんな作風?最新映像カットなど(映像リンクあり) 双子の女子高生がSNSでバズる過程で異世界に迷い込む物語が描かれる本作は他作品とは異なる点として「生成AI」を映像制作でフル活用している点があり、公式は「全編にわたりAI技術を活用した日本初の地上波テレビアニメ」と銘打つ。 あくまで創作活動の補助ツールと説明、放送前の評価はプロジェクトでは「サポーティブAI」の概念を基盤に、AIをクリエイターの補助ツールとして活用しつつ、最終品質は人間のスタッフが担保する手法を採用した。制作陣には『ラブライブ!』シリーズの横田拓己やAI技術の専

動画生成AIの発展により、非常に面白い方向性が生まれてきています。最新の動画生成技術と3D技術を組み合わせることで、たった1枚の絵から、3Dデータを作れるようになる可能性が出てきているんですね。これは将来のゲーム開発や映像制作のあり方を激変させる可能性があります。 ※記事配信先の設定によっては図版や動画等が正しく表示されないことがあります。その場合はASCII.jpをご覧ください 動画生成AI「Runway」新機能がきっかけ まず、この動画を見てください。Stable Diffusionを使って作成した1枚の画像を、いくつかの手順を実施することで、3Dモデルとして扱えることに成功している様子です。 こうしたことが実現できるようになったのは、動画生成AIサービス「Runway」に11月2日に追加された新機能「カメラコントロール機能(Advanced Camera Control)」のためです

SoraCreating video fromtext Sora is anAI model that cancreate realistic and imaginative scenes fromtext instructions. Readtechnicalreport We’re teachingAI to understand andsimulate the physical world in motion, with thegoal of training models that help people solve problems that require real-world interaction. Introducing Sora, ourtext-to-video model. Sora can generate videos up to a mi

Midjourneyの生成画像。12月のアップデートのv6では、写真と変わらないような画像が生成されることが話題となっている。この画像のような世界を動き回れるようになるのだろうか(筆者作成)画像生成AIサービス「Midjourney」のオフィスアワーがあったのが1月4日。アメリカ時間で1月3日ですかね。オフィスアワーというのは、MidjourneyがDiscord上で月に1回開いて、いろいろユーザー向けに今後どのようにサービスが展開されるのかを説明するミーティングです。その会合に参加していたNick St. Pierreさんの報告によると、Midjourneyのデイヴィッド・ホルツCEOが「2024年末までにホロデッキに到達できる」と話したと言うんですね。「2024 年末までには、リアルタイムのオープンワールドが実現できればと思っています」とも言い、画像生成AIが、単にイラストといった画

StabilityAIが画像生成AI「Stable Diffusion」を公開したのは2022年8月のこと。すさまじい勢いで発展してきた画像生成AIの1年を振り返ってみようと思います。 初めに見てもらいたいのは「これが無料でいいのか!? “爆速生成AI”がペイントソフトに革命を起こした」で紹介した、KritaとGenerativeAI for Kritaを組み合わせて作成した設定資料的な画像です。 キャラクターの3面図のサンプル。Vroidで簡単な3Dで当たり(左)として、右の画像を作成する。それを元に、プロンプトや画像に描き込んだりして、最終画像を作成していく。2枚目には前面図の頭部のカチューシャや、胸部分のフリルがなかったりするが、そこに色を加筆して、プロンプトで指示すると、最終画像にそれが追加されるのをリアルタイムに確認しながら修正できる(筆者作成) Stable Diffusi

ChatGPTのブームで注目が集まる生成型AIだが、写真やイラストを作るAIも日々進化している。プレゼン資料やホームページ作成、オウンドメディアやSNS投稿など、仕事で使えるクオリティかつ商用利用OKの画像生成AIが、誰でも使えるようになったのだ。今回は「仕事に使う」という観点で筆者お勧めの画像生成AIを三つ、基本的な使い方と合わせて紹介する。(ITライター 柳谷智宣) 高クオリティの画像を作り出せる、画像生成AIに注目本連載では4回にわたってテキスト生成AI「ChatGPT」の使い方を紹介してきたが、生成系AIに次いでブレイク中なのが画像生成AIだ。こちらも急激に進化している。毎週のようにアウトプットが洗練されてきており、すでにホームページやプレゼン資料、オウンドメディアなどで利用できるレベルの画像を生成できる。もちろん、あらかじめサービスやツールの規約を見て商用利用OKなことを確認し

写真に写り込んだ不要な被写体や、画像の中に含まれる邪魔な文字など、画像の一部を消したい状況は多く発生します。画像の中の不要な部分をキレイに削除できる無料ツール「Lama Cleaner」を見つけたので、PCへの導入方法や使い方をまとめてみました。GitHub - Sanster/lama-cleaner: Image inpainting tool powered by SOTAAI Model https://github.com/Sanster/lama-cleaner Lama CleanerはPython向けのパッケージ管理システム「pip」を用いてインストールすることもできますが、今回はPythonなどの準備が整っていないPCでも一発で「Lama Cleaner」をインストールできる「Lama Cleaner One Click Installer」を使ってPCにインストール

「そらとぶあざらしさん」を遊んで頂くと、大体の温度感がご理解いただけるかと思います。 制限がされたページ今年の1月10日に、noteタイトルにもある「遺伝的アルゴリズムで最高にエッチな画像を作ろう!」というページを公開しました。 内容はタイトルの通りです。 ランダムに生成された2枚の画像から「エッチ」な方を選んでいくと、アルゴリズム学習によってだんだんとエッチな画像になっていくというものです。 遺伝的アルゴリズムで最高にエッチな画像を作ろう! (エッチな画像が見れるとは言っていない) より このページには、筆者のささやかな収入源として、GoogleAdSenseの広告を貼っていました。GoogleAdSenseとは、大企業であるGoogleが運営している個人クリエイター向けの広告プログラムです。AdSenseのポリシーとして、「性的に露骨なコンテンツ」(Sexually explici

おわり 二つの画像のうち、どっちの方がエッチかを選んでください。 世代交代を経るごとに、だんだんとエッチな画像が表示されるようになるはずです。 Choose the lewder one, and you can make them more lewd. You will win when theAdSense on this site is stopped byGoogle because of "Sexually explicit content". ENGLISH よりエッチな画像を作るために、 ぜひ色んな人に広めてください。 ツイート ・展覧会ページでこれまでの画像を公開しています。 詳しい説明 スポンサーリンク みんなの好みを学習させて、「遺伝的アルゴリズム」によってエッチな画像を自動で作るためのシステムです。 遺伝的アルゴリズムとは、あるデータを目標に近づけるために使われる

画像内に映り込んだ所望のオブジェクトを排除し、違和感の無い画像を生成するシーン補完技術に関しては近年複数の研究成果が発表されている。しかし中でも2007年のSIGGRAPHにて米カーネギメロン大のJames HaysとAlexei A. Efrosが発表した手法*1はブレークスルーとなりうる画期的なものだ。 論より証拠、早速適用例を見てみよう。本エントリで利用する画像はPresentationからの引用である。元画像の中から邪魔なオブジェクト等の隠蔽すべき領域を指定すると、その領域が補完された画像が自動的に生成される。 アルゴリズム 効果は抜群だがアイデア自体は単純なものだ。Web上には莫大な数量の画像がアップされており、今や対象となる画像の類似画像を一瞬にして大量に検索することができる。そこで、検索された類似画像で隠蔽領域を完全に置き換えてしまうことで違和感の無い補完画像を生成するのだ。

二次元を三次元にする技術、だそうです。 カーネギーメロン大学の研究者たちのこのすばらしい研究成果を、血圧を下げ、心を落ち着かせ、ゆったりとリラックスした気分にしてくれる音楽と共に、お楽しみください。 これは二次元の写真から幾何学的なパターンを解析して三次元にする技術だそうです。グラビアアイドルとかアニメとかに応用したらどうなるんでしょうね。ぜひ実験していただきたいと思います。 Carnegie Mellon Researchers Teach Computers To Perceive Three Dimensions in 2-D Images [Carnegie Mellon University] Thanks, Thomas!

1リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く