Movatterモバイル変換


[0]ホーム

URL:


▼サーバー運営を助ける支援をお願いします
▼サーバー運営を助ける支援をお願いします
毎月825円(税込)
900円(うち手数料33円)

親愛なる読者の皆さまへ。ご存じの通り価格高騰などの悪影響でサーバー運営がとても苦しい状態です。回線や台数を整理し見直せる部分は全て見直しましたが、やはりまだ危険水域です。このままだと1ページを10分割ぐらいして無理矢理PVを増やさざるを得なくなってしまいます。そこで、GIGAZINEの物理的なサーバーたちを、たった1円でも良いので親愛なる読者の皆さまに支援してもらえればとっても助かります!今すぐ寄付は上のボタンから!

これまでGIGAZINEを支援してくれたメンバーのリスト

GIGAZINE ホーム
login
GIGAZINEにログイン
メンバー登録はココをクリック


-パスワードの再発行

ソフトウェア

画像生成AI「Stable Diffusion」を使って新しいインテリアデザインを作成しまくる試み


入力したテキストに則した画像を生成したり、ある画像から別の画像を生成したりすることができる画像生成AIの「Stable Diffusion」を使い、さまざまなインテリアデザインをAIに生成してもらうという試みをKaren X. ChengさんとJustin Alveyさんが行っています。

Using AI for design inspiration

We used Stable Diffusion Depth to Image to get the consistency - collab with@justLV

See below for our process#ArtificialIntelligence#stablediffusion#interiordesignpic.twitter.com/teImanZsZF

— Karen X. Cheng (@karenxcheng)December 20, 2022


Alveyさんによると、この試みはStable Diffusionのバージョン2.0で登場した、入力画像の奥行きを推測して画像を出力することができる「Depth-Guided」というモデルを利用し、模型で作成した簡易的なインテリアをベースにAIにさまざまなインテリアデザインを提案させています。

I used the#StableDiffusion 2 Depth Guided model to create architecture photos from dollhouse furniture.

By using a depth-map you can create images with incredible spatial consistency without using any of the original RGB image.

See ????https://t.co/jAFWSxrCux

— Justin Alvey (@justLV)December 20, 2022


Depth-GuidedモデルはStable Diffusionのimg2img機能(ある画像から別の画像を生成する機能)を強化するために追加されたモデル。入力画像の深度情報を推測し、それをベースに別の画像を生成するため、元の画像の構図を出力画像に色濃く反映できるというのが特徴です。以下の画像は左から「入力画像」「入力画像から抽出した深度情報」「深度情報をベースに新しく出力した画像」です。


「Depth-Guidedモデルは、Stable Diffusionのバージョン2.0から微調整されており、深度関連の追加チャンネルが存在しているためユニーク」とAlveyさん。なお、Depth-Guidedモデルは単一の画像から深度を予測するモデルのMiDaSを利用しているそうで、以下のツイートの画像は上が「入力画像」で、下が「入力画像から生成した深度マップ」です。

2/ This model is unique as it was fine-tuned from the Stable Diffusion 2 base with an extra channel for depth.

Using MiDaS (a model to predict depth from a single image), it can create new images with matching depth maps to your "init image"pic.twitter.com/nq9xuvkUY7

— Justin Alvey (@justLV)December 20, 2022


そして深度マップをベースに出力したのが以下のツイートの画像。Alveyさんは「ノイズ除去強度を『1.0』に設定することで、元画像が使用されないようにしました。これによりプロンプトが大きく異なる場合でも、一貫してオブジェクトを生成できました。木製のドールハウス家具など、シンプルでわかりやすい形を入力画像に使用するのが最適でした」とツイートしています。

3/ I set the denoising strength to 1.0 so that none of the original RGB image was used

Even with widely different prompts it was able to generate consistent objects

Using simple, recognizable shapes such as wooden doll-house furniture worked great for thispic.twitter.com/tFu4IHezR4

— Justin Alvey (@justLV)December 20, 2022


通常の写真だと極端な遠近法により、出力画像がドールハウスのようになってしまうそうです。しかし、より長い焦点距離(iPhoneなら3倍ズーム)にして被写体から離れて写真を撮影することで問題は解決できたそうです。

4/ Regular photos ended up having an unavoidable “doll-house” feel to them (even with heavy prompt tweaking) due to the extreme perspective.

I found that changing to a longer focal length (3x on an iPhone) and capturing from further away resolved this.pic.twitter.com/Hs3VKFFvZn

— Justin Alvey (@justLV)December 20, 2022


Alveyさんが画像生成時に入力したテキストの事例も挙げられています。

「A beautiful rustic Balinese villa, architecture magazine, modern bedroom, infinity pool outside, design minimalism, stone surfaces(美しい素朴なバリのヴィラ、建築雑誌、モダンなベッドルーム、屋外のインフィニティ・プール、ミニマリズムデザイン、石の表面)」

5/ Here are a few of the prompts used:

"A beautiful rustic Balinese villa, architecture magazine, modern bedroom, infinity pool outside, design minimalism, stone surfaces"pic.twitter.com/N7ipTFbXcU

— Justin Alvey (@justLV)December 20, 2022


「Luxurious modern studio bedroom, trending architecture magazine photo, colorful framed art hanging over bed, design minimalism, furry white rugs, trendy, industrial, pop art, boho chic(豪華でモダンなスタジオベッドルーム、トレンドの建築雑誌の写真、ベッドにかけられたカラフルなフレームアート、ミニマリズムなデザイン、白いファーのラグ、トレンディ、インダストリアル、ポップアート、ボーホーシック)」

6/ "Luxurious modern studio bedroom, trending architecture magazine photo, colorful framed art hanging over bed, design minimalism, furry white rugs, trendy, industrial, pop art, boho chic"pic.twitter.com/hlcMRQjJcu

— Justin Alvey (@justLV)December 20, 2022


「Retro bedroom studio, arcade, 80's style, vintage framed posters, trending architecture magazine, rugs, metal industrial pipes, murals, guitars and sound equipment, grunge, concrete floor(レトロなベッドルームスタジオ、アーケード、1980年代スタイル、ビンテージのフレーム付きポスター、トレンドの建築雑誌、ラグ、金属製の工業用パイプ、壁画、ギターと音響機器、グランジ、コンクリート床)」

7/ "Retro bedroom studio, arcade, 80's style, vintage framed posters, trending architecture magazine, rugs, metal industrial pipes, murals, guitars and sound equipment, grunge, concrete floor"pic.twitter.com/3YeQL4q8OA

— Justin Alvey (@justLV)December 20, 2022


画像生成時に入力するテキストで、深度マップがどのように変化するかが大きく変化してきます。そのため、入力するテキストにはある程度の創造性が必要になるとAlveyさん。例えば以下のツイートの画像のように、花瓶の深度マップは、入力するテキストによって似たような形のおもちゃやろうそく、彫刻、ギター、ミッキーの被り物をした子どもとして出力されています。

8/ There is some “creativity” in how the depth-map is matched under the prompt.

Here are a few outtakes where the model tried to match the plant to antlers, toys, candles, statues, a double-necked guitar and even a kid with Mickey ears????

Follow for more creative experiments ????‍????pic.twitter.com/XPIwpG7o8d

— Justin Alvey (@justLV)December 20, 2022

この記事のタイトルとURLをコピーする

・関連記事
画像生成AI「Stable Diffusion」のバージョン2.0が登場、出力画像の解像度が拡大&デジタル透かしを入れられる機能も - GIGAZINE

画像生成AI「Stable Diffusion」がどのような仕組みでテキストから画像を生成するのかを詳しく図解 - GIGAZINE

アーティストの権利侵害やポルノ生成などの問題も浮上する画像生成AI「Stable Diffusion」の仕組みとは? - GIGAZINE

画像生成AI「Stable Diffusion」を使いこなすために知っておくと理解が進む「どうやって絵を描いているのか」をわかりやすく図解 - GIGAZINE

・関連コンテンツ

inソフトウェア,  デザイン,  創作, Posted by logu_ii

You can read the machine translated English articleAn attempt to create a new interior desi….

最新ニュース40件

記事検索
カテゴリ
有料メンバー
無料メンバー
教育
AI
動画
メモ
ハードウェア
ソフトウェア
ネットサービス
サイエンス
スマホ
レビュー
試食
ゲーム
取材
ヘッドライン
アニメ
乗り物
セキュリティ
映画
生き物
デザイン
マンガ
創作
ウェブアプリ
ピックアップ
インタビュー
お知らせ
コラム
広告
過去の記事

人気記事ランキング

直近24時間(1時間ごとに更新。5分ごとはこちら

  1. AmazonのKDPで「お客様のアカウントは停止されています」と表示されたので問い合わせて復帰するまでの流れをまとめてみた
  2. ついにルンバのiRobotが破産申請、中国の主要サプライヤーに経営権移譲の再編支援契約を締結へ
  3. わずか13cmのディスクに360TBのデータを138億年保存できるガラスストレージ技術「5次元メモリクリスタル」が実現間近
  4. Appleギフトカードを利用したら約25年使っていたAppleアカウントが凍結されて写真やデバイスへアクセス不能に
  5. CD未対応のPlayStation 5でどうにかしてCDを再生することは可能なのか?
  6. アップル100%のアップルパイを作る試み、砂糖も小麦粉もバターも使わない
  7. SpaceXがアメリカで40ドルのStarlinkプランをひっそりと廃止
  8. 複数台のMacを連結してAIクラスターを作れる機能が「macOS Tahoe 26.2」で追加される
  9. 世界中の27億5000万軒の建物3Dデータを網羅したデータセット「GlobalBuildingAtlas」と3D地図が公開される
  10. 2025年12月15日のヘッドラインニュース

お邪魔して申し訳ないです。読者のための記事を掲載し続けるため、どうかサーバー代として300円をご寄付いただけないでしょうか。

喜んでメールでリマインドさせていただきます。 引き続き記事をお読みください。


[8]ページ先頭

©2009-2025 Movatter.jp