Movatterモバイル変換

shunkeen id:shunkeen

画像に関するshunkeenのブックマーク (261)

［速報］マイクロソフト、「Copilot Studio」発表。Copilotのカスタマイズ、プラグイン開発、ワークフローの設定など、Copilot用ローコード開発ツール。Ignite 2023
［速報］マイクロソフト、「Copilot Studio」発表。Copilotのカスタマイズ、プラグイン開発、ワークフローの設定など、Copilot用ローコード開発ツール。Ignite2023 マイクロソフトは開催中の年次イベント「Microsoft Ignite2023」で、同社のAIサービスであるCopilotのカスタマイズやプラグイン開発、ワークフローの設定、データソースとの接続などを含むさまざまな開発を可能にするローコード開発ツール「Copilot Studio」を発表しました。例えば、何もカスタマイズされていないCopilotは、ある企業の出張経費の上限などについて正しく答えることはできません。そこで、Copilot Studioを利用して出張経費の質問をトリガーとしたアクションを設定開始します。
shunkeen2023/11/16
“Copilotのカスタマイズやプラグイン開発、ワークフローの設定、データソースとの接続などを含むさまざまな開発を可能にするローコード開発ツール「Copilot Studio」”／Microsoft版GPTs。強そう。
AI
文章
画像
検索
リンク
簡単にオリジナルChatGPTアプリが作れる『GPTs』で、ドット絵生成チャットを作成 - Taste of Tech Topics
こんにちは、安部です。 11月なのに暑かったり寒かったしますが、皆様いかがお過ごしでしょうか。さて、先日のOpenAI DevDay、大変な盛り上がりでしたね。様々な新機能が公開され、GPT関連がさらなるパワーアップを遂げました。 DevDayは基本的に開発者向けのイベントですが、一般ユーザ向けの新機能も公開されました。それがGPTsです。今回は、GPTsが使えるようになったので試してみたいと思います。 GPTsとは GPTsとは、GPTBuilderを使ってノーコードで簡単にChatGPTをカスタマイズできるサービスで、今のところ有料ユーザのみが使用できます。ChatGPTは特定タスク向けのサービスではありませんが、精度の良い回答をもらおうと思ったらプロンプトを工夫したり事前情報をたくさん与えないといけなかったりしますよね？ GPTsは、あらかじめ特定の目的を持たせたChat
shunkeen2023/11/13
“日本語で回答できますが、質問はすべて英語でされます”／初手、日本語で質問してくださいってお願いしたら、日本語で聞かれたけど、たまたまだったのかな。しっかし、ドット絵の完成度すごすぎ。
AI
文章
画像
リンク
爆速化する画像生成AI。0.5秒で4枚出力、リアルタイム生成できるレベルに（アスキー） - Yahoo!ニュース
画像生成AI界隈で「Latent Consistency Models（LCM）」が話題だ。処理が軽快かつ爆速になり、リアルタイム生成まで可能になる。【もっと写真を見る】このところ画像生成AI界隈で話題になっているのが、「Latent Consistency Models（レイテント・コンシステンシー・モデル」（以下「LCM」）。10月6日に中国精華大学のシミアン・ルオさんが中心となって発表された論文で、日本語にすると「拡散的一貫性モデル」。新しいタイプの効率性の高い生成モデルを使い、Stable Diffusion＝安定拡散モデルより高速に画像を生成。結果としてビデオメモリーの少ないローレベルのPCでも画像生成AIを動かせるようにしようというものです。 0.5秒で4枚出力。Stable Diffusionの5倍 Stable Diffusionの拡散モデルは、ランダムなノイズ情報から
shunkeen2023/11/13
少ステップ数の画像で取捨選択して、後からステップ数を多くした画像が生成できるようなUIが用意できたら、Midjourneyみたいな使い勝手になったりするのかな？
AI
画像
リンク
【ChatGPT「GPTs（GPT Builder）」のおすすめ活用事例一覧】猛者達が開発した最強GPTsの使い方60選 | WEEL
【現在最強】GPTsの活用事例5選ここでは2024年2月現在、SNS上で特に話題になっているGPTsの活用事例5選を紹介します！【VideoAI by invideo】プロンプトから動画を生成できる！SNS用ショート動画をお求めの方におすすめのGPTsがあります。それが、プロンプトから動画を生成してくれる「VideoAI by invideo」です。このGPTsに「AIを使う利点について動画を作って」と命令してみると……Just found a new GPT thatcreatesAI videos from prompts. Game changer for generating narrated videos, educational content, orjust general entertainment. DirectChatGPT link below.
shunkeen2023/11/13
ネットに漂流しているプロンプトをコピーするより、GPTsのリンクからボタン一発で導入の方が断然楽だけど、GPTsのまとめサイトを読むのは地味に労力がかかるから、GPT Storeがイイ感じに公開されたら嬉しいなぁ。
AI
文章
画像
検索
プログラミング
リンク
ChatGPT授乳ハックという失われつつある技術について - 本しゃぶり
ChatGPTのDALL·E 3による画像生成は非常に強力だ。だがプロンプトエンジニアリングを駆使すれば、さらに限界を超えた表現が可能となる。ブックマーク保存をおすすめします。インフルエンサーたちが隠した技術 11月7日にOpenAI DevDayが開催されてからというもの、生成AI系インフルエンサーたちが大騒ぎしている。発表された機能やAPIの数々を見れば、そうなるのも無理はない。俺のような一般ユーザーでさえ、できることが一気に増えたのだから。例えば自分だけのChatGPTを簡単に作成・共有できるGPTsだ。俺もさっそく触り、本しゃぶりの知識を全部突っ込んだAishabriを作ってみた*1。 chat.openai.com だが、インフルエンサーは新たに登場した機能ばかり口にし、その影で失われつつある技術については語ろうとしない。だから俺が代わりに語ろう。禁断の技「授乳ハック」に
shunkeen2023/11/13
“ブックマーク保存をおすすめします。”／すでに対策がとられつつある技法を保存しても、今すぐ役に立つかはわからないが、文化を保全する意味では重要かもしれない（）
AI
画像
リンク
GPT-4 Turboでいちばん嬉しいのは、300ページ相当の長文をまるっと読み込めること
GPT-4 Turboでいちばん嬉しいのは、300ページ相当の長文をまるっと読み込めること2023.11.08 17:0012,078 Maxwell Zeff・Gizmodo US ［原文］（ mayumine ）これは嬉しい進化です。OpenAIの開発者向けカンファレンス｢DevDay｣で、サム・アルトマンCEOよりGPT-4 Turboの公開が発表されました（こちらの記事もどうぞ）。いちばん大きなアップデートは、今回で扱えるトークン数が128Kになって、従来の16倍となる300ページを超える長い文書を1つのプロンプトに入れられるように。本をまるごと一冊読み込ませられるようになったということです。長い文章を要約させたり、気になる箇所を教えてもらったりできるようになったことで、活用の幅はさらに大きく広がると思います。さらにGPT-4 Turboでは、JSONモードが実装され、J
shunkeen2023/11/09
“Retrieval機能が搭載され、Google Driveといった外部のデータソースから知識を取り込むことができるようになります”／今のAssistants APIのKnowledge Retrievalはファイルをアップロードする必要があるはずだけど。予定の話か？
AI
文章
画像
音声
リンク
OpenAI DevDay で発表された新モデルと新開発ツールまとめ｜npaka
以下の記事が面白かったので、かるくまとめました。・New models and developer products announced at DevDay 1. GPT-4 Turbo「GPT-4 Turbo」は、「GPT-4」より高性能です。2023年4月までの知識と128kのコンテキストウィンドウを持ちます。さらに、「GPT-4」と比較して入力は1/3、出力は1/2の安い価格で提供します。開発者はモデルID「gpt-4-1106-preview」で試すことができます。今後数週間以内に、安定した実稼働モデルをリリースする予定です。 1-1. Function Calling の更新「Function Calling」に、単一メッセージから複数のFunction (「車の窓を開けてエアコンをオフにする」など) を呼び出す機能などが追加されました。精度も向上しています。 1-2. 構造
shunkeen2023/11/07
Assistants API群（Assistants,Threads,Messages,Runs）の複雑さに面食らっている。Code Interpreter、Retrieval、ファイル、スレッド回りの面倒を見てもらえるから楽になったんだけど、代わりに仕様を勉強しないといけないやつ。
AI
文章
音声
画像
リンク
イラレの生成AIはパンドラの箱を開けたか？ Live - 2023/10/16｜CreativeEdge CL+
Adobe Illustrator 28.0に実装された「テキストからベクター生成 (Beta)」を探求するプロジェクトを開始。先週末の「イラレの生成AIを探求する」ライブでは（非公式な）ベクターイラスト生成AIチャレンジに参加しましたが、世界には強者がたくさんいる。イラレの達人クラスの人達しかいなかったので、いきなりハイレベルの戦いになりました… けっきょく、生成AIを使いこなすイラレの達人が最強ということを痛感。 Adobe Fireflyの本体はテキストプロンプトに依存しないUIを実装したユーザーフレンドリーなクリエイティブツールに進化していますが、イラレの生成AIはまだベータ機能で原始的なプロンプト入力なので、ガチャをまわし続けることしかできません。あと、アイコンやロゴ、UIパーツなどは今のベータ機能だと生成が雑なので、あまり使えない。とはいえ、下図のようなベクターグラフィッ
shunkeen2023/10/18
要素ごとの生成と構成可能性、ベジェ曲線の制御、再配色、再配置。生成AIによる初期構築の高速化と、イラレがもともと持っていた変更容易性が組み合わさったときの威力たるや。
AI
画像
リンク
ChatGPT can now see, hear, and speak
We are beginning to roll out new voice and image capabilities inChatGPT. They offer a new, more intuitive type of interface by allowing you to have a voice conversation or showChatGPT what you’re talking about. We are beginning to roll out new voice and image capabilities inChatGPT. They offer a new, more intuitive type of interface by allowing you to have a voice conversation or showChatGPT w
shunkeen2023/09/26
音声会話ができて、画像を解析できるようになるんか。BingのチャットAIは先行して画像解析できてたけど、ChatGPT PlusとEnterpriseユーザーにも2週間くらいで展開されるのかー。
AI
文章
音声
画像
リンク
伊藤園、「おーいお茶」のパッケージに画像生成AIを活用
伊藤園は8月28日、9月に発売する「お～いお茶カテキン緑茶」のパッケージデザインに画像生成AIを活用したと発表した。同様の取り組みは同社初。「中身だけでなく、外観も時代に合った魅力を伝えられる製品開発に努める」（同社）という。画像生成AIサービスは、商品パッケージのリサーチやデザインを手掛けるプラグ（東京都千代田区）のものを活用。商品デザインに特化したAIサービスの先行試用版で生成した画像を参考に、デザイナーが一から作り直したという。AI活用のデザインは500ミリリットル、1リットル、2リットルのペットボトルに加え、パウダータイプの「お～いお茶カテキン緑茶スティック」で採用。「茶葉の生命力を現したもので、従来のデザインとは一線を画す鮮やかな色彩と抜群の視認性を最大限に引き出したデザインをあしらった」（伊藤園）としている。関連記事AIが生成した絵画が、アニメ「BEASTARS」
shunkeen2023/08/29
画像生成AIを使う場合、一点もの以外にも、大量生産に使ってみてほしい気もする。文字以外の背景の抽象的な緑を、すべて違うシード値で自動生成して、個性のある一つ一つ微妙に異なる見た目のパッケージにするなど。
AI
画像
リンク
Multimodal generative AI search | Google Cloud Blog
What is Multimodal Search: "LLMs with vision" change businesses What if large language models (LLMs) had "vision", the ability to understand the meaning of images?Just like we have seen the innovation with LLMs with chatbots andtext data, the ability would make another huge impact on businesses by letting LLMs look at and organize millions of images in enterpriseIT systems. In this post, we wil
shunkeen2023/08/22
“vision language model (VLM)”／視覚言語モデル(VLM)。
AI
画像
文章
リンク
Stability AI
We’ll help you makeit like nobody’s business.Nocreative challenge too big, no timeline too tight. Get to production with StabilityAI, your enterprise-readycreative partner.It starts with realcreatives. Our multimodal media generation and editing tools are designed for the best in the business. MarketingCreate high-quality on-brand assets for every campaign using our image generation and edi
shunkeen2023/08/17
「大きいのはどっちですか？」「左」／何と何の大きさを比較してほしいのか書いてない非常にあいまいな質問に、画像から文脈を読み取って的確に答えてくるのすごいなぁ。。。
AI
文章
画像
リンク
生成AIグラビアをグラビアカメラマンが作るとどうなる？第二回：「アジア美女」最新モデルBRAV6作例とネガティブプロンプトの基礎 | テクノエッジ TechnoEdge
使用したNegative Promptは、「1.無し」、「2.ほぼ最小限」、「3.筆者標準」、「4.embeddingsを使う」の4つパターン。 4番目だけ他と違い別途ファイルが必要となり、ダウンロードしたファイルを[Stable Diffusionのホームディレクトリ]/embeddingsへコピーする。Negative PromptでEasyNegativeなどをよく見かけるがそれだ。ここではng_deepnegative_v1_75tとbadhandv4が該当する。Promptで書く替わりに、特別に学習したModelで同じ効果を得られるようになっている。無し (worst quality:2),illustration, 3d, painting, cartoons, sketch, illustration, 3d, sepia, (painting), cartoons, sk
shunkeen2023/07/19
圧倒的な美しさの圧の強い写真だけだと使いづらいから、普段使い用にファインチューニングしたモデルとか出てくるのかな。ファッションみたく。いや、カメラやレンズにこだわる感じか。
AI
画像
リンク
［速報］マイクロソフト、Bing Chatで手書きの画像からHTML/CSSを生成可能に、冷蔵庫の中身から料理のアイデアも、新機能ビジュアルサーチ。Inspire 2023
［速報］マイクロソフト、Bing Chatで手書きの画像からHTML/CSSを生成可能に、冷蔵庫の中身から料理のアイデアも、新機能ビジュアルサーチ。Inspire2023 マイクロソフトは、日本時間7月19日未明から開催中のパートナー向け年次イベント「Microsoft Inspire2023」において、AIチャットサービス「Bing Chat」に、画像を基に質問ができる「ビジュアルサーチ」機能（Visual Search in Bing Chat）を追加したことを明らかにしました。ビジュアルサーチの機能はOpenAIのGPT-4モデルを活用したものだと説明されています。下記はBing Chatのビジュアルサーチのデモ動画として、手書きのWebフォームの画像からHTML/CSSを生成させる様子を紹介したものです。手書きのWebフォーム画像からHTML/CSSを生成 Bing Ch
shunkeen2023/07/19
“手書きのWebフォームの画像からHTML/CSSを生成させる”／これにCode InterpreterでFlaskの簡単なコードを生成させたらどうなるんじゃろうか。
AI
文章
画像
プログラミング
リンク
AIイラスト販売サービス「petapi」、スタートからわずか1カ月半でサービス終了を発表【やじうまWatch】
shunkeen2023/07/14
ユパ様「またAI村が一つ死んだ。行こう、ここもじき腐海に沈む」
AI
画像
リンク
https://pc.watch.impress.co.jp/docs/news/1515347.html
shunkeen2023/07/12
“KISEKI ARTは、作家の一筆(ストローク)の特徴量をAIにより抽出し、可視化するプロジェクト。作家や作品特有の筆遣いの特徴を、指紋ならぬ「絵紋」として3D上に可視化できる”／筆跡鑑定みたいな？
AI
画像
リンク
pixivFANBOX個別規約改定と「AI生成コンテンツ」設定のお知らせ｜pixivFANBOX公式｜pixivFANBOX
いつもpixiv FANBOXをご利用いただきありがとうございます。pixiv FANBOX個別利用規約の改定内容についてお知らせします。このたびの改定は、2023年7月25日（火）より適用されます。 ◼︎変更の概要2023年5月10日「AI生成作品に対する、FANBOXにおける今後の対応」にてお伝えいたしました通り、FANBOXでは「AI生成コンテ...
shunkeen2023/07/12
“利用規約に違反するコンテンツの公開を目的とした外部サイトへの誘導行為や、pixivFANBOX上での活動内容が極端に不明瞭なまま支援金を集める行為等、不審な手法でサービスを利用する”／うたがわしきは垢BAN。
AI
画像
リンク
Stable Diffusion から特定の概念を忘れさせる学習を行ってみる
TL;DR ESD の手法で LoRA を学習してみたらそれっぽい感じのことができたよVRAM 8GB で余裕で学習できるようになったよ (元は20GB要求) LoRA として保存できるようになったので重みの取り回しが良くなったよマイナス適用によって、概念を削除するだけでなく強調することもできたよ一度でも画像生成 AI に触ったことがあると、より楽しんで読めると思います。論文とかどうでもいいから学習方法知りたい！という方は実際に学習してみるへどうぞ！今回作成したものコード: モデルなど: 前提 Stable Diffusion とは、StabilityAI らが公開したオープンソースの画像生成 AI であり、テキストによる指示で様々な画像を生成することができる。本来の Stable Diffusion は、実写画像や海外風のイラストを出力することが得意だが、アジア系の
shunkeen2023/06/30
学習棄却（アンラーニング）だ。ヤバめな画像をうっかり学習しちゃった時に、その画像をのぞいた画像集で新たなモデルを作るのはコストがかかる。けど、その画像を学習棄却できるなら、現実的なコストになりそう。
AI
画像
リンク
フォトショの生成AI機能でキャンペーン　アドビ、Twitterで画像の投稿募る
アドビは6月29日、Photoshopの画像生成AI機能「生成塗りつぶし」を活用した写真の投稿キャンペーンを始めた。制作に生成塗りつぶしを使った画像を、ハッシュタグ「#Photoshop生成AIチャレンジ」を付けてTwitterに投稿。アドビが選出したインフルエンサーに引用リツイートされると、景品として2000円分のAmazonギフト券を受け取れる。キャンペーンは8月9日まで開催。アドビが選出したインフルエンサーとして、Webデザイナーのタマケンさん、フォトグラファーの高木慎平さん、バーチャルYouTuberなどとして活動するいまいち萌えない子さんなどが審査する。生成塗りつぶしは米Adobeが5月に発表した機能。同社の画像生成AI「Adobe Firefly」を活用したもので、プロンプト（文章）を入力するだけで写真を拡張したり、モノを追加・削除したりできる。現在はβ版として英語入力のみ
shunkeen2023/06/30
“Webデザイナーのタマケンさん、フォトグラファーの高木慎平さん、バーチャルYouTuberなどとして活動するいまいち萌えない子さんなどが審査する”／高品質の作品が大量投稿されたら審査側も大変そう。
AI
画像
リンク
「顔を右に」「口を開く」など画像の動かしたい部分をAIがいい感じに修正してくれるツール「DragGAN」のソースコード＆デモが公開される
AIを使って画像を生成する時、「ちょっとだけ修正を加えたい」と思うことは多いもの。そんな人たちの夢をかなえるツールが「DragGAN」です。DragGANは画像の中で動かしたいポイントを指示するだけでAIが自動で修正してくれるというもので、2023年5月に論文だけが提出されていましたが、2023年6月22日にソースコードが公開され、同時にデモも登場しました。GitHub - XingangPan/DragGAN: Official Code for DragGAN (SIGGRAPH2023) https://github.com/XingangPan/DragGAN Drag Your GAN: Interactive Point-based Manipulation on the Generative Image Manifold https://vcai.mpi-inf.mpg.
shunkeen2023/06/27
指示に従いつつ、画像がなめらかに変形するように、GANの潜在空間内の潜在変数を動かす仕組みだとすると、対応する変数のない画像は生成されないのかな。
AI
画像
リンク
12345678910次のページ