Movatterモバイル変換


[0]ホーム

URL:


はてなブックマークアプリ

サクサク読めて、
アプリ限定の機能も多数!

アプリで開く

はてなブックマーク

タグ

関連タグで絞り込む (11)

タグの絞り込みを解除

画像に関するshunkeenのブックマーク (261)

  • [速報]マイクロソフト、「Copilot Studio」発表。Copilotのカスタマイズ、プラグイン開発、ワークフローの設定など、Copilot用ローコード開発ツール。Ignite 2023

    [速報]マイクロソフト、「Copilot Studio」発表。Copilotのカスタマイズ、プラグイン開発、ワークフローの設定など、Copilot用ローコード開発ツール。Ignite2023 マイクロソフトは開催中の年次イベント「Microsoft Ignite2023」で、同社のAIサービスであるCopilotのカスタマイズやプラグイン開発、ワークフローの設定、データソースとの接続などを含むさまざまな開発を可能にするローコード開発ツール「Copilot Studio」を発表しました。 例えば、何もカスタマイズされていないCopilotは、ある企業の出張経費の上限などについて正しく答えることはできません。 そこで、Copilot Studioを利用して出張経費の質問をトリガーとしたアクションを設定開始します。

    [速報]マイクロソフト、「Copilot Studio」発表。Copilotのカスタマイズ、プラグイン開発、ワークフローの設定など、Copilot用ローコード開発ツール。Ignite 2023
    shunkeen
    shunkeen2023/11/16非公開
    “Copilotのカスタマイズやプラグイン開発、ワークフローの設定、データソースとの接続などを含むさまざまな開発を可能にするローコード開発ツール「Copilot Studio」”/Microsoft版GPTs。強そう。
    • 簡単にオリジナルChatGPTアプリが作れる『GPTs』で、ドット絵生成チャットを作成 - Taste of Tech Topics

      こんにちは、安部です。 11月なのに暑かったり寒かったしますが、皆様いかがお過ごしでしょうか。 さて、先日のOpenAI DevDay、大変な盛り上がりでしたね。 様々な新機能が公開され、GPT関連がさらなるパワーアップを遂げました。 DevDayは基的に開発者向けのイベントですが、一般ユーザ向けの新機能も公開されました。 それがGPTsです。 今回は、GPTsが使えるようになったので試してみたいと思います。 GPTsとは GPTsとは、GPTBuilderを使ってノーコードで簡単にChatGPTをカスタマイズできるサービスで、今のところ有料ユーザのみが使用できます。ChatGPTは特定タスク向けのサービスではありませんが、精度の良い回答をもらおうと思ったらプロンプトを工夫したり事前情報をたくさん与えないといけなかったりしますよね? GPTsは、あらかじめ特定の目的を持たせたChat

      簡単にオリジナルChatGPTアプリが作れる『GPTs』で、ドット絵生成チャットを作成 - Taste of Tech Topics
      shunkeen
      shunkeen2023/11/13非公開
      “日本語で回答できますが、質問はすべて英語でされます”/初手、日本語で質問してくださいってお願いしたら、日本語で聞かれたけど、たまたまだったのかな。しっかし、ドット絵の完成度すごすぎ。
      • 爆速化する画像生成AI。0.5秒で4枚出力、リアルタイム生成できるレベルに(アスキー) - Yahoo!ニュース

        画像生成AI界隈で「Latent Consistency Models(LCM)」が話題だ。処理が軽快かつ爆速になり、リアルタイム生成まで可能になる。 【もっと写真を見る】 このところ画像生成AI界隈で話題になっているのが、「Latent Consistency Models(レイテント・コンシステンシー・モデル」(以下「LCM」)。10月6日に中国精華大学のシミアン・ルオさんが中心となって発表された論文で、日語にすると「拡散的一貫性モデル」。新しいタイプの効率性の高い生成モデルを使い、Stable Diffusion=安定拡散モデルより高速に画像を生成。結果としてビデオメモリーの少ないローレベルのPCでも画像生成AIを動かせるようにしようというものです。 0.5秒で4枚出力。Stable Diffusionの5倍 Stable Diffusionの拡散モデルは、ランダムなノイズ情報から

        爆速化する画像生成AI。0.5秒で4枚出力、リアルタイム生成できるレベルに(アスキー) - Yahoo!ニュース
        shunkeen
        shunkeen2023/11/13非公開
        少ステップ数の画像で取捨選択して、後からステップ数を多くした画像が生成できるようなUIが用意できたら、Midjourneyみたいな使い勝手になったりするのかな?
        • 【ChatGPT「GPTs(GPT Builder)」のおすすめ活用事例一覧】猛者達が開発した最強GPTsの使い方60選 | WEEL

          【現在最強】GPTsの活用事例5選 ここでは2024年2月現在、SNS上で特に話題になっているGPTsの活用事例5選を紹介します! 【VideoAI by invideo】プロンプトから動画を生成できる!SNS用ショート動画をお求めの方におすすめのGPTsがあります。 それが、プロンプトから動画を生成してくれる「VideoAI by invideo」です。このGPTsに「AIを使う利点について動画を作って」と命令してみると……Just found a new GPT thatcreatesAI videos from prompts. Game changer for generating narrated videos, educational content, orjust general entertainment. DirectChatGPT link below.

          shunkeen
          shunkeen2023/11/13非公開
          ネットに漂流しているプロンプトをコピーするより、GPTsのリンクからボタン一発で導入の方が断然楽だけど、GPTsのまとめサイトを読むのは地味に労力がかかるから、GPT Storeがイイ感じに公開されたら嬉しいなぁ。
          • ChatGPT授乳ハックという失われつつある技術について - 本しゃぶり

            ChatGPTのDALL·E 3による画像生成は非常に強力だ。 だがプロンプトエンジニアリングを駆使すれば、さらに限界を超えた表現が可能となる。 ブックマーク保存をおすすめします。 インフルエンサーたちが隠した技術 11月7日にOpenAI DevDayが開催されてからというもの、生成AI系インフルエンサーたちが大騒ぎしている。発表された機能やAPIの数々を見れば、そうなるのも無理はない。俺のような一般ユーザーでさえ、できることが一気に増えたのだから。 例えば自分だけのChatGPTを簡単に作成・共有できるGPTsだ。俺もさっそく触り、しゃぶりの知識を全部突っ込んだAishabriを作ってみた*1。 chat.openai.com だが、インフルエンサーは新たに登場した機能ばかり口にし、その影で失われつつある技術については語ろうとしない。だから俺が代わりに語ろう。禁断の技「授乳ハック」に

            ChatGPT授乳ハックという失われつつある技術について - 本しゃぶり
            shunkeen
            shunkeen2023/11/13非公開
            “ブックマーク保存をおすすめします。”/すでに対策がとられつつある技法を保存しても、今すぐ役に立つかはわからないが、文化を保全する意味では重要かもしれない()
            • GPT-4 Turboでいちばん嬉しいのは、300ページ相当の長文をまるっと読み込めること

              GPT-4 Turboでいちばん嬉しいのは、300ページ相当の長文をまるっと読み込めること2023.11.08 17:0012,078 Maxwell Zeff・Gizmodo US [原文] ( mayumine ) これは嬉しい進化です。OpenAIの開発者向けカンファレンス「DevDay」で、サム・アルトマンCEOよりGPT-4 Turboの公開が発表されました(こちらの記事もどうぞ)。 いちばん大きなアップデートは、今回で扱えるトークン数が128Kになって、従来の16倍となる300ページを超える長い文書を1つのプロンプトに入れられるように。をまるごと一冊読み込ませられるようになったということです。長い文章を要約させたり、気になる箇所を教えてもらったりできるようになったことで、活用の幅はさらに大きく広がると思います。 さらにGPT-4 Turboでは、JSONモードが実装され、J

              GPT-4 Turboでいちばん嬉しいのは、300ページ相当の長文をまるっと読み込めること
              shunkeen
              shunkeen2023/11/09非公開
              “Retrieval機能が搭載され、Google Driveといった外部のデータソースから知識を取り込むことができるようになります”/今のAssistants APIのKnowledge Retrievalはファイルをアップロードする必要があるはずだけど。予定の話か?
              • OpenAI DevDay で発表された新モデルと新開発ツール まとめ|npaka

                以下の記事が面白かったので、かるくまとめました。 ・New models and developer products announced at DevDay 1. GPT-4 Turbo「GPT-4 Turbo」は、「GPT-4」より高性能です。2023年4月までの知識と128kのコンテキストウィンドウを持ちます。さらに、「GPT-4」と比較して入力は1/3、出力は1/2の安い価格で提供します。 開発者はモデルID「gpt-4-1106-preview」で試すことができます。今後数週間以内に、安定した実稼働モデルをリリースする予定です。 1-1. Function Calling の更新「Function Calling」に、単一メッセージから複数のFunction (「車の窓を開けてエアコンをオフにする」など) を呼び出す機能などが追加されました。精度も向上しています。 1-2. 構造

                OpenAI DevDay で発表された新モデルと新開発ツール まとめ|npaka
                shunkeen
                shunkeen2023/11/07非公開
                Assistants API群(Assistants,Threads,Messages,Runs)の複雑さに面食らっている。Code Interpreter、Retrieval、ファイル、スレッド回りの面倒を見てもらえるから楽になったんだけど、代わりに仕様を勉強しないといけないやつ。
                • イラレの生成AIはパンドラの箱を開けたか? Live - 2023/10/16|CreativeEdge CL+

                  Adobe Illustrator 28.0に実装された「テキストからベクター生成 (Beta)」を探求するプロジェクトを開始。 先週末の「イラレの生成AIを探求する」ライブでは(非公式な)ベクターイラスト生成AIチャレンジに参加しましたが、世界には強者がたくさんいる。イラレの達人クラスの人達しかいなかったので、いきなりハイレベルの戦いになりました… けっきょく、生成AIを使いこなすイラレの達人が最強ということを痛感。 Adobe Fireflyの体はテキストプロンプトに依存しないUIを実装したユーザーフレンドリーなクリエイティブツールに進化していますが、イラレの生成AIはまだベータ機能で原始的なプロンプト入力なので、ガチャをまわし続けることしかできません。 あと、アイコンやロゴ、UIパーツなどは今のベータ機能だと生成が雑なので、あまり使えない。 とはいえ、下図のようなベクターグラフィッ

                  イラレの生成AIはパンドラの箱を開けたか? Live - 2023/10/16|CreativeEdge CL+
                  shunkeen
                  shunkeen2023/10/18非公開
                  要素ごとの生成と構成可能性、ベジェ曲線の制御、再配色、再配置。生成AIによる初期構築の高速化と、イラレがもともと持っていた変更容易性が組み合わさったときの威力たるや。
                  • ChatGPT can now see, hear, and speak

                    We are beginning to roll out new voice and image capabilities inChatGPT. They offer a new, more intuitive type of interface by allowing you to have a voice conversation or showChatGPT what you’re talking about. We are beginning to roll out new voice and image capabilities inChatGPT. They offer a new, more intuitive type of interface by allowing you to have a voice conversation or showChatGPT w

                    ChatGPT can now see, hear, and speak
                    shunkeen
                    shunkeen2023/09/26非公開
                    音声会話ができて、画像を解析できるようになるんか。BingのチャットAIは先行して画像解析できてたけど、ChatGPT PlusとEnterpriseユーザーにも2週間くらいで展開されるのかー。
                    • 伊藤園、「おーいお茶」のパッケージに画像生成AIを活用

                      伊藤園は8月28日、9月に発売する「お~いお茶 カテキン緑茶」のパッケージデザインに画像生成AIを活用したと発表した。同様の取り組みは同社初。「中身だけでなく、外観も時代に合った魅力を伝えられる製品開発に努める」(同社)という。画像生成AIサービスは、商品パッケージのリサーチやデザインを手掛けるプラグ(東京都千代田区)のものを活用。商品デザインに特化したAIサービスの先行試用版で生成した画像を参考に、デザイナーが一から作り直したという。AI活用のデザインは500ミリリットル、1リットル、2リットルのペットボトルに加え、パウダータイプの「お~いお茶 カテキン緑茶 スティック」で採用。「茶葉の生命力を現したもので、従来のデザインとは一線を画す鮮やかな色彩と抜群の視認性を最大限に引き出したデザインをあしらった」(伊藤園)としている。 関連記事AIが生成した絵画が、アニメ「BEASTARS

                      伊藤園、「おーいお茶」のパッケージに画像生成AIを活用
                      shunkeen
                      shunkeen2023/08/29非公開
                      画像生成AIを使う場合、一点もの以外にも、大量生産に使ってみてほしい気もする。文字以外の背景の抽象的な緑を、すべて違うシード値で自動生成して、個性のある一つ一つ微妙に異なる見た目のパッケージにするなど。
                      • Multimodal generative AI search | Google Cloud Blog

                        What is Multimodal Search: "LLMs with vision" change businesses What if large language models (LLMs) had "vision", the ability to understand the meaning of images?Just like we have seen the innovation with LLMs with chatbots andtext data, the ability would make another huge impact on businesses by letting LLMs look at and organize millions of images in enterpriseIT systems. In this post, we wil

                        Multimodal generative AI search | Google Cloud Blog
                        shunkeen
                        shunkeen2023/08/22非公開
                        “vision language model (VLM)”/視覚言語モデル(VLM)。
                        • Stability AI

                          We’ll help you makeit like nobody’s business.Nocreative challenge too big, no timeline too tight. Get to production with StabilityAI, your enterprise-readycreative partner.It starts with realcreatives. Our multimodal media generation and editing tools are designed for the best in the business. MarketingCreate high-quality on-brand assets for every campaign using our image generation and edi

                          Stability AI
                          shunkeen
                          shunkeen2023/08/17非公開
                          「大きいのはどっちですか?」「左」/何と何の大きさを比較してほしいのか書いてない非常にあいまいな質問に、画像から文脈を読み取って的確に答えてくるのすごいなぁ。。。
                          • 生成AIグラビアをグラビアカメラマンが作るとどうなる?第二回:「アジア美女」最新モデルBRAV6作例とネガティブプロンプトの基礎 | テクノエッジ TechnoEdge

                            使用したNegative Promptは、「1.無し」、「2.ほぼ最小限」、「3.筆者標準」、「4.embeddingsを使う」の4つパターン。 4番目だけ他と違い別途ファイルが必要となり、ダウンロードしたファイルを[Stable Diffusionのホームディレクトリ]/embeddingsへコピーする。Negative PromptでEasyNegativeなどをよく見かけるがそれだ。ここではng_deepnegative_v1_75tとbadhandv4が該当する。Promptで書く替わりに、特別に学習したModelで同じ効果を得られるようになっている。 無し (worst quality:2),illustration, 3d, painting, cartoons, sketch, illustration, 3d, sepia, (painting), cartoons, sk

                            生成AIグラビアをグラビアカメラマンが作るとどうなる?第二回:「アジア美女」最新モデルBRAV6作例とネガティブプロンプトの基礎 | テクノエッジ TechnoEdge
                            shunkeen
                            shunkeen2023/07/19非公開
                            圧倒的な美しさの圧の強い写真だけだと使いづらいから、普段使い用にファインチューニングしたモデルとか出てくるのかな。ファッションみたく。いや、カメラやレンズにこだわる感じか。
                            • [速報]マイクロソフト、Bing Chatで手書きの画像からHTML/CSSを生成可能に、冷蔵庫の中身から料理のアイデアも、新機能ビジュアルサーチ。Inspire 2023

                              [速報]マイクロソフト、Bing Chatで手書きの画像からHTML/CSSを生成可能に、冷蔵庫の中身から料理のアイデアも、新機能ビジュアルサーチ。Inspire2023 マイクロソフトは、日時間7月19日未明から開催中のパートナー向け年次イベント「Microsoft Inspire2023」において、AIチャットサービス「Bing Chat」に、画像を基に質問ができる「ビジュアルサーチ」機能(Visual Search in Bing Chat)を追加したことを明らかにしました。 ビジュアルサーチの機能はOpenAIのGPT-4モデルを活用したものだと説明されています。 下記はBing Chatのビジュアルサーチのデモ動画として、手書きのWebフォームの画像からHTML/CSSを生成させる様子を紹介したものです。 手書きのWebフォーム画像からHTML/CSSを生成 Bing Ch

                              [速報]マイクロソフト、Bing Chatで手書きの画像からHTML/CSSを生成可能に、冷蔵庫の中身から料理のアイデアも、新機能ビジュアルサーチ。Inspire 2023
                              shunkeen
                              shunkeen2023/07/19非公開
                              “手書きのWebフォームの画像からHTML/CSSを生成させる”/これにCode InterpreterでFlaskの簡単なコードを生成させたらどうなるんじゃろうか。
                              • shunkeen
                                shunkeen2023/07/14非公開
                                ユパ様「またAI村が一つ死んだ。行こう、ここもじき腐海に沈む」
                                • shunkeen
                                  shunkeen2023/07/12非公開
                                  “KISEKI ARTは、作家の一筆(ストローク)の特徴量をAIにより抽出し、可視化するプロジェクト。作家や作品特有の筆遣いの特徴を、指紋ならぬ「絵紋」として3D上に可視化できる”/筆跡鑑定みたいな?
                                  • pixivFANBOX個別規約改定と「AI生成コンテンツ」設定のお知らせ|pixivFANBOX公式|pixivFANBOX

                                    いつもpixivFANBOXをご利用いただきありがとうございます。pixivFANBOX個別利用規約の改定内容についてお知らせします。 このたびの改定は、2023年7月25日(火)より適用されます。 ◼︎変更の概要2023年5月10日「AI生成作品に対する、FANBOXにおける今後の対応」にてお伝えいたしました通り、FANBOXでは「AI生成コンテ...

                                    pixivFANBOX個別規約改定と「AI生成コンテンツ」設定のお知らせ|pixivFANBOX公式|pixivFANBOX
                                    shunkeen
                                    shunkeen2023/07/12非公開
                                    “利用規約に違反するコンテンツの公開を目的とした外部サイトへの誘導行為や、pixivFANBOX上での活動内容が極端に不明瞭なまま支援金を集める行為等、不審な手法でサービスを利用する”/うたがわしきは垢BAN。
                                    • Stable Diffusion から特定の概念を忘れさせる学習を行ってみる

                                      TL;DR ESD の手法で LoRA を学習してみたらそれっぽい感じのことができたよVRAM 8GB で余裕で学習できるようになったよ (元は20GB要求) LoRA として保存できるようになったので重みの取り回しが良くなったよ マイナス適用によって、概念を削除するだけでなく強調することもできたよ 一度でも画像生成AI に触ったことがあると、より楽しんで読めると思います。 論文とかどうでもいいから学習方法知りたい! という方は 実際に学習してみる へどうぞ! 今回作成したもの コード: モデルなど: 前提 Stable Diffusion とは、StabilityAI らが公開したオープンソースの画像生成AI であり、テキストによる指示で様々な画像を生成することができる。来の Stable Diffusion は、実写画像や海外風のイラストを出力することが得意だが、アジア系の

                                      Stable Diffusion から特定の概念を忘れさせる学習を行ってみる
                                      shunkeen
                                      shunkeen2023/06/30非公開
                                      学習棄却(アンラーニング)だ。ヤバめな画像をうっかり学習しちゃった時に、その画像をのぞいた画像集で新たなモデルを作るのはコストがかかる。けど、その画像を学習棄却できるなら、現実的なコストになりそう。
                                      • フォトショの生成AI機能でキャンペーン アドビ、Twitterで画像の投稿募る

                                        アドビは6月29日、Photoshopの画像生成AI機能「生成塗りつぶし」を活用した写真の投稿キャンペーンを始めた。制作に生成塗りつぶしを使った画像を、ハッシュタグ「#Photoshop生成AIチャレンジ」を付けてTwitterに投稿。アドビが選出したインフルエンサーに引用リツイートされると、景品として2000円分のAmazonギフト券を受け取れる。 キャンペーンは8月9日まで開催。アドビが選出したインフルエンサーとして、Webデザイナーのタマケンさん、フォトグラファーの高木慎平さん、バーチャルYouTuberなどとして活動するいまいち萌えない子さんなどが審査する。 生成塗りつぶしは米Adobeが5月に発表した機能。同社の画像生成AI「Adobe Firefly」を活用したもので、プロンプト(文章)を入力するだけで写真を拡張したり、モノを追加・削除したりできる。現在はβ版として英語入力のみ

                                        フォトショの生成AI機能でキャンペーン アドビ、Twitterで画像の投稿募る
                                        shunkeen
                                        shunkeen2023/06/30非公開
                                        “Webデザイナーのタマケンさん、フォトグラファーの高木慎平さん、バーチャルYouTuberなどとして活動するいまいち萌えない子さんなどが審査する”/高品質の作品が大量投稿されたら審査側も大変そう。
                                        • 「顔を右に」「口を開く」など画像の動かしたい部分をAIがいい感じに修正してくれるツール「DragGAN」のソースコード&デモが公開される

                                          AIを使って画像を生成する時、「ちょっとだけ修正を加えたい」と思うことは多いもの。そんな人たちの夢をかなえるツールが「DragGAN」です。DragGANは画像の中で動かしたいポイントを指示するだけでAIが自動で修正してくれるというもので、2023年5月に論文だけが提出されていましたが、2023年6月22日にソースコードが公開され、同時にデモも登場しました。GitHub - XingangPan/DragGAN: Official Code for DragGAN (SIGGRAPH2023) https://github.com/XingangPan/DragGAN Drag Your GAN: Interactive Point-based Manipulation on the Generative Image Manifold https://vcai.mpi-inf.mpg.

                                          「顔を右に」「口を開く」など画像の動かしたい部分をAIがいい感じに修正してくれるツール「DragGAN」のソースコード&デモが公開される
                                          shunkeen
                                          shunkeen2023/06/27非公開
                                          指示に従いつつ、画像がなめらかに変形するように、GANの潜在空間内の潜在変数を動かす仕組みだとすると、対応する変数のない画像は生成されないのかな。

                                          お知らせ

                                          公式Twitter

                                          • @HatenaBookmark

                                            リリース、障害情報などのサービスのお知らせ

                                          • @hatebu

                                            最新の人気エントリーの配信

                                          処理を実行中です

                                          キーボードショートカット一覧

                                          j次のブックマーク

                                          k前のブックマーク

                                          lあとで読む

                                          eコメント一覧を開く

                                          oページを開く

                                          はてなブックマーク

                                          公式Twitter

                                          はてなのサービス

                                          • App Storeからダウンロード
                                          • Google Playで手に入れよう
                                          Copyright © 2005-2025Hatena. All Rights Reserved.
                                          設定を変更しましたx

                                          [8]ページ先頭

                                          ©2009-2025 Movatter.jp