アリババのAIモデルの発表攻勢が続いています。動画生成AI分野では、7月末に発表した「Wan2.2」に続き、8月中旬に画像や動画を参考にしながら制御を可能にする派生モデルの「Wan 2.2 Fun Control」、さらに、8月27日には音声と画像から動画を生成する「Wan2.2 S2V」をリリース。いずれも性能の高さを保ちながら、オープンモデルとして公開されており、量子化(圧縮)モデルであれば、ローカルPC上でも動かすことができるのが魅力的です。それぞれのツールの持つ実力を試しました。 FunControl:参照動画で“動き”を精密制御 Wan 2.2 Fun Controlは、人物やキャラクターの画像と動画情報をリファレンス情報として入力すると、ControlNetの輪郭線(Canny)、深度(Depth)、ポージング(OpenPose)、さらに軌道制御(Trajectory Cont

アリババの動画生成モデル「Wan2.2 14B」i2vを使い、明日来子さん(この連載によく登場する作例キャラクター)に銃を構えさせた動画の一部(筆者作成) 7月28日に公開された中国・アリババの動画生成AIモデル「Wan2.2」がすさまじい性能を発揮しています。ローカルPC環境で利用できるオープンモデルとして公開されましたが、ヘタな商用AIクラウドサービスを超えていると感じさせるほど、高品質なAI動画が生成可能です。2月リリースの「Wan2.1」でも高い評価を得ていましたが、それを遥かに超えており、業界を席巻しそうな雰囲気を感じました。 ※記事配信先の設定によっては図版や動画等が正しく表示されないことがあります。その場合はASCII.jpをご覧ください 実写もアニメも高性能 Wan2.2の性能の高さは触れば触るほどわかってきます。カップ麺、箸、麺など、複数のオブジェクトが関わるため、画像や


今北産業 今すぐ AliExpress で MS2130 で検索して出てくるやつを買え USB3.0, YUV422 1080p60, ステレオ音声 ちょうど3年前くらい (!) にこういうのを書いて、 polamjag.hatenablog.jp そこそこ反響があったわけですが、このとき紹介したMacroSilicon MS2109 の続編的なチップが出ていることに (今更) 気づいたという話。その名も MS2130。 AliExpress で MS2130 で検索するとそこそこ出てくる。送料込みで 1500〜3000 円程度といったところか。相場感が MS2109 と変わらないのはマジで何なんだという感じである。 MS2130 - Buy MS2130 with free shipping on AliExpress 例によってMacroSilicon 社のサイトではまだスペックは

YouTube、Twitch、Netflixなどあらゆるウェブサービスにある古いぼやけた動画を、RTX 30シリーズおよびRTX 40シリーズのGPUでアップスケールして視聴できるようにするドライバー「RTX Video Super Resolution(VSR)」をNVIDIAがリリースしました。 Pixel Perfect: RTX Video Super Resolution Now Available | NVIDIABlog https://blogs.nvidia.com/blog/2023/02/28/rtx-video-super-resolution/ RTX Video Super Resolution FAQ | NVIDIA https://nvidia.custhelp.com/app/answers/detail/a_id/5448 Nvidia’s late

米Googleの研究部門Google Researchは10月5日(現地時間)、短い文章から動画を生成するAIシステム「Imagen Video」をサンプルを添えて発表した。「車を運転するパンダ」「静かな湖面に落ちた紅葉がImagen Videoの形に浮かぶ」など、文章から生成した多数の動画を披露した。 Imagen Videoは、同社が5月に発表した文章から画像を生成する「Imagen」に基づいている。Imagenは「拡散モデル」で、多数の既存のデータサンプルを使って“破壊”と“回復”の方法を学習することで、新たなデータを生成する。 Imagen Videoの動画生成の流れは大まかには、文章を受け取ったAIが24×48ピクセルで16フレーム、毎秒3フレームの動画を生成し、この動画から追加のフレームをアップスケールして予測して最終的には128フレーム、毎秒24フレームの720pの動画にする

どうもこんにちは、あんどう(@t_andou)です。 前回宣言した通りに誰でも簡単にYoutubeの字幕ファイルを作る方法を書きます。 「Youtubeの」と書いていますが、実際はどの動画でも対応してます。 前回の記事blog.takuya-andou.com まずはGoogleColabの共有colab.research.google.com 使い方GoogleColabに記載していますが 1.GPUを使用するように切り替え 上の「ランタイム」→「ランタイムのタイプを変更」からからGPUを選択 2.右上の接続 下のセルを実行すると自動的に接続されるので省略可能です 3.動画をアップロード ここにドラッグ&ドロップでアップできます 大容量のデータの場合、GoogleDriveと連携した方が効率的です 4.入出力のパスの変更 ファイル名に合わせて変更してください 5.全セルを実行 あと

Make-A-Video is a state-of-the-artAI system that generates videos fromtext. Make-A-Video researchbuilds on the recent progress made intext-to-image generationtechnology built to enabletext-to-video generation. The system uses images with descriptions to learn what the world looks like and howit is often described.It also uses unlabeled videos to learn how the world moves. With this data, M

A model for generating videos fromtext, with prompts that can change over time, and videos that can be as long as multiple minutes. Read Paper The water is magical Prompts used: A photorealistic teddy bear is swimming in the ocean at San Francisco The teddy beargoes under water The teddy bear keeps swimming under the water with colorful fishes A panda bear is swimming under water Chilling on the
次世代の画像フォーマットとして注目されているWebPとAVIF、Webサイトやアプリでよく使用されるSVG, PNG, JPG, GIFの変換・軽量化・最適化ができるオンラインツールを紹介します。 IEのサポートがなくなると、WebPが画像フォーマットの主流になりそうですね。 Optimize Images Optimize Imagesは、画像(SVG, PNG, JPG, GIF)の最適化と圧縮、画像の新しいフォーマット(WebPやAVIF)への変換と最適化が簡単にできるオンラインツールです。 WebPとAVIFは高い圧縮率を備えたフォーマットです。 WebPは簡単に言うとPNG, JPG, GIFの良いとこ取りのフォーマットで、24ビットのフルカラーをサポートしています。高画質の透過PNGのサイズが大きくなってしまうことやGIFアニメーションで色数が少ない悩みも解決します。IE以外の

X(旧Twitter)で @TeamYouTube をフォローすると、最新情報やフランス語およびロシア語での質問への回答を受け取ることができます。YouTube がサポートいたします。 2021 年 7 月 23 日より、今回の変更を無効にするよう選択した場合を除き、古い限定公開動画は非公開になりました。この措置は、2017 年 1 月 1 日より前にアップロードされた限定公開動画に対するセキュリティ アップグレードの一環として行われました。2017 年 1 月 1 日以降にアップロードされた限定公開コンテンツは、今回の変更の影響を受けていません。 限定公開動画と限定公開再生リストは、リンクを知っているユーザーのみが表示し、共有できます。限定公開動画は他のユーザーがあなたのチャンネル ページの [動画] タブを開いても表示されません。また、他のユーザーによって限定公開動画が公開再生リスト
Brett Foxwellは、制作に10年を費やした大作動画を投稿してくれた。FABRICATED(製造された)と題されたこのストップアニメーションは、人間がいなくなった想像上の未来を描いている。キャラクター、セット、さらにはカメラの動きを滑らかにするリグまで、映像に出てくるあらゆるものをBrett本人が作っている。 下のメイキング動画でも説明されているが、彼が生活をしているアパート全体をセットが占領していた。引っ越しを何度か行なっているが、そのたびに、すべてのセットを新しい部屋に移動させなければならなかった。 しかし私は、現実に、どのように作ったのかを知りたくなった。アパート暮らしでは、工作機械を置くことも難しいだろう。どのようにして、あの金属部品を作ったのかを聞いてみた。 アパートでは機械工作はしていません(部屋全体が撮影セットになっていましたから)。幸運にも私は、長年、終業後に工作機

先日「ネットビジネスイノベーション政策フォーラム」というエントリーのおまけで書いていた「Ustream/Twitter時代の勉強会・講演会の注意点」ですが、膨大になってきたので別エントリーにしました :)
CamStudio でキャプチャしたデスクトップの動画を早回しにしてみる。 CamStudio は,WindowsPC のデスクトップをキャプチャして動画ファイルを作るソフトである (CamStudio - Free Screen Recording Software)。フラッシュ swf 形式の出力もできる (nlog(n): 4BALLS にハマる)。 CamStudio で長時間の録画ができなくて困っているというコメントがあったので (nlog(n): CamStudio 2.0 のバグ),試しにやってみることにした。Windows Vista Business SP1, CamStudio 2.0 の環境で,部分キャプチャを試してみたところ1時間の録画は問題なくできることがわかった。画像サイズを 248x168 にしたところ,約1時間の録画で 121 MB の AVI ファイル

英国の映画雑誌Empire は、ストーリーが悲惨で救いがなく見た後に憂鬱な気分だけが残るような作品による「落ち込む映画トップ 10」を発表した (Empire の記事、eiga.comの記事より) 。 第 1 位は「レクイエム・フォー・ドリーム」で、eiga.com の紹介によると「米コニーアイランドの寂れたアパートに住む孤独な女性と、ドラッグ中毒の息子が辿る哀しい人生の顛末」を描いた作品。Empire 誌は「これを見たらビールを飲んで、もう二度と見ないと誓うこと」とアドバイスしている。また、日本の映画では第 6 位に「火垂るの墓」がランクインしている。Empire 誌が選んだ「落ち込む映画トップ 10」 第1位「レクイエム・フォー・ドリーム」 (2000)第2位「ひとりぼっちの青春」 (1969)第3位「リービング・ラスベガス」 (1995)第4位「道」 (1954)第5位「21グラ
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く