YouTube・ニコニコ動画・Twitchなど数多くのストリーミングサービスからムービーをダウンロード可能な「youtube-dl」に新機能を追加しまくってさらに便利にしたプログラムが「yt-dlp」です。yt-dlpでは日々更新されるYouTubeの最新仕様に追従したり、ムービーにサムネイル画像を埋め込んだ状態でダウンロードしたり、YouTubeで年齢制限がかかっているムービーもダウンロードできたりとダウンロードアプリに求められる数々の機能が搭載されているので、実際にインストールしてムービーをダウンロードする手順を確かめてみました。 GitHub - yt-dlp/yt-dlp: A youtube-dl fork with additional features and fixes https://github.com/yt-dlp/yt-dlp ・目次 ◆01:yt-dlpのインスト
YouTubeチャンネルのすべてのムービーとメタデータをアーカイブすることができるツールが「Yark」です。ムービーをめちゃくちゃ簡単にローカルへ保存できるほか、ウェブブラウザを使ってオフラインの閲覧ページを表示することも可能です。 GitHub - Owez/yark: YouTube archiving made simple https://github.com/Owez/yark Yarkをインストールするためには、Pythonのバージョン3.9以降をインストールする必要があります。Pythonのダウンロードページにアクセスして、「Download Python 3.11.1」をクリックし、EXE形式のインストーラーをダウンロードします。ファイルサイズはWindows 64bit版で約24MBです。 ダウンロードしたインストーラーを起動します。一番下の「Add python.exe
「携帯動画変換君」を最初にリリースしたのが2004年10月10日。今日はちょうど20年目にあたります。そもそもこのアプリの更新自体も2005年には止まってますし、ずっとほったらかしていた&既に新規の需要もなく「過去の」ソフトウェアであることは間違いないので、20周年、とは言っても何をどうにかできるものでもないのですが。まあせっかくなので何かはしたいと思っていたんですよね。 サイトリニューアルをやろうとしたまず最初にやろうとしたのがサイトリニューアル。個人サイトMobileHackerzも、もうだいぶ古くhttps化すらさぼってました。サイト全体のSSL化はもはやずいぶん前に必須になったのにも関わらずめんどくさくて放置してたくらいで😅 コンテンツ管理も古いどころの話でないほど古いし、いっそのことモダンなCMSベースにサイト全体を作り直しちゃろか、20周年だし、みたいなことを最初はやろうとし
ffmpeg.wasmffmpeg.wasm is a pure WebAssembly / JavaScript port of FFmpeg enabling video & audio record, convert and stream right inside browsers! Data Securityffmpeg.wasm runs only inside your browser, data security is guaranteed as no data is sent to remote server. Powered by WebAssemblyffmpeg.wasm transpiles ffmpeg source code to WebAssembly code using Emscripten to achieve optimal performance.
VideoLAN/VLCプロジェクトのリード開発者として知られるJBことジャン=バティスト・ケンプ氏が、動画伝送における遅延を可能な限り低減するために設計されたリアルタイム制御SDK「Kyber」を発表しています。KyberはFFmpegやVLCなどのオープンソースプラットフォーム上に構築されており、クラウドゲーム、ロボット工学、ドローン、遠隔操作車両など、超低遅延が求められるアプリケーション向けに設計されています。 Ultra-Low Latency Video Control – An Interview with Jean-Baptiste Kempf of Kyber - Streaming Learning Center https://streaminglearningcenter.com/codecs/an-interview-with-jean-baptiste-kempf
オープンソースのマルチメディアフレームワーク「FFmpeg」の開発チームがコマンドラインツールのマルチスレッド化完了を報告しました。開発チームは一連の作業を「ここ数十年で最も複雑なリファクタリング」と表現しています。 FFmpeg CLI multithreading is now merged! https://t.co/uUJ0SF0opw— FFmpeg (@FFmpeg) December 12, 2023 FFmpegは非常に多くの種類の動画ファイルや音声ファイルを処理可能なマルチメディアフレームワークで、動画および音声ファイルの再生やトリミング、変換、圧縮など多様な操作が可能です。FFmpegは直接コマンドラインから使えるほか、数多くの動画再生ソフトや動画編集ソフト、ストリーミングサービスなどに組み込まれて広く利用されています。 FFmpegはエンコーダーやデコーダー、マルチプ
表の引用元:Available models and languages: openai/whisper -github.com Whisperを使ってみる Whisperは、MITライセンスのOSS版とAPI版の利用が可能です。それぞれを利用する方法を見ていきます。 以下は筆者の動作環境になります。 M2 MacBook macOS Sonoma 14.7 メモリ 16GB Python 3.11.5 [1] OSS版 OSS版のWhisperを利用するには、pipでインストールします。また、動画と音声を記録・変換・再生するためのコマンドラインツールFFmpegが別途必要です。FFmpegはほとんどのパッケージマネージャーから入手できますので、ご自身の環境にあった方法でインストールしてください。 Whisperでは音声データの読み取りにFFmpegを使用しているため、FFmpegが対応し
GoogleはAIを用いてセキュリティの脆弱(ぜいじゃく)性を見つけるシステム「Big Sleep」の運用で、これまでに様々な脆弱性やバグを見つけてきました。しかし、多くの報告が送られてくることから、オープンソースプロジェクトでは大きな負担となっています。有能な開発者が「他の作業ができない」として離脱する事態も発生していることから、マルチメディアフレームワークのFFmpegが「高給取りのエンジニアを抱える企業がボランティアに仕事を押し付けている」「本当にリスクを防ぎたいならGoogleがパッチを書いて送ってくるべき」「本気でバグをつぶしたいわけではなく検出&報告の実績を作りたいだけ」と苦言を呈しています。 FFmpeg to Google: Fund Us or Stop Sending Bugs - The New Stack https://thenewstack.io/ffmpeg-
VISUALLY CONSTRUCT FILTERSNo more unintuitive filter syntaxFFmpeg's filter syntax is unintuitive, ugly, and can get extremely complicated quickly. Build filters using a GUI which automatically generates the FFmpeg filter command for you. AUTOCOMPLETIONGo fasterImmediately get autocomplete feedback on which filters, arguments, etc... No more having to flip to the FFmpeg documentation and back.
マルチメディアフレームワークの「FFmpeg」に、ブラウザやアプリ間でリアルタイムの映像・データ通信を可能にする「WebRTC」(WHIP)対応の低遅延ストリーミング機能が統合されました。 git.ffmpeg.org Git - ffmpeg.git/commit https://git.ffmpeg.org/gitweb/ffmpeg.git/commit/167e343bbe75515a80db8ee72ffa0c607c944a00 WHIPはWebRTCを通じて超低遅延で映像を配信するための標準プロトコルです。WebRTCはもともとライブ会議などの超低遅延・双方向通信に使われてきましたが、プロトコルが複雑でアップストリームの配信には不向きでした。それを簡単にしたのがWHIPです。 従来のFFmpegは配信ソフト「OBS」などで採用される通信プロトコル「RTMP」やHLSによる数秒
ブラウン管や液晶ディスプレイ、スマートフォン、デジタルカメラでは、赤・緑・青の3種の三原色を組み合わせることで幅広い色を再現するRGBカラーモデルが採用されており、ウェブページや画像の色合いはRGBで「同じ色」になるように指定されています。しかし、ムービーの場合はそもそも同じRGBが出力されないという問題が存在するという点について、ビデオパフォーマンスモニタリングツールを販売するMUXが解説しています。 Your browser and my browser see different colors | Mux blog https://mux.com/blog/your-browser-and-my-browser-see-different-colors/ 色の見え方には観測者同士による差異が存在するため、デジタルの世界では色を定量化するために、赤(R)・緑(G)・青(B)をそれぞれ0
なお上記の「大量配信」とは、「1~3月分の四季版を4月15日から配信開始し、1週間で全家族に配信完了する」などのように、「新しい期間の1秒動画をはじめて配信してから、その時点で条件を満たす全家族への配信が完了するまで」の期間を指します。1秒動画の生成・配信の大部分はこの大量配信期間に行っていることから、これを「大量配信」と呼んでいます。 生成・配信の流れ 1秒動画の生成・配信は、図1のとおり(1)対象家族抽出、(2)素材選択、(3)動画エンコード、(4)配信、の4段階で実現しています。以下ではその詳細を説明します。 図1 1秒動画の生成・配信の流れ (1)対象家族抽出 1秒動画の生成・配信処理は、基本的にはバッチ処理として毎日実行しています。そのはじめに行うのは、「その日、どの家族に、どのバージョン・どの期間の1秒動画を生成・配信するか」を取り出す対象家族抽出です。この処理は四季版
マルチメディアツールの「FFmpeg」にOpenAIの文字起こしAI「Whisper」を用いた文字起こし機能が追加されることが明らかになりました。記事作成時点ではFFmpeg 8.0のリリースが準備中の段階で、文字起こし機能もFFmpeg 8.0に含まれる予定です。 [FFmpeg-devel] [PATCH] Whisper audio filter https://ffmpeg.org/pipermail/ffmpeg-devel/2025-July/346391.html FFmpeg 8.0 Merges OpenAI Whisper Filter For Automatic Speech Recognition - Phoronix https://www.phoronix.com/news/FFmpeg-Lands-Whisper FFmpegはオープンソースで開発されているマ
動画や音声を記録・変換・再生するためのフリーソフト「FFmepg」はシェルでコマンドを入力することでさまざまな処理を実行できます。FFmpegにはさまざまなフィルタリングライブラリが存在しますが、GUIを持たないツールであるため、フィルターをかけるとどんな出力結果になるのかをプレビューすることはできません。「FFmpeg Explorer」はブラウザ上でフィルターをブラウザ上で試してどんな結果になるのかをチェックし、さらに手元で実行するためのコマンドも出力してくれるウェブツールです。 FFmpeg Explorer! https://ffmpeg.lav.io/ FFmpeg Explorerにアクセスするとこんな感じ。中央下段にあるのは入力動画と出力動画で、指定したフィルターがどのように重なっていくのかが図で示される仕組み。サンプルとなる入力動画は、ネオナチ指導者のリチャード・B・スペン
マルチメディアフレームワーク「FFmpeg」のバージョン7.0(コードネーム:Dijkstra)が2024年4月5日に公開されました。FFmpeg 7.0では「ネイティブVVCデコーダーの追加」「IAMFのサポート」「CLIツールのマルチスレッド化」「非推奨APIの削除」といった変更が加わっています。 FFmpeg https://ffmpeg.org/#pr7.0 ????FFmpeg 7.0 "Dijkstra" has been released!???? It has a native VVC decoder, IAMF support and multi-threaded CLI tool alongside hundreds of other improvements and new codecs, features, APIs and bugfixes.https://t.c
These last two sometimes are referred to as "8 bit" or "10 bit" respectively, especially when talking about videos. That means 8/10 bits per single color channel. TransparencySome image formats support an additional channel together with the red, green, and blue components: the alpha channel. The alpha channel determines how transparent a single pixel is, and it can have different bit-depths, it i
動画ファイルをドラッグ&ドロップするだけで圧縮してくれるMac用ffmpegラッパー「CompressX」がリリースされています。詳細は以下から。 撮影した動画をWebサイトで公開/他のユーザーに転送する際にファイルのサイズを小さくしたい場合がありますが、そのような場合に動画ファイルをドラッグ&ドロップして[Compress]をワンクリックするだけでサイズを圧縮してくれるMacアプリ「CompressX」が新たに公開されています。 Welcome to CompressX We use FFmpeg under the hood to compress the video Step 1. Install FFmpeg on your Mac. We strongly recommend install it via Homebrew Step 2. Open Terminal, enter
ムービーや音声を扱うアプリで広く利用されているオープンソースのマルチメディアフレームワーク「FFmpeg」のバージョン5.0が公開されました。 FFmpeg 5.0 "Lorentz" https://ffmpeg.org/#pr5.0 FFmpeg 5.0 - Yet another blog for JBKempf http://www.jbkempf.com/blog/post/2022/FFmpeg-5.0 FFmpegはムービーのエンコーダーやデコーダーなどをまとめたライブラリ群で、数多くの形式のムービーファイルを処理できることから高い人気を得ています。エンコーダーやデコーダーといったムービーファイルに関する基本的な用語については、以下の記事で詳しく解説しています。 動画をデジタルで扱うための基本知識まとめ、映像や音声はどうやってPCで処理されているのか? - GIGAZINE
Zero Dependencies: Built purely with the Python standard library, ensuring maximum compatibility and security. User-Friendly: Simplifies the construction of filter graphs with an intuitive Pythonic interface. Comprehensive FFmpeg Filter Support: Out-of-the-box support for most FFmpeg filters, with IDE auto-completion. Integrated Documentation: In-line docstrings provide immediate reference for fil
はじめに 音声の文字起こしは、会議の議事録作成、インタビューの書き起こし、動画コンテンツの字幕作成など、様々な場面で必要とされる作業です。クラウドベースの文字起こしサービスは多数存在しますが、料金がかかったり、プライバシーの懸念があったりします。 本記事では、OpenAIが公開しているオープンソースの音声認識モデル「Whisper」を使って、完全無料でローカル環境で動作する文字起こしツールを構築する方法を解説します。インターネット接続不要で、プライバシーを確保しながら高精度な文字起こしが可能です! 以下のレポジトリからローカルに環境構築して実行することでwhisperを使用できます! Whisperとは? Whisperは、OpenAIが2022年9月に公開したオープンソースの音声認識モデルです。以下の特徴があります: 多言語対応(日本語を含む80以上の言語) 複数のモデルサイズ(tiny
ffmpeg で GPU エンコードできるようにする 以前 ffmpeg を使ってコマンドラインから動画をエンコードする方法をまとめた。その際、GPU エンコードが上手くいかなかったので放置していたのだが、再トライしてみた次第。 過去記事 : ffmpeg で mkv 形式の動画を H.264 mp4 に変換してみた h264_nvenc (や nvenc_h264) で GPU エンコードできるようだが、自分が試した ffmpeg では上手くいかなかった。何かビルドしたりしないといけないらしい。面倒なので放置 当時どう上手くいかなかったのかというと、以下のようなエラーメッセージが出て異常終了していた。 driver does not support the required nvenc api version. required 11.1 found 11.0 割と簡単に何とかなったので
About ffmprovisr Making FFmpeg Easier FFmpeg is a powerful tool for manipulating audiovisual files. Unfortunately, it also has a steep learning curve, especially for users unfamiliar with a command line interface. This app helps users through the command generation process so that more people can reap the benefits of FFmpeg. Each button displays helpful information about how to perform a wide vari
Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? はじめに みなさんは動画編集をやったことはありますか? 私は,頻度は低いものの動画編集をして動画投稿サイトに動画をアップロードした経験があります. 動画編集とは元来めんどくさく手間がかかるものではあるのですが,普段からWebアプリの開発をしている私は,以下のようなことを考えていました. HTML/CSSのように複数オブジェクトを一つのコンポーネントのように扱えたら,CSSのように統括して装飾を指定できたら,HTMLのレンダラー(ブラウザ)が相対値から計算して幅や高さを指定するように,動画のオブジェクトの時間長も編集アプリが計算して指定し
ffmpeg-python ffmpeg-pythonはffmpegをpythonから使えるようにするパッケージです github https://github.com/kkroening/ffmpeg-python API-reference https://kkroening.github.io/ffmpeg-python/ 使用例 https://github.com/kkroening/ffmpeg-python/tree/master/examples 1. インストール ffmpeg-pythonはsubprocessでCLIからffmpegを実行するwrapperのみのパッケージなので、別途本体をダウンロードしてきてPATHを通しておく必要があります。 1-1. ffmpegをインストールする 公式サイトからインストーラーをダウンロードしてきて入れます https://ffm
概要 ffmpegを使ってサクッとデスクトップ画面+音声をキャプチャしてファイルに保存します。実行環境はWindows 10を想定しています。 デスクトップをキャプチャする ffmpegではgdigrab(Linuxではx11grab)を使うことでデスクトップ画面をキャプチャできます。 オプションの解説 video_size 無指定だと画面全体をキャプチャします。このオプションを指定すると画面の左上を基準に指定した範囲をキャプチャします。 framerate キャプチャ動画のフレームレートを指定します。 f, i -fオプションにgdigrabまたはx11grabを指定し、-iオプションにdesktopを指定することでデスクトップ画面をエンコードの入力映像として指定します。 vcodec 出力ファイルのコーデックを指定します。画面キャプチャはリアルタイムでの処理が要求されるため、出力設定に
ムービーの無劣化結合や多種多様な形式への変換などの機能を備えたマルチメディアフレームワーク「FFmpeg」のバージョン6.0が2023年2月27日(月)にリリースされました。FFmpeg 6.0ではQSVやNVENCといったハードウェアエンコーダーを用いたAV1エンコードが可能になった他、スレッド処理の効率化に伴う動作高速化などの改善が盛り込まれています。 FFmpeg http://ffmpeg.org/index.html#pr6.0 FFmpegはオープンソースで開発されているマルチメディアフレームワークで、「ムービーを別のフォーマットに変換」「複数のムービーを無劣化で結合」「複数枚の画像をムービーファイルにまとめる」「ムービーの解像度やフレームレートを変更」「ムービーの一部を切り出し」「ムービーから音声を抽出」など、ムービーや音声関連の多種多様な機能を備えています。 FFmpegは
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く