Movatterモバイル変換

soyokazeZZ id:soyokazeZZ

音声に関するsoyokazeZZのブックマーク (4)

無料・オフラインで音声・動画を文字として書き起こす「Vibe」、OpenAIのWhisperを使ってWindows・macOS・Linuxで動作可能でYouTubeにも対応
音声ファイルや動画からの文字起こしはAIによって簡単にできるようになりましたが、文字起こしができるAIをPCにセットアップするのはやや面倒です。オープンソースの文字起こしツールの「Vibe」はWindows・macOS・Linuxであれば誰でも簡単にインストール可能で、NVIDIA・AMD・Apple GPUで実行できるように最適化されています。Vibeを使えば完全にオフラインでの文字起こしが可能で、データがデバイスから外部に漏れることはありません。 Vibe. https://thewh1teagle.github.io/vibe/ thewh1teagle/vibe: Transcribe on your own! https://github.com/thewh1teagle/vibe Vibeは記事作成時点で、バージョン3.0.5がリリースされています。今回はWindows環境にイ
soyokazeZZ2025/08/01
音声
ai
動画
リンク
産総研：日本語音声基盤モデル「いざなみ」「くしなだ」を公開
発表・掲載日：2025/03/10 日本語音声基盤モデル「いざなみ」「くしなだ」を公開－少量の日本語音声データで高性能な音声AIを構築可能に－ポイント豊かな感情表現を含む6万時間の日本語音声データから2種類の日本語音声基盤モデルを構築モデルの改良が容易な「いざなみ」と感情認識や音声認識の能力がより高い「くしなだ」を一般公開少量データを活用した音声AIの構築・普及に貢献国立研究開発法人産業技術総合研究所（以下「産総研」という）人工知能研究センター深山覚研究チーム長、緒方淳客員研究員は、高性能な音声AI構築に利用可能な2種類の日本語音声基盤モデル「いざなみ」「くしなだ」を公開しました。音声基盤モデルとは、音声データを処理・解析するための汎用的なAIモデルで、音声認識や音声感情認識などに応用が進んでいます。音声基盤モデルの構築には、対象とする言語やそれが使われるシーンを想定
soyokazeZZ2025/03/14
ai
音声
リンク
文字を入力するだけで「萌え声」を簡単一発生成してくれる「Moe TTS」
萌(も)え声を出したくても出せない人でも簡単に簡単に萌え声を生成できる「Moe TTS」が公開されていたので利用してみました。Moe TTSは機械学習を用いて実際のゲームソフトの音声等を合成しており、機械学習でアプリケーションを開発するコミュニティ「Hugging Face」内で公開されています。 Moe TTS - a Hugging Face Space by skytnt https://huggingface.co/spaces/skytnt/moe-tts Moe TTSにアクセスするとこんな感じの画面が表示されます。そのまま上にスクロールすると文字の入力ボックスが現れます。デフォルトで「こんにちは。」と入力されていたので、今回はこれに続けて「今日も寒いですね。」と入力。そして、「Generate」をクリックします。すると、ページ下部に再生ボタンが現れます。そのまま再生ボタン
soyokazeZZ2022/11/15
webサービス
音声
リンク
音声合成業界に激震! もはや人間の喋り声、入力文字読み上げソフトVOICEPEAKはビジネス用途でも自由に利用可能
soyokazeZZ2022/02/18
dtm
音声
music
リンク
1