Movatterモバイル変換


[0]ホーム

URL:


LoginSignup
45

Go to list of users who liked

35

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

【脱キーボード】Open Super Whisperで極上の文字起こし体験を手に入れる方法

Last updated atPosted at 2025-04-21

はじめに

長い文章をキーボードで打つのはもう古い!
ChatGPT や Claude への質問、ブラウザ検索、コードレビューコメント――あなたが "今まで手入力していたテキスト" を、声だけで瞬時に入力してみませんか?

世界の音声認識/API 市場は 2024 年時点で約 38 億ドル、今後も年 14 % 超 の成長が見込まれています。その牽引役となっているのが AI 文字起こしツールです。

本記事では、Super Whisper(本家) と、OpenAI API キーひとつで同じ快適さを提供する OSS 版Open Super Whisper(今回開発したアプリ) を比較しながら、最速の導入方法と "AI と対話するための最強入力デバイス" としての活用術を紹介します。

25/06/17 追記💡 音声入力でAIエージェントを動かすデスクトップアプリを作ったんだなも
https://qiita.com/hmkc1220/items/3dea024f489b9d9a24af

1. Super Whisper とは?

1‑1. 概要

Super Whisper は、OpenAI の "Whisper" モデルをローカルに最適化したデスクトップアプリ。グローバルホットキー で瞬時に録音・文字起こしが行え、データは PC 内で完結するためプライバシー高速性 が両立しています。

1‑2. 主要な魅力

機能体験のメリット
🔑グローバルホットキーアプリを切り替えず録音開始/停止。集中が途切れません
🔒オフライン処理対応通信せずに変換→機密情報も安心
🌐100+ 言語対応※1多国籍チームでもそのまま議事録化
✍️カスタム語彙固有名詞や専門用語を追加して WER を削減
Apple Silicon 最適化M1/M2/M3 の GPU & Neural Engine で Whisper v3 を高速推論※2

🎥使用感をチェック

料金 (2025‑04 現在)

プラン価格備考
Free$0 / 月小モデル無制限・録音 15 分 / 日相当
Pro$8.49 / 月すべてのクラウド/ローカルモデル利用可
Lifetime$249 / 買切り一度の支払いで Pro 機能を永続利用

※1 オフラインは Whisper の言語カバレッジ依存。Windows β はクラウドモデル推奨。
※2 Intel Mac / Windows では CPU 推論(速度は Apple Silicon 比で低下)。

2. Open Super Whisper を作った理由

「サブスク契約せずに、手元の OpenAI API キーで同じ UX を実現できないか?」

そう考えて OSS として開発したのがOpen Super Whisper です。ローカル GUI は PyQt6、変換はWhisper‑1 / GPT‑4o‑Transcribe など API 経由 に切り替えたことで、以下のメリットが生まれました。

  • 🔄モデルをいつでも最新に ― Whisper‑1 → GPT‑4o‑Transcribe (2025/03 リリース) へワンクリックで変更可
  • 💰初期費用ゼロ ― 従量課金なので使った分だけ。音声入力お試し勢にも◎
  • 🖥Windows / macOS / Linux に対応 ― OS ごとに PyInstaller でビルドしたバイナリを配布

Windows 版について
Super Whisper 本家は 2025‑04‑21 時点で Windows 版を「Early Access (β)」として提供中。Open Super Whisper は Python アプリのため Windows でも問題なく利用できます。

3. アプリ構成 ✨

open-super-whisper/├─ src/│  ├─ core/                 # 音声録音、API 連携、ホットキー│  │  ├─ audio_recorder.py   # sounddevice│  │  ├─ hotkeys.py          # pynput│  │  └─ whisper_api.py      # OpenAI Speech to Text API│  └─ gui/                  # PyQt6 ベースの GUI│     ├─ components/         # ダイアログ、│     ├─ resources/          # アイコン、画像ファイル│     ├─ windows/            # メインウィンドウ、設定画面等│     ├─ utils/              # GUI 関連ユーティリティ│     └─ main.py             # GUI アプリケーションのエントリポイント├─ dist/                     # OS 別ビルド成果物├─ main.py                   # アプリケーション起動スクリプト└─ README.md / README.ja.md  # 説明書

技術スタック

LayerTech
GUIPyQt6
Hotkeypynput
Audiosounddevice
APIopenai
BuildPyInstaller (--onefile --windowed, OS ごとにビルド)

4. 主要機能 (Open Super Whisper)

  • 🎙️ワンタップ録音 (デフォルト:Ctrl +Shift +R)
  • 🌎100+ 言語 & 自動検出 ― Whisper API が自動判定
  • 📝カスタム語彙 ― GUI で CSV をインポート
  • 🧠システム指示 ― "XX 用語は英語表記に" などを事前付与
  • 📋自動クリップボード ― 完了後に即ペースト可能
  • 録音タイマー & ステータスアイコン

5. 対応モデル一覧 (2025‑04 時点)

モデル用途特徴料金
Whisper‑1汎用OSS Whisper v2 相当$0.006 / min
GPT‑4o‑Transcribe高精度雑音環境・多言語で WER 改善$0.006 / min
GPT‑4o‑Mini‑Transcribe軽量レイテンシとコストのバランス$0.003 / min

ベンチマーク
OpenAI 公開テストでは、GPT‑4o 系はいずれも Whisper‑large v3 より低 Word Error Rate (WER) を達成しています。

6. インストール & 初期セットアップ

  1. GitHub Releases から OS に合わせたバイナリ (例:OpenSuperWhisper.exe) をダウンロード
  2. ダブルクリックして起動 (インストール不要・ポータブル)
  3. 初回起動時ウィザードでOpenAI API キー を入力すれば準備完了

7. デモ

demo

録音 → 文字起こし → クリップボードコピーまでが 10 秒以内。テキスト入力が “手打ち” から “ワンクリック貼り付け” に変わります。

8. まとめ & コールトゥアクション

  • Super Whisper で "プライバシー & 速度" を体験
  • Open Super Whisper で "OSS & API の自由度" を手に入れる

GitHub で Star / Issue 大歓迎 — みなさんのフィードバックが次の機能を生みます!

リンク集

🤝最後までお読みいただきありがとうございます! この記事が "文字起こしツール選び" の参考になれば幸いです。

45

Go to list of users who liked

35
4

Go to list of comments

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
45

Go to list of users who liked

35

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?


[8]ページ先頭

©2009-2025 Movatter.jp