当ブログではアフィリエイト広告を利用しています
なぜオジサンは一人でブツブツと喋るのか。
それは、音声入力こそが最強のプロンプトを生み出すからである。
両手をキーボードから解放する時が来た。
さっそくChatGPTを開き、iOSのマイクから音声入力を起動したら、

「本しゃぶりというブログにChatGPTの使い方について、面白そうな記事があったのでメモ。なんか音声入力を使うといいらしい。これまで話した内容について整理し、マークダウンで出力して」
と喋っておこう。誤字脱字などの修正をせずに投稿すればいい。
以上。
生成AIをうまく使いたいならば、詳細なコンテキストを与えるのが良い。しかし、ここに大きな問題があった。
人間というものは楽をしたがる生き物である。特にAIに助けを求めるような人は、なおさらだ。文章を入力することに面倒くささを感じ、つい最小限の指示で済ませてしまう。その結果、生成されるものは的外れになり、何度もやり取りを重ねるので時間がかかる。
このジレンマを解決する鍵となるのが、音声入力だ。やはり人間にとって最も自然なコミュニケーション手段は「話す」ことなのだ。口頭ならば無理なく多くの情報を伝えられ、AIは適切な回答を返してくれる。
具体的にどうなるのか、実例を見てみよう。

長いので以下省略。キーボード入力ではこんなことやってられないが、音声入力だと簡単にやれてしまう。全文を読みたい人はここから元のやりとりへ飛べる。
ChatGPTの出力結果は以下だ。

これはそのまま使えるから以下に貼ろう。
…………
…………
これ以上、書くことあるか?
とはいえ細かい点は概要だけだと分かりにくいと思うので、実践するための具体的な工夫に関しては説明するか。
ただChatGPTに話しかけるだけでもいいが、使っている中で「こうするともっと楽」というのが分かったので共有しよう。
効率的な音声入力の核となるのは、スマートフォンを入力専用端末として使うことである。なぜスマートフォンなのか。それは常に携帯でき、OSの標準機能として高精度な音声入力が利用可能だからだ。しかも、片手で操作できる手軽さは、アイデアを即座に記録する上で決定的な意味を持つ。
さらに参考資料や情報の確認が必要な場合は、入力に使っているスマホではなく、PCやタブレットなどを追加の端末として用意するのだ。それは同一端末で画面を切り替えると、入力の流れが途切れてしまうからである*1。PCの前にいるときも入力はスマホで行い、PCは資料参照に使うのが良い*2。もちろんChatGPTの回答を確認する際にPCで見るのはOKだ。
音声入力を効率的に行うための重要な要素が、ヘッドセットの活用である。ここで注目すべきは二つのポイントだ。
一つ目は両手の自由である。音声入力中も両手を使えることで、作業を中断することなくアイデアを記録できる。しかし、それ以上に重要なのが二つ目のポイント、常時装着という考え方なのだ。
なぜ常時装着が重要なのか。それは準備の手間を省くためである。「メモを取ろう」と思い立った時に、イヤホンを取り出してスマートフォンと接続する、という作業が発生すれば、その時点で思考は中断されてしまう。アイデアは待ってくれない。だからこそ、メモを取りたいと思った瞬間には、すでに入力の準備が整っている状態が必要なのだ。
この常時装着を実現する上で、骨伝導イヤホンなどのオープンイヤー型のヘッドセットが特に効果的である。これらは長時間の装着でも負担が少なく、外界の音も聞こえるため、日常的な作業の邪魔にならない。俺の場合はShokzのOpenRun Pro 2 miniを使っている。骨伝導の割には音質が良く、マルチポイント接続対応。充電もUSB-Cになった。
骨伝導イヤホンについて知りたい人は以下を参照。
骨伝導が苦手な人は上の記事のブコメで人気だったFreeClipや、付け心地に定評のあるNothing Ear (open)などを使えばいい。マイク付きイヤホンなら何でもOKだ。大事なのは常時着用である。
俺の場合、ChatGPTに作ってもらった内容をそのまま放置するのではなく、ちゃんとObsidianで管理したいと考えている。だが、そのためにはいちいちアプリを開いてChatGPTと会話し、その出力をコピーしてObsidianに保存する必要がある。この一連の作業を毎回繰り返すのは、実にダルい。
そこで俺は、この問題を解決するためにiOSのショートカット機能を使って自動化することにした。つまり、手作業で行っていた一連の流れを、最小限の操作で完了できるようにしたのである。
具体的な処理の流れは以下の通りだ。
入力のトリガー
AIによる処理
ファイル生成と保存
デイリーノートとの連携
即時利用のための処理
流れを図示すると以下となる。

実際の画面はこんな感じ。


マジで楽すぎてバカになりそう。
音声入力と生成AIを組み合わせることで、アイデアの記録から保存までのプロセスが自動化された。これにより思考から記録までの心理的・時間的障壁を最小限に抑えられるので、メモが捗る。実際、通勤中や入浴時など、ふと何かを思いついた時に、iPhoneに向かってバーッと喋るだけでメモが完成する。順番や構成なんて気にする必要はない。思いついたことを、ただひたすら話すだけでいいのだ*3。
これが日々のnote更新を劇的に楽にしてくれている。ちょっとした隙間時間に、アイディアを声で書き留めておけば、後でそれを元に簡単に記事化できるのだから。
なんなら、この記事こそが証拠になっている。これまでは雑誌連載の締め切りに追われ*4、なかなかブログ記事を書く時間が取れなかった。だが、今は違う。音声入力を活用したことで、このようにブログ記事を更新できるのだから。

今回の手法は以下を参考にした。
この手法を知ったのはハイパー起業ラジオの以下の回。生成AIと音声入力を組み合わせて、たった15分程度でポッドキャストの台本を作り上げたという。
この手法を聞いた時、なぜ自分で気づけなかったのかという悔しさが込み上げてきた。
なぜなら、俺自身がChatGPTの会話モードで似たようなことをやっていたからだ。散歩中のアイデアや旅の体験を話しかけて整理してもらい、それを文章化してもらっていた*5。しかも、音声入力自体にも以前から興味があって、勝間和代の「手入力より圧倒的に早い」という言葉に惹かれて、実際に試してみたこともある。
だが、そこで思考は止まってしまった。テキスト入力で考えを整理する習慣が染みついていて、まとまった文章を話すのが難しい。専門用語の認識精度の問題もあって、結局「慣れたキーボードのほうが楽だ」と諦めてしまったのだ。
考えてみれば、それは単なる思い込みだった。生成AIは不完全な入力でも文脈を理解して補正してくれる。完璧な音声入力など必要なかったのだ。「テキスト入力欄に音声で入力するなんて」「音声を使うのは会話モードでやるもの」──そんな固定観念が、目の前にあった可能性を見えなくしていたのである。
今回のネタは知っている人にとっては今更だろう。実際、検索してみたら勝間和代は1年前に挑戦していた*6。だが俺は気が付かなかったし、今回知ったときは「もっと早く教えてくれよ」と思ったので書くことにした。
以下の二つを組み合わせることで、ChatGPTとの連携とObsidianへの保存ができた。
前者の記事では音声入力専用のためWhisperを使っているが、俺はURLをコピペしたかったのでテキスト入力欄を表示させ、音声入力はiOSのを使っている。
以下は投げ銭のコーナー。支払った人には上で紹介したiOSショートカットの最新版をプレゼント。Obsidian用ではあるが、使っていなくてもiCloud DriveにMarkdown形式で保存されるだけでも価値はあると思う。プロンプトが古いバージョンはnoteで配布している。
注意
2025/04/08の深夜に、ショートカットリンクが軒並み繋がらない事態が発生しました。その後に復旧しましたが、念のため購入前に以下のテスト用リンクを踏み、DLできることを確認することをおすすめします。
*1:最初PCで音声入力していて、別の記事を参照しようとクリックした瞬間に入力が止まったのはショックだった。
*2:逆にいえばPCは資料参照専用に使えるので、マルチディスプレイが使えない環境でも画面を細かく切り替えなくていいのが助かる。
*3:あまりにも音声入力×生成AIが楽すぎるので、会社でもブツブツ喋るおじさんになっている。
*4:最新会の話はこれ週プレでチョコレートについて書き、ココアを飲む|honeshabri
*5:年末年始の旅行でも大活躍だった旅行中でのChatGPTの使い方3つ|honeshabri
id:honeshabriはてなブログPro自由気ままな読書ブログなので、厳密な考証は行っていない。内容は諸説ある。週刊プレイボーイで「書評ブロガー・骨しゃぶりの『〇〇の文化史』ぜんぶ読む」を連載中。
当ブログは、Amazon.co.jpを宣伝しリンクすることによってサイトが紹介料を獲得できる手段を提供することを目的に設定されたアフィリエイトプログラムである、Amazonアソシエイト・プログラムの参加者です。
また、第三者配信の広告サービス(Googleアドセンス)を利用しています。
広告配信事業者は、ユーザーの興味に応じた広告を表示するためにCookieを使用することがあります。(氏名、住所、メール アドレス、電話番号は含まれません)
Cookieを無効にする設定およびGoogleアドセンスに関する詳細はこちらをご覧ください。
本サイトでは、サイトの分析と改善のためにGoogleアナリティクスを使用しています。
そこでデータ収集のために生成されるCookieを通じて、お客様のIPアドレス等の情報の一部をGoogleが読み取る場合があります。利用者は本サイトの閲覧にあたって、以上のGoogleが行うデータ処理について許可を与えたものとします。
このようなアクセス情報の収集方法および利用方法については、「Google アナリティクス利用規約」「プライバシー ポリシー – ポリシーと規約 – Google」によって定められています。
引用をストックしました
引用するにはまずログインしてください
引用をストックできませんでした。再度お試しください
限定公開記事のため引用できません。