音声のテキスト変換 Web上にいくらでも情報があるWhisperでの文字起こしです。API使うとお金がかかるので、ローカル環境でDocker使って(Docker使えれば)手軽に実行できるのが特徴です。CPUでもGPUでも動きます。Apple SiliconMacでもLinuxでも多分Windows(WSL2)でも動きます。Dockerファイルや使うソフトはGitHubのリポジトリに公開しています。 この記事は上記リポジトリの自分のための使い方のメモです。 使い方 ファイル準備文字起こしする音声ファイルを用意します。ここではinput.mp3とします。Docker準備Dockerがない人は、Dockerをインストールしましょう。LinuxかWindows(WSL2)なら、とりあえず以下コマンドを実行すればOKです。Macの人はDockerデスクトップを使いましょう。 $curl
セミナーや会議の内容をテキスト化しておくと後から振り返りやすい。しかし、音声をテキスト化する、いわゆる文字起こしの作業は、長時間にわたるセミナーや参加者が複数いる会議などでは担当者の負担が大きい。そこで、文字起こしツールを利用する人も多いだろう。 筆者も職業柄、インタビューや講演の文字起こしをする機会が多く、文字起こしツールをいくつか使ってきた。現在は、今回紹介する「CLOVANote(クローバ・ノート)」を仕事の相棒として頼りにしている。 CLOVANoteは、LINEのAIテクノロジーブランド「LINE CLOVA」によるAI音声認識アプリだ。音声認識エンジンはLINE CLOVAが開発した「CLOVA Speech」が使用されている。2022年5月からベータ版として無料提供が開始された。 スマートフォンアプリ(iOS/Android)を起動し、アプリで録音した後に文字起こしするか
本記事は、あくまで個人的な使用を前提とした文字起こしの方法の紹介です。許可なく、他人のコンテンツを全部文字起こしして公開すると、著作物の改変などの問題になる可能性があると思います タイトル通りです。Whisperで文字起こしをしました。 ただ、以下のように句読点がない文章になってしまい、読みづらいです。 樋口 世界の歴史キュレーションプログラム コテンラジオ樋口 世界の歴史キュレーションプログラム コテンラジオパーソナリティーの株式会社ブック代表樋口清則 です深井 そして株式会社コテンの深井 隆之介です樋口 そして株式会社コテンの楊 英史です樋口 このラジオは歴史を愛し歴史 の面白さを知りすぎてしまった深井さんを代表とする株式会社 コテンのお二人と一緒に学校の授業ではなかなか学べない国内外 の歴史の面白さを学んじゃおうという番組ですよろしくお願いします これを修正するのは結構たいへんそうで
AI/人工知能を利用したチャットサービス「OpenGPT」のアプリ版が、ついに日本のApp Storeで公開されました。米国でのリリースに遅れること約1週間、それほど待たされずに済んだことに安心したiPhoneユーザも多いのではないでしょうか。 使いかたはWEB版と基本的に同じ、アカウント作成後に質問事項をキーボードで入力すればOK。ユーザインタフェースは英語ですが、質問文は日本語でOK。もちろん、ひらがな/カタカナや漢字も使用できます。畏まった言い回しは必要なし、ふだん会話しているときの感覚でかまいません。ChatGPTはWEBサービスで、エンジン部分はクラウド上に存在しますから、WEB版とアプリ版の機能は基本的に同じです。回答内容もほとんど違いはありませんが、アプリ版はAppライブラリから起動できたり、「ショートカット」で他のアプリと連携できたり、WEBブラウザより応用が利きます。2
IntroducingChatGPT for iOS:OpenAI’s latest advancements at your fingertips. This official app is free, syncs your history across devices, and brings you the newest model improvements fromOpenAI. WithChatGPT in yourpocket, you’ll find: · Advanced Voice Mode–tap the soundwave icon to have a real-time convo on thego, request a bedtime story for your family, or settle a dinner table debate. · Cr
米OpenAIは5月24日(現地時間)、1週間前に米国でリリースした「ChatGPT」公式アプリ(iOS)の配信をグローバルに拡大、日本を含む以下の45カ国での提供を開始した。 日本、アルバニア、アルジェリア、アルゼンチン、アゼルバイジャン、ボリビア、ブラジル、カナダ、チリ、コスタリカ、クロアチア、エクアドル、エストニア、フランス、ガーナ、ドイツ、インド、イラク、アイルランド、イスラエル、ジャマイカ、ヨルダン、カザフスタン、韓国、ニュージーランド、ニカラグア、ナイジェリア、クウェート、レバノン、リトアニア、モーリタニア、モーリシャス、メキシコ、モロッコ、ナミビア、ナウル、オマン、パキスタン、ペルー、ポーランド、カタール、スロベニア、チュニジア、英国、アラブ首長国連邦デスクトップ版と同様、iOSアプリでもChatGPTの基本的な機能を無料で体験可能。有料サブスクリプション「ChatGPT
OpenAIが高性能チャットAI「ChatGPT」のiOSアプリを公開しました。アプリではChatGPTとチャットできるほか、文字起こしAI「Whisper」を用いた音声入力にも対応しています。 Introducing theChatGPT app for iOS https://openai.com/blog/introducing-the-chatgpt-app-for-iosChatGPTの公式iOSアプリは、以下のリンク先で配布されています。OpenAIChatGPT on the App Store https://apps.apple.com/app/openai-chatgpt/id6448311069 ただし、記事作成時点ではアメリカでのみ公開されており、日本からアクセスしても「App入手不可能」と表示されてしまいました。 そこで、居住国をアメリカに設定したAppl
Web版と同様にログインして使う。有料版「ChatGPT Plus」ユーザーであれば、Web版と同様にGPT-4へのアクセスや新機能の早期利用などが可能だ。 また、昨年9月に発表したオープンソースの音声テキスト変換AI「Whisper」により、音声でのプロンプト入力も可能だ。 米Microsoftは2月に「新しいBing」のモバイルアプリ版をiOSおよびAndroid向けにリリースした。こちらは既に日本でも利用可能で、日本語での音声入力もできる。 現在App Storeで「ChatGPT」を検索すると、OpenAIのロゴに似たロゴを冠した類似アプリが多数表示される。OpenAIChatGPTは日本ではまだ公開されていないので、注意が必要だ。 関連記事ChatGPT Plusのプラグインを使ってみた 「食べログ」連携で実在店舗も案内可能にOpenAIは「ChatGPT Plus」のサー
米OpenAIは5月18日(現地時間)、対話AIサービス「ChatGPT」のiOSアプリ「OpenAIChatGPT」の提供を開始した。リリース時点では米App Storeのみでの配信になっており、数週間中に他の国・地域への展開を開始する。Android用アプリの開発を進めていることも明らかにしたが、具体的なリリース日程は公表していない。ChatGPTはユーザーが自然言語を使用してAIと対話し、質問の答えを得たり、コンテンツの作成のサポート、アイディアをふくらませるディスカッションなどに利用できる。OpenAIは、自然な形で対話できるAIを一般の人々に提供し、AIと人との関わりを通じてAI技術の恩恵を最大化することを目標にしており、「ChatGPT」アプリのリリースはその目標に向けた新たな一歩になる。 動作要件は、iPhone 8以降(iOS 16.1以上で動作)。iPadには最適化さ
ChatGPTAPIの使い方 実際にChatGPTAPIを使ってみましょう。openai-pythonのインストール 今回はOpenAIのPython用ライブラリであるopenai-pythonを使います。pipを用いて、openai-pythonをインストールしましょう。 pip installopenaiAPIリクエスト ChatCompletion.createで対話を生成できます。たとえば、以下のようなコードになります。 importopenaiopenai.api_key = "sk-..." #APIキー completion =openai.ChatCompletion.create( model="gpt-3.5-turbo", messages=[{"role": "user", "content": "こんにちは!"}] ) print(complet
Linuxはサーバーによく使われているのに加え、Windowsのようにパソコン用OSとしても利用できる。過去に挑戦して断念したことがある人も無理なく学べるように、ステップアップ式でLinuxを解説する。 Step 43 AIを使って人の顔を正確に検出する方法AI(人工知能)を使った顔検出の方法は数多く、主には(1)特徴量を人間が設計する手法、(2)特徴量を大量のデータからディープラーニングで学習する手法の二つがあります。「特徴量」とは、AIの分野では予測の手がかりとなる重要な数字のことです。例えば顔検出のような画像処理の分野では、「縦のシマが多い」「特定の色が多い」といった情報が特徴量となります。今回は、上記の二つの手法を実際に試して比較してみましょう。 顔検出に使う特徴量として有名な「ハールライク(Haar-like)特徴量」を使った手法を紹介します。ハールライク特徴量は、画像の明暗差
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く