言葉の壁は今日のボーダーレス社会において大きな課題です。この壁を克服するため、現在NICTでは、内閣府・総務省と共同で社会還元加速プロジェクト「言語の壁を越える音声コミュニケーション」をMASTARプロジェクト (プロジェクトリーダー: 中村 哲)において進めています。 NICTで、これまで研究開発を行ってきた多言語の音声翻訳技術の成果として、21言語を対象とした音声翻訳、テキスト翻訳のソフトウェアを、性能評価・ユーザビリティ調査を目的として、iPhone用に世界規模で公開しました。 音声入出力で会話ができる音声翻訳のソフトウェアと、文字入力の翻訳ソフトウェアの2つのiPhoneソフトウェアを、App Store(アップストア)からダウンロードできます。翻訳処理は、ネットワーク型で構成されており、サーバーに送られて高速、高精度に処理された後、iPhoneに結果が出力されます。 App
(ニュースリリース) 2012年1月30日 コミュニケーションのバリアフリー化を実現する「こえみる」を開発 ~ろう学校でのフィールド実験の開始~ 日本電信電話株式会社(本社:東京都千代田区、代表取締役社長:三浦 惺、以下NTT)は、NTTの研究所が開発した音声認識技術を核とするバリアフリーコミュニケーションシステム「こえみる」(図1 )を開発しました。 「こえみる」を利用する事により、障がい者を対象に学校等の教育現場において、先生が話した言葉を児童生徒の手元にあるタブレット端末に“文字”としてリアルタイムに表示させることを可能とします。本システムを活用した情報保障※1環境の実現に向け、本日より、ろう学校にてフィールド実験を開始します。 1.背景・目的 ICTは、情報コミュニケーション手段として社会生活に大きな影響をもたらし、様々な活用がされています。一方、身体的条件により、ICTの恩恵を享
発表・掲載日:2011/10/12 インターネット上の動画音声データの検索・書き起こしシステムを実現 -動画中の発言内容を音声認識でテキストに書き起こして全文検索が可能に- ポイント 動画共有サービスの動画中の音声を認識して全文検索できるウェブ上のサービスを公開 誰でも簡単な操作で音声認識誤りを訂正して読みやすい書き起こしを作成できる 日本語に加えて英語の動画音声データの検索・書き起こしにも対応 独立行政法人 産業技術総合研究所【理事長 野間口 有】(以下「産総研」という)情報技術研究部門【研究部門長 関口 智嗣】後藤 真孝 上席研究員 兼メディアインタラクション研究グループ 研究グループ長と緒方 淳 研究員らは、ユーザーに協力してもらうことで日々性能が向上する音声情報検索技術を開発し、インターネット上にある日本語と英語の動画音声データ(動画共有サービスやポッドキャストによって公開されてい
会員限定サービスです 有料会員(月額プラン)は初月無料! お申し込み 会員の方はこちら ログイン 日経クロステックTOPページ
音声認識を紹介するページ とにかくここでは、 だらだらと「音声認識」というモノを紹介します。 全体が(ほぼ)このページ一枚に収まっています。 ところどころにリンクがありますが、 そのリンク先には、 難しい話やこぼれ話みたいなものがちょこちょことあります。 ところで、話を簡単にするために、 ちょっと嘘を混ぜています。 そうでないと、ものすごく複雑な話になるので。音声認識ってなにさ 簡単に言ってしまえば、 人間が喋った声を機械が文字に直すことです。 図で描くとこんな感じです。 左側が音声波形(つまり、声を図に表している)で、 右側がそれをひらがなに直したものです。 左側の音声波形を少し詳しく見てみる 人間は耳で音を聞きますが、 機械はマイクで音を聞きます。 そして、マイクで収録された音をそのまま表示させると、 下のような感じになります。 横軸が時刻で、縦軸が振幅です。 音声というのは、ようす
1リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く