| 開発元 | 名古屋工業大学 |
|---|---|
| 最新版 | オンライン版:1.06, SourceForge版:1.11 /2012年12月25日 (13年前) (2012-12-25), SourceForge版:2018年12月25日 (7年前) (2018-12-25) |
| リポジトリ | sourceforge |
| プログラミング 言語 | C++ |
| 使用エンジン | HTS |
| 対応OS | Linux、他 |
| 対応言語 | 日本語 |
| サポート状況 | 開発中 |
| 種別 | テキスト音声合成 |
| ライセンス | 修正BSDライセンス |
| 公式サイト | open-jtalk |
| テンプレートを表示 | |

Open JTalk は名古屋工業大学にて開発された、日本語を対象とするテキスト音声合成(text-to-speech、文章読み上げ)ソフトウェアである[1]。オープンソースで公開されているスタンドアロン版と、Webサイトで公開されているオンライン版の2種類がある。
合成技術にHMM(Hidden Markov Model、隠れマルコフモデル)を採用しており、少ないメモリでも動作するのが特徴[2]。その特徴からRaspberry Pi上での音声合成ライブラリとしての利用例も多い。
パラメータとしては「声質」(フォルマントシフト)、「ピッチシフト」(声の高さ)、「話速」に対応し、ボイスを切り替えることで感情表現にも対応する。
公式サイト[3] 上でシステムを公開しており、誰でも無料で利用可能。
指定可能なボイス(音響モデル)は2種類(男性1種類、女性4感情4種類)。
SourceForgeにてソースコードが公開されている。利用にはビルドが必要。ビルドすることで各種OSに対応する。修正BSDライセンスで公開されている。音声合成にはさらに辞書データとボイスデータ(音響モデル、htsvoice形式)が必要[2]。ライセンスに従うことでライブラリとして他ソフトウェアに組み込むことも可能。
複数のOSに対応しているものの、OSS版はソースコードとしての公開のため導入にはビルドが必要となる。有志によって簡単に使えるように、さまざまな導入方法が用意されている。
一部を除き、原則コマンドラインアプリとしての入手になる。
辞書データや音響モデルの追加導入が必要な場合がある(APT等)。また、導入後ビルドが必要な場合もある(pyopenjtalk等)。
docker pull u6kapps/open_jtalk[5]brew install open-jtalk[6]apt install open-jtalk[7]apt install open-jtalk-mecab-naist-jdic ※辞書データapt install hts-voice-nitech-jp-atr503-m001 ※音響モデルpip install pyopenjtalk[8]Install-Package SharpOpenJTalk[9]npm install openjtalk[10]Open JTalkで利用可能な音響モデル(ボイスライブラリ、htsvoice形式)の例。音響モデルは自作することも可能であり、SHABERU等むけにユーザーが制作した音響モデルが配布されている(規約で許可されていればOpen JTalkで利用可能)[11]。
標準男声音響モデル。Open JTalk本体、辞書データと共に配布されている[12]。クリエイティブ・コモンズ・ライセンス3.0ライセンス。
メイ(HTS Voice "Mei")は名古屋工業大学のMMD Agentを用いたデジタルサイネージでキャンパス案内を行う女性キャラクター[13]。MMD Agentと共にクリエイティブ・コモンズ・ライセンスで配布されている[14]。
Open JTalkで追加女声音響モデルとして利用可能。5つの感情別音響モデル(normal, happy, angry, sad, bashful)がある。
タクミ(HTS Voice "Takumi")はメイと共に名古屋工業大学のMMD Agentを用いたデジタルサイネージでキャンパス案内を行う男性キャラクター[13]。MMD Agentと共にクリエイティブ・コモンズ・ライセンスで配布されている[14]。
Open JTalkで追加男声音響モデルとして利用可能。4つの感情別音響モデル(normal, happy, angry, sad)がある。
東北大学 伊藤・能勢研究室[15] によって配布されている、Open JTalkで利用可能な女声音響モデル。クリエイティブ・コモンズ・ライセンス(4.0)で配布されている[16]。
4つの感情別音響モデル(angry, happy, neutral, sad)がある。
Open JTalk は様々な場面で実利用されている。以下はその一例である:
音声合成を行わず、OpenJTalkの日本語処理部分のみを利用する事例がいくつか存在する。
| Open JTalk (SourceForge 版) | Open JTalk Demonstration Page (オンライン版) | ||
|---|---|---|---|
| バージョン | リリース日 | バージョン | リリース日 |
| 1.11 | 2018-12-25[1] | ||
| 1.10 | 2016-12-25[21] | ||
| 1.09 | 2015-12-25[22] | ||
| 1.08 | 2014-12-25[23] | ||
| 1.07 | 2013-12-25[24] | ||
| 1.06 | 2012-12-25[25] | 1.8 | 2012-12-25 |
| 1.05 | 2011-12-25[26] | 1.7 | 2011-12-25 |
| 1.04 | 2011-07-07[27] | 1.6 | 2011-07-07 |
| 1.03 | 2011-05-01[28] | ||
| 1.02 | 2010-12-25[29] | 1.4 | 2010-12-25 |
| 1.01 | 2010-05-14[30] | ||
| 1.00 | 2009-12-25[31] | 1.0 | 2009-12-25 |
Open JTalk は様々な音声合成手法を組み合わせて制作されている。
The Japanese TTS System "Open JTalk" version 1.11 release December 25, 2018open_jtalk_readme-1.11.txt より引用。
The Japanese TTS System "Open JTalk" version 1.10 release December 25, 2016open_jtalk_readme-1.10.txt より引用。
The Japanese TTS System "Open JTalk" version 1.09 release December 25, 2015open_jtalk_readme-1.09.txt より引用。
The Japanese TTS System "Open JTalk" version 1.08 release December 25, 2014open_jtalk_readme-1.08.txt より引用。
The Japanese TTS System "Open JTalk" version 1.07 release December 25, 2013open_jtalk_readme-1.07.txt より引用。
The Japanese TTS System "Open JTalk" version 1.06 release December 25, 2012open_jtalk_readme-1.06.txt より引用。
The Japanese TTS System "Open JTalk" version 1.05 release December 25, 2011open_jtalk_readme-1.05.txt より引用。
The Japanese TTS System "Open JTalk" version 1.04 release July 7, 2011open_jtalk_readme-1.04.txt より引用。
The Japanese TTS System "Open JTalk" version 1.03 release May 1, 2011open_jtalk_readme-1.03.txt より引用。
The Japanese TTS System "Open JTalk" version 1.02 release December 25, 2010open_jtalk_readme-1.02.txt より引用。
The Open JTalk version 1.01 release May 14, 2010open_jtalk_readme-1.01.txt より引用。
The Open JTalk version 1.00 release December 25, 2009open_jtalk_readme-1.00.txt より引用。
形態素解析ツールである MeCab ... には単語ラティス上の経路予測 ... に基づく手法が用いられている.p.1 より引用。篠原, 正太 (2017).“ニューラルネットワークを用いた系列ラベリングによる単語分割手法”(PDF).DEIM2017 第9回データ工学と情報マネジメントに関するフォーラム:1–6.
Open JTalk version 1.05 ... には,匂坂規則と,独自の数詞に関するアクセント結合規則を組み合わせたものが実装されている.p.299 より引用。鈴木, 雅之 (2012).“CRF を用いた日本語東京方言のアクセント結合自動推定”(PDF).日本音響学会秋季講演論文集:299–302.
隠れマルコフモデル (Hidden Markov Model; HMM) に基づく音声合成 ... その日本語実装である ... Open JTalk(大浦 2018, p. 17)
| モデル / 手法 | |||||||||||||||||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| エンジン |
| ||||||||||||||||||||||||||
| システム / API |
| ||||||||||||||||||||||||||
| ハードウェア |
| ||||||||||||||||||||||||||
| 応用ソフトウェア |
| ||||||||||||||||||||||||||
| アクセシビリティ |
| ||||||||||||||||||||||||||
| ボーカルシンセ |
| ||||||||||||||||||||||||||
| サービス・サイト | |||||||||||||||||||||||||||
| プロトコル | |||||||||||||||||||||||||||
| 開発者・研究者 | |||||||||||||||||||||||||||
| 関連分野 | |||||||||||||||||||||||||||
| 製品 |
| ||||||||||||||||||||||||||||||||||||||||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| CeVIOプロジェクト |
| ||||||||||||||||||||||||||||||||||||||||||||||||||
| 関連 |
| ||||||||||||||||||||||||||||||||||||||||||||||||||
この項目は、ソフトウェアに関連した書きかけの項目です。この項目を加筆・訂正などしてくださる協力者を求めています(PJ:コンピュータ/P:コンピュータ)。 |