Movatterモバイル変換


[0]ホーム

URL:


スポンサーリンク

ずんだもんが無料で使える、超高性能AIボイスチェンジャー、ParakeetVCが公開。1か月間は全キャラクタ、全機能が無料

2023.12.25
この記事は約10分で読めます。
この記事にはアフィリエイトなどPRが含まれています

自分の声をまったく別のキャラクタの声に変えることを実現するAIボイスチェンジャー。エフェクトを使って自分の声を加工する従来のボイスチェンジャーとは異なり、自分の声は完全に消えて、まったく別人になりきれるのが特徴で、これまでもVoidolCoeFontボイスチェンジャーといったものを記事でも紹介してきたほか、中国系のフリーウェアでもかなりの精度を持ったものがいろいろ登場してきています。

そうした中、12月25日、まったく新たなAIボイスチェンジャー、Parakeet.VC(パラキート・ブイシー)が、福島県のベンチャー企業、Parakeet株式会社からリリースされました。ここには東北ずん子や東北きりたん、またずんだもんをはじめ、計109種類の声が収録されており、ユーザーはそれらを選んで、マイクで話せばリアルタイムにキャラクタの声に変換することが可能です。既存のAIボイスチェンジャーと比較して、高品質で、低遅延で、小容量だという、このParakeet.VCとはどんなものなのか、少し試すとともに、開発者に話を伺ってみました。

AIボイスチェンジャー、Parakeet.VCが誕生。ずんだもんなど3キャラクタは永続的に無料で利用可能

スポンサーリンク
スポンサーリンク

低遅延、高音質、小容量なボイスチェンジャー、Parakeet.VC

Parakeet.VCは、マイクでしゃべる自分の声をまったく別の声にリアルタイムに変換するAIボイスチェンジャー。今回、Windows版およびMac版がリリースされましたが、PC以外のスマホなどについては、今後順次対応していくとのことです。

このParakeet.VCにはトータル109キャラクタの音声が入っていて、ユーザーはキャラクタを選択するだけで、その声でしゃべることが可能になるのです。

まずは以下のビデオをご覧ください。左チャンネルが元の声で、右チャンネルが変換後の声となっていますが、まったく違う声に、そして非常に滑舌のいいキレイな声質の音声に変換されていることがわかると思います。

元の声と変換後の声に若干のタイムラグがありますが、これが変換にかかる時間。従来のAIボイスチェンジャーだとここが結構な時間差となっていましたが、Parakeet.VCではAppleシリコンのMacで80msec程度、Windowsだと150msec程度と非常に高速に変換しているのも大きなポイントです。

シンプルなUIで使い方も簡単なParakeet.VC

さらに驚くべきは、これだけ多くの声モデルが収録されているのにファイルサイズ的には130MB程度と非常にコンパクトであるということ。現時点では日本語対応となっていますが、今後は多言語対応していくとのことです。

匿名のプロ声優の声、男女100人分を利用できる

1月末まで全ボイス無料、それ以降も、ずんだもんなど3キャラクタは無料で利用可

今回の12月25日の発表はα版のリリースという位置づけであるため、全キャラクタをすべて無料で使うことが可能で、その無料利用期間は1か月。この間、Parakeetではユーザーからのフィードバックなども得ながら、改良を加えて1月末に正式リリースする予定となっています。

その正式リリース後も、

ずんだもん
つくよみちゃん
小春音アミ

の3キャラクタにおいては無料で使うことが可能とのこと。今回、その発表前にParakeet.VCを試させてもらいました。

Windows版もMac版も使い方自体はまったく同じ。サウンドデバイスとして入力デバイスと出力デバイス、それにモニターデバイスを設定するとともに、変換速度とボリュームを設定すれば、すぐに使うことが可能です。

あらかじめ入出力デバイスの設定を行っておく

ただし、最初の起動時のみ、「事前録音」というものを行います。といっても、やることはいたって単純。入力デバイスを設定した上で、録音開始ボタンを押し、画面に表示される「パラキート株式会社がこのアプリを制作しています あなたの声を好きな声に変換します」という文章を読み上げて録音終了するのみ。

初回起動時、自分の声を登録するための事前録音を行っておく必要がある

この際、できるだけ地声で、ハッキリとそして普通にしゃべるのがポイント。変にキャラクタに寄った高い声とかでしゃべらずに、普段の声で入力するようにします。ちなみに、この文章を読み間違えても大丈夫。さらにいうと、ほかの文章でもいいので、もう少し長い時間読んだほうが、より良い変換が可能になります。

また、出力チャンネルはOBSなどへ繋ぎこむポートを指定し、モニターチャンネルは自分の声をリアルタイムに変換した結果を聴くためのポートを設定します。OBSなどへ繋ぎこむ際はVB-Cableなどを利用するのがいいですね。

声を選択してマイクに向かってしゃべれば変化される

準備ができたら、画面左側の話者選択とある部分のアイコンをクリックすると、声の選択ができるようになっています。ここには匿名のプロ声優の声が女性51種類、男性49種類の計100種類収録されているほか、キャラクタボイスとして、以下の9種類の声が選択できるようになっています。

ずんずんプロジェクト東北ずん子

東北イタコ

東北きりたん
ずんだもん

四国めたん

九州そら

中国うさぎ

つくよみちゃんつくよみちゃん

本ソフトウェアの音声変換には、フリー素材キャラクター「つくよみちゃん」(©Rei Yumesaki)が無料公開している音声データを使用しています。
■つくよみちゃんコーパス(CV.夢前黎)
https://tyc.rei-yumesaki.net/material/corpus/
■イラスト素材:えみゃコーラ様https://tyc.rei-yumesaki.net/material/illust/
■つくよみちゃん公式サイトhttps://tyc.rei-yumesaki.net/
小春音アミ小春音アミ

本ソフトウェアの音声変換には、「あみたろの声素材工房(https://amitaro.net/)」が無料公開している音声データを使用しています。

あとはマイクに向かってしゃべるのみ。この際、ノートパソコン内蔵のマイクなどを使うより、オーディオインターフェイス経由でコンデンサマイクやダイナミックマイクでしゃべるほうが、よりキレイに変換できます。この際、コンデンサマイクでもダイナミックマイクでもいいのですが、周りの雑音を拾いにくく、抑揚をつけやすいという面ではダイナミックマイクのほういいように感じました。

なお変換速度は右にすると遅延が小さくなり、左にすると大きくなるのですが、小さくしすぎるとチリチリしたノイズが入ったりするので、適度なところを探してみてください。

変換速度の設定を行うことで、遅延を調整できる

試してみると分かりますが、ここまでの変換ができてしまうというのは驚異的。VTuber、VRChat界隈では、今後広く使われていきそうです。また、これに合わせ、VTuber Studio用にずんだもんのモデルも無料公開されたので、ずんだもんの存在感がさらに増していきそうですね。

VTuber Studio用のずんだもんモデルが無償公開された

そのParakeet.VCを開発したParakeet株式会社の代表取締役 中村泰貴(@supikiti)さん、ずんだもんや東北ずん子などのキャラクタを提供したSSS合同会社 CEOの小田恭央(@oda_yasuo)さんに、オンラインでいろいろ話を伺ってみました。

Parakeetの中村泰貴さん、SSSの小田恭央さんインタビュー

--このParakeet.VCリリースの件、小田さんに情報をお伺いして初めて知りましたが、もともと小田さんとParakeetの接点や東北姉妹の声を提供した経緯はどういうことにあったのですか?
小田:今年6月に、中村さんから東北姉妹の声を使いたい、という連絡をいただいたのがキッカケです。お話させていただいたところ、Parakeetさんが、福島県双葉郡の会社とのこと。東北ずん子をはじめとするキャラクタは東北復興支援キャラクタという位置づけでもあり、快諾させていただきました。
中村:東北ずん子、東北イタコ、東北きりたん、ずんだもん、四国めたん、九州そら、中国うさぎの7キャラクタを使わせていただき、このうち、ずんだもんに関しては、今後も誰でも無料で利用可能とさせていただいています。

Parakeet株式会社 代表取締役の中村泰貴さん

--ずんだもんは無料ということは、ほかは有料ということなんですか?
中村:Parakeet.VC、この7キャラクタのほかに、つくよみちゃん、小春音アミの2キャラクタ、さらに100名のプロ声優の声の計109名の音声が入っていて、今回のリリースから1か月は無料で使えます。が、それ以降は各音声ごとに課金をすることを予定しています。まだ詳細な料金体系は検討中です。

--Parakeetの会社紹介ページを見てみると、メンバーのみなさん、東京大学や東北大学に在籍中の方が多いんですね。
中村:はい、私も東京大学の猿渡・高道研究室の博士課程2年で、メンバー9名中5名が同じ研究室です。当社は2022年4月設立で、世界中の人がコミュニケーションの楽しさや、そこでの快適さを感じる社会の実現、ということを目的としています。その一つとして、今回のParakeet.VCを開発しました。一般に向けて公開する製品という意味では、今回が当社で初の製品です。

--なるほど、音声合成や音楽信号処理などで著名で、JSUTコーパスを出しているあの研究室ですね!これまでもリアルタイムのボイスチェンジャー、いろいろと出ていますが、このParakeet.VCの特徴を教えてください。
中村:AIによるリアルタイムボイスチェンジャーですが、既存のものと比較して非常にレイテンシーが小さいです。MacのM1、M2プロセッサ搭載マシンであれば入力から出力までで80~100msec程度、Windowsでも150msec程度ですが、さらに縮めて、将来的には50msecの実現をめざしているとこ
ろです。
小田:このParakeet.VCはGPUが不要であるという点も大きいと思いますよ。

SSS合同会社 代表取締役の小田恭央さん

--GPU不要で、100msec程度というのはすごいですね。実際試してみても、非常にレイテンシーが小さいと感じました。GPUがあれば、もっとレイテンシーが縮まる?
中村:我々のモデルはGPUを使うと逆に遅くなるんです。また、VRChatで利用する方が多いのではと思いますが、VRChatだとGPUの計算資源をかなり喰うので、そのパワーの取り合いになるのもよくないため、あえてGPUは非サポートとしています。一方で、非常に滑舌がいいのも特徴です。ほかの多くのボイスチェンジャーはRVC(Retrieval-based-Voice-Conversion)を使っているのに対し、我々は独自のものを使っています。RVCだと「ボボボーボ、ボーボボ」が言えないんです。

--「ボボボーボ、ボーボボ」?何ですかそれ?
小田:ボイチェンの世界で滑舌をチェックするのに、よく使う言葉なんですよ。
中村:RVC系のものだと、「ほほほーほほーほほ」みたいになってしまい、入力した滑舌を再現できないんです。普通に聞き取れる滑舌でしゃべっていれば、そのまま保存して、再現させることが可能です。さらに抑揚もしっかり出せるのもParakeet.VCの特徴です。RVCだと、イントネーションがすべてノペっとしてしまうんです。
小田:だからものすごく感情をこめて入力しても、そこを反映することができなかったのですが、Parakeet.VCはそこがだいぶできるようになっていますね。

--そのほかの特徴はいかがですか?
中村:3番目にあげられるのがボイスをマージするボイスブレンド機能の搭載です。ずんだもんプロジェクトは対象外なのですが、匿名のプロ声優の100名の声などをブレンドというかモーフィングしたような、声を作ることも可能になっています。このブレンド、あえて3名までとしているのですが、著名なデザイナーさんとUIの相談をした際、多すぎても分かりにくいということで、3名を組み合わせる形にしました。

--もう一つ伺いたいのは歌についてです。Parakeet.VCを歌声変換用として使うことは可能ですか?試しに歌を入力してみたところ、うまくいきませんでしたが。

中村:歌声変換について、現時点ではまだ対応できておらず、1月末の本リリースで間に合わないかもしれません。ただ、今後のアップデートで歌声変換モードを搭載する形で機能追加していく予定ですので、ぜひご期待くださいl。

--ところで、今回のタイミングで、VTube Studio用に、ずんだもんのモデルが公開されたんですよね。
小田:はい、Parakeet.VCの公開と合わせて、無料配布をスタートしました。VTube Studioは顔の動きや目や口の動き、また手の動きをトラッキングしてキャラクタを動かすことが可能ソフトウェアです。Streamのアカウントを作成し、Streamをインストールしたうえで使うなど、少し煩雑な面はありますが、基本無料で使うことができます。Parakeet.VCと合わせて使っていただけると、いろいろな楽しみ方ができると思いますので、ぜひ活用してみてください。

--ありがとうございました。

【関連情報】
Parakeet.VC製品情報
VtubeStudio対応ずんだもんデータ

この記事が気に入ったら
フォローしよう

関連記事

VOCALOID・歌声合成・音声合成

10秒の歌声を学習し、リアルタイムにその声になれるAIシステム、VocoflexをSynthesizer VのDreamtonicsが発表

いま最先端を行くAI歌声合成ソフトのSynthesizer VやAI音声合成ソフトのVOICEPEAKなどを手掛けるDreamtonicsが、また新たな画期的なシステム、Vocoflexなるものを発表されるとともに、そのベータ版が公開されま...
VOCALOID・歌声合成・音声合成

無料版も公開中のカワイのスコアメーカーZERO、VST3音源に対応とともにSynthsizer VやVOCALOIDなどとの連携も実現

Windows用の楽譜作成ソフトとして長い歴史を持つカワイのスコアメーカー。その最新版がスコアメーカーZERO Ver.12.1.082というバージョンです。2017年にスコアメーカーZEROという名称になってからもDTMステーションで何度...
VOCALOID・歌声合成・音声合成

iPhone/iPadで無料で使える歌声合成アプリ、VoiSona iOS版がリリース。誰でも気軽に音楽制作を!

本日12月26日、テクノスピーチからAI歌唱ソフトであるVoiSonaのiOS/iPadOS版が無料アプリとして正式にリリースされました。VoiSonaのiOS/iPadOS版は今年の9月からベータテストが行われており、9月の期間中にベータ...
VOCALOID・歌声合成・音声合成

VX-β ver. 3.0が登場。VOCALOID 6 Editorユーザーは無料で利用可能。VTuber花奏かのんさんのボイスバンク・花奏も同時発売

11月27日、ヤマハからAI歌声合成プラグインのVX-β ver. 3.0が発表され、本日よりvocaloid.comより無料でダウンロードできるようになりました。これは昨年9月に技術試作として発表され、抽選で当選した限られたユーザーだけが...
ACID・MusicMaker

商用利用もOK。AI音声合成や膨大な音素材ライブラリも使える定番波形編集ソフト、SOUND FORGE Pro 18誕生

ドイツMAGIXから定番の波形編集ソフトの新バージョン、SOUND FORGE Pro 18およびSOUND FORGE Pro 18 Suiteがリリースされました。今回のバージョンアップの目玉はAIを利用した音声合成機能を搭載し、日本語...
VOCALOID・歌声合成・音声合成

AIボイスチャンジャー、Voidol 3にRVCエンジンが追加される形で無償アップデート。Voidol 3Rがリリース

これまで何度か取り上げてきたAIボイスチェンジャーのVoidolがまた新たな進化を遂げました。これまでVoidol、Voidol 2、Voidol 3と進化するなかで、SYNTHモードを追加したり、AIモードとSYNTHモードの連結を可能に...

コメント

  1. triより:

    すでにRVCを使い倒している一Vtuberからの意見です。
    今後にとても期待できそうだと思いましたが、現状だとRVCにまだクオリティで劣ると感じてしまいました。
    特に、伸ばす音で聞き手に不快感が出てしまうと思います。
    滑舌がセールスポイントのようですが、RVCは滑舌ももう99.9%問題ないレベルで、だからこそ普段から配信で使っています。

    しかし、順当に進化しつつ、国産ゆえに権利関係などがクリアにしやすい所が活かせれば、積極的に選びたいツールです。
    以前の他社類似ソフトも含め、どうも国産からは良いものが出ないと感じているので、期待したいです。

コメントをどうぞコメントをキャンセル

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

CAPTCHA


スポンサーリンク

記事検索

DTM・DAW セール情報

カテゴリー

スポンサーリンク

DTMの原点

DTMnogenten1

著書

HOBDTM
VOCALOIDSMH

アーカイブ

最新コンテンツ

Cubase 13

今月のアンケート

どのメーカーのオーディオインターフェイスをメインに使ってる?【2025】

  • Steinberg/YAMAHA(18%, 144 Votes)
  • MOTU(15%, 118 Votes)
  • RME(14%, 109 Votes)
  • Roland(7%, 54 Votes)
  • Universal Audio(6%, 47 Votes)
  • PreSonus(6%, 47 Votes)
  • その他(6%, 46 Votes)
  • Focusrite(5%, 39 Votes)
  • TASCAM(4%, 34 Votes)
  • Antelope(4%, 32 Votes)
  • ZOOM(4%, 30 Votes)
  • Native Instruments(2%, 18 Votes)
  • Apogee(2%, 15 Votes)
  • SSL(2%, 15 Votes)
  • Audient(2%, 15 Votes)
  • IK Multimedia(1%, 10 Votes)
  • M-Audio/Alesis(1%, 9 Votes)
  • Avid(1%, 6 Votes)
  • Behringer(1%, 5 Votes)
  • ESI(0%, 1 Votes)

投票人数:794

Loading ... Loading ...

おすすめ記事

タグ

KORGsteinbergiPadTASCAMMAGIXRolandNative InstrumentsZOOMArturiaiZotopeVOCALOID3PreSonusCoreMIDIAHSSynthesizer VDotec-AudioVSTUAD-2APOLLOAudiobusiRigInter-AppAudioCoreAudio小岩井ことりNIKOMPLETEVOICEROIDiPhoneソースネクストCeVIO AI初音ミクフランク重虎TR-808M3LINE6CASIOCakewalkBLE-MIDICT-S1000V耳コピ村上社長ThunderboltFocusriteAntelopeAKAI結月ゆかり江夏正晃SennheiserNAMMDeeMaxUniversal AudioSSWReWireNEUMANNBluetoothPropellerheadLightningFLStudioeVocaloidASIO
タイトルとURLをコピーしました

[8]ページ先頭

©2009-2025 Movatter.jp