VMR-WB(variable-rate multimode wideband)はマルチレートの広帯域音声符号化方式で、CDMA2000 方式の第三世代携帯電話で利用される。またGSM やW-CDMA で利用される広帯域音声符号化方式のAMR-WB と相互運用性のあるモードを持つ。
また、ITU-T が勧告した広帯域音声符号化方式G.718 のコアコーデックのベースとしても利用されている。
VMR-WB は、W-CDMA などで使用されるAMR-WB と同様、マルチレートをサポートする音声符号化方式で、通常の電話インタフェースの2倍の帯域幅を持つ 50 Hz-7000 Hz(サンプリング周波数 16kHz)の広帯域音声を扱うことができる。通常の狭帯域の音声(100 Hz-3700 Hz、サンプリング周波数 8kHz)も同じように扱うことができる。VMR-WB は標準化団体の3GPP2(3rd Generation Partnership Project 2)が標準化を行った。
VMR-WB は、それ以前に開発されたAMR-WB のコアとなる技術をベースとしており[1]、その略称もAMR-WB を意識したものとなっている[1]。
ビットレートは入力となる音声信号の種類(有声音/無声音/無音状態など)により変わる。また、ネットワーク側からのモード指示により変えることもできる。VMR-WB Revision 0 ではモード 0 からモード 3 までの4つのモードがあり、これらのモードでのビットレートは 13300bps、6200bps、2700bps、1000bpsのいずれかである。改訂版の VMR-WB Revision A ではモード 4 が追加され、このモードでは 8550bps、4000bps、800bps のいずれかになる。
モードは、携帯電話と基地局との間の無線状態など通信ネットワーク側の状態と、要求される通信品質(QoS)により決められる。音声の品質はモード 0 が高くモード 1、モード 2 と順次低くなり、また平均ビットレートも同様に低下する。モード 3 はAMR-WB と相互運用性のあるモードで、AMR-WB での 12.65、8.85、6.60 kbpsのビットレートをサポートする。モード 0 ~ 3 はCDMA2000 ネットワークでのレートセット II(14.4 kbpsを基準とする通信レート)用である。モード 4 はレートセット I(9.6 kbpsを基準とする通信レート)用に使われる。
VMR-WB の符号化アルゴリズムはACELP(Algebraic Code Excited Linear Prediction)を使用する[1]。
VMR-WB の特徴は以下の通りである[1]。
VMR-WB の符号化データをRTP を用いインターネット上で送るためのデータ形式は、IETF標準のRFC 4348 とRFC 4424 で定義されている[2][3]。
コーデックの入出力は 16ビット長、サンプリング周波数 16kHz / 8kHz の信号で、これを 12.8 kHz にリサンプリングして処理を行う。デコード時には処理結果(サンプリング周波数 12.8 kHz から決まる 6.4kHz までの信号成分)を 16kHz にアップサンプリングし、6.4 kHz ~ 7 kHzの高域成分を追加する[1]
VMR-WB では 20 msのフレームに対し以下の処理により符号化を行う[1]。
これらの処理を行った後、信号フレームの内容と選択ビットレートとから以下のいずれかの処理により符号化を行う。
符号化には基本的にACELP のアルゴリズムが使われるが、アルゴリズムの詳細は信号フレーム内容と選択ビットレートにより異なる。
復号では、符号化データに含まれる線形予測係数の情報、適応コードブック/固定コードブック/ゲインのベクトル値などを用いて音声信号を復元する。大まかには以下の処理で復号を行う。
通信エラーなどでフレーム消失が発生した場合、それまでの信号フレームの分類を用いて音質低下を少なくする処理も行う。
携帯電話での音声通信用以外に、VMR-WB は3GPP2 で定義されたファイルフォーマット(3G2)を使い、各種マルチメディアサービスで使用することができる。