Movatterモバイル変換


[0]ホーム

URL:


コンテンツにスキップ
Wikipedia
検索

VMR-WB

出典: フリー百科事典『ウィキペディア(Wikipedia)』

VMR-WBvariable-rate multimode wideband)はマルチレートの広帯域音声符号化方式で、CDMA2000 方式の第三世代携帯電話で利用される。またGSMW-CDMA で利用される広帯域音声符号化方式のAMR-WB相互運用性のあるモードを持つ。

また、ITU-T が勧告した広帯域音声符号化方式G.718 のコアコーデックのベースとしても利用されている。

概要

[編集]

VMR-WB は、W-CDMA などで使用されるAMR-WB と同様、マルチレートをサポートする音声符号化方式で、通常の電話インタフェースの2倍の帯域幅を持つ 50 Hz-7000 Hz(サンプリング周波数 16kHz)の広帯域音声を扱うことができる。通常の狭帯域の音声(100 Hz-3700 Hz、サンプリング周波数 8kHz)も同じように扱うことができる。VMR-WB は標準化団体の3GPP2(3rd Generation Partnership Project 2)が標準化を行った。

VMR-WB は、それ以前に開発されたAMR-WB のコアとなる技術をベースとしており[1]、その略称もAMR-WB を意識したものとなっている[1]

ビットレートは入力となる音声信号の種類(有声音/無声音/無音状態など)により変わる。また、ネットワーク側からのモード指示により変えることもできる。VMR-WB Revision 0 ではモード 0 からモード 3 までの4つのモードがあり、これらのモードでのビットレートは 13300bps、6200bps、2700bps、1000bpsのいずれかである。改訂版の VMR-WB Revision A ではモード 4 が追加され、このモードでは 8550bps、4000bps、800bps のいずれかになる。

モードは、携帯電話基地局との間の無線状態など通信ネットワーク側の状態と、要求される通信品質(QoS)により決められる。音声の品質はモード 0 が高くモード 1、モード 2 と順次低くなり、また平均ビットレートも同様に低下する。モード 3 はAMR-WB相互運用性のあるモードで、AMR-WB での 12.65、8.85、6.60 kbpsのビットレートをサポートする。モード 0 ~ 3 はCDMA2000 ネットワークでのレートセット II(14.4 kbpsを基準とする通信レート)用である。モード 4 はレートセット I(9.6 kbpsを基準とする通信レート)用に使われる。

VMR-WB の符号化アルゴリズムはACELP(Algebraic Code Excited Linear Prediction)を使用する[1]

VMR-WB の特徴は以下の通りである[1]

VMR-WB の符号化データをRTP を用いインターネット上で送るためのデータ形式は、IETF標準のRFC 4348RFC 4424 で定義されている[2][3]

アルゴリズム

[編集]

コーデックの入出力は 16ビット長、サンプリング周波数 16kHz / 8kHz の信号で、これを 12.8 kHz にリサンプリングして処理を行う。デコード時には処理結果(サンプリング周波数 12.8 kHz から決まる 6.4kHz までの信号成分)を 16kHz にアップサンプリングし、6.4 kHz ~ 7 kHzの高域成分を追加する[1]

VMR-WB では 20 msのフレームに対し以下の処理により符号化を行う[1]

これらの処理を行った後、信号フレームの内容と選択ビットレートとから以下のいずれかの処理により符号化を行う。

  • unvoiced speech encoding(無声音符号化)
無声音の場合の処理
  • voiced speech encoding(有声音符号化)
周期的な繰り返しのある有声音の場合の処理
  • discontinuous transmission and comfort noise generation (DTX/CNG)(非連続送信とコンフォートノイズ生成)
音声区間検出(voice activity detection)で無音と判定された時の無音データフレーム生成、
まったくの無音を避けるため、デコーダ側での適切なレベルのバックグラウンドノイズ(コンフォートノイズ)生成
  • generic speech encoding(ジェネリック符号化)
上記のいずれにも分類できない場合の処理

符号化には基本的にACELP のアルゴリズムが使われるが、アルゴリズムの詳細は信号フレーム内容と選択ビットレートにより異なる。

復号では、符号化データに含まれる線形予測係数の情報、適応コードブック/固定コードブック/ゲインのベクトル値などを用いて音声信号を復元する。大まかには以下の処理で復号を行う。

  • 適応コードブック/固定コードブック/ゲインのベクトル値から励起信号を生成
  • 励起信号を線形予測フィルタに入力し音声信号を合成
  • 低域周波数のピッチ周波数成分の強調など音質改善のための後処理
  • 16 kHz にアップサンプリング
  • 6.4 kHz ~ 7 kHz の信号成分を付加

通信エラーなどでフレーム消失が発生した場合、それまでの信号フレームの分類を用いて音質低下を少なくする処理も行う。

用途

[編集]

携帯電話での音声通信用以外に、VMR-WB は3GPP2 で定義されたファイルフォーマット3G2)を使い、各種マルチメディアサービスで使用することができる。

脚注

[編集]
  1. ^abcdef3GPP2. C.S0052-A Version 1.0Source-Controlled Variable-Rate Multimode Wideband Speech Codec (VMR-WB) Service Options 62 and 63 for Spread Spectrum Systems. 3GPP2, April, 2005.
  2. ^IETF (2006年). “Real-Time Transport Protocol (RTP) Payload Format for the Variable-Rate Multimode Wideband (VMR-WB) Audio Codec”. IETF Network Working Group.. 2010年7月14日閲覧。
  3. ^IETF (2006年). “Real-Time Transport Protocol (RTP) Payload Format for the Variable-Rate Multimode Wideband (VMR-WB) Extension Audio Codec”. IETF Network Working Group.. 2010年7月14日閲覧。

参考文献

[編集]

関連項目

[編集]

外部リンク

[編集]
マルチメディア圧縮フォーマット
動画ファイルフォーマット
ISO/IEC
ITU-T
SMPTE
AOMedia
IETF
SAC
その他
可逆圧縮
開発停止
音声ファイルフォーマット
ISO/IEC
ITU-T
IETF
3GPP
ETSI
SAC
その他
開発停止
Bluetooth
画像ファイルフォーマット
IEC,ISO,
ITU-T,W3C,IETF
その他
マルチメディアコンテナフォーマット
ISO/IEC
ITU-T
IETF
SMPTE
3GPP
その他
団体
圧縮技術についてはデータ圧縮を、コーデックについてはデータ圧縮・伸張を行うコーデックを参照
https://ja.wikipedia.org/w/index.php?title=VMR-WB&oldid=97769707」から取得
カテゴリ:

[8]ページ先頭

©2009-2025 Movatter.jp