Movatterモバイル変換

VMR-WB

出典: フリー百科事典『ウィキペディア（Wikipedia）』

VMR-WB（variable-rate multimode wideband）はマルチレートの広帯域音声符号化方式で、CDMA2000 方式の第三世代携帯電話で利用される。またGSM やW-CDMA で利用される広帯域音声符号化方式のAMR-WB と相互運用性のあるモードを持つ。

また、ITU-T が勧告した広帯域音声符号化方式G.718 のコアコーデックのベースとしても利用されている。

概要

[編集]

VMR-WB は、W-CDMA などで使用されるAMR-WB と同様、マルチレートをサポートする音声符号化方式で、通常の電話インタフェースの2倍の帯域幅を持つ 50 Hz-7000 Hz（サンプリング周波数 16kHz）の広帯域音声を扱うことができる。通常の狭帯域の音声（100 Hz-3700 Hz、サンプリング周波数 8kHz）も同じように扱うことができる。VMR-WB は標準化団体の3GPP2（3rd Generation Partnership Project 2）が標準化を行った。

VMR-WB は、それ以前に開発されたAMR-WB のコアとなる技術をベースとしており^[1]、その略称もAMR-WB を意識したものとなっている^[1]。

ビットレートは入力となる音声信号の種類（有声音/無声音/無音状態など）により変わる。また、ネットワーク側からのモード指示により変えることもできる。VMR-WB Revision 0 ではモード 0 からモード 3 までの４つのモードがあり、これらのモードでのビットレートは 13300bps、6200bps、2700bps、1000bpsのいずれかである。改訂版の VMR-WB Revision A ではモード 4 が追加され、このモードでは 8550bps、4000bps、800bps のいずれかになる。

モードは、携帯電話と基地局との間の無線状態など通信ネットワーク側の状態と、要求される通信品質（QoS）により決められる。音声の品質はモード 0 が高くモード 1、モード 2 と順次低くなり、また平均ビットレートも同様に低下する。モード 3 はAMR-WB と相互運用性のあるモードで、AMR-WB での 12.65、8.85、6.60 kbpsのビットレートをサポートする。モード 0 ～ 3 はCDMA2000 ネットワークでのレートセット II（14.4 kbpsを基準とする通信レート）用である。モード 4 はレートセット I（9.6 kbpsを基準とする通信レート）用に使われる。

VMR-WB の符号化アルゴリズムはACELP（Algebraic Code Excited Linear Prediction）を使用する^[1]。

VMR-WB の特徴は以下の通りである^[1]。

入出力のサンプリング周波数は広帯域の場合 16 kHz/16 bit、狭帯域の場合 8 kHz/16 bit
入力となる音声信号の種類とモード指定による可変ビットレート、
ACELP を使用
20 msのフレーム長、符号化遅延 32.8125 ms（広帯域の場合）、32.875 ms（狭帯域の場合）
AMR-WB との相互運用モードあり

VMR-WB の符号化データをRTP を用いインターネット上で送るためのデータ形式は、IETF標準のRFC 4348 とRFC 4424 で定義されている^[2]^[3]。

アルゴリズム

[編集]

コーデックの入出力は 16ビット長、サンプリング周波数 16kHz / 8kHz の信号で、これを 12.8 kHz にリサンプリングして処理を行う。デコード時には処理結果（サンプリング周波数 12.8 kHz から決まる 6.4kHz までの信号成分）を 16kHz にアップサンプリングし、6.4 kHz ～ 7 kHzの高域成分を追加する^[1]

VMR-WB では 20 msのフレームに対し以下の処理により符号化を行う^[1]。

12.8 kHz にリサンプリング、ハイパスフィルタによる直流成分除去などの前処理
スペクトル分析（音声区間検出と雑音抑制用）
入力が広帯域/狭帯域かを検出
スペクトル分析結果より音声区間検出（voice activity detection）
スペクトル分析結果より雑音スペクトル推定
推定された雑音スペクトルを用いて雑音抑制
ACELPのための線形予測係数の計算など
聴感重み付けされた音声信号の計算
オープンループでのピッチ周波数（音声波形の基本となる周波数）分析
背景雑音スペクトルの推定値を更新
信号フレーム内容よりビットレート選択
推定ピッチ周波数で入力信号を一部修正、ビットレート選択を改善

これらの処理を行った後、信号フレームの内容と選択ビットレートとから以下のいずれかの処理により符号化を行う。

unvoiced speech encoding（無声音符号化）

無声音の場合の処理

voiced speech encoding（有声音符号化）

周期的な繰り返しのある有声音の場合の処理

discontinuous transmission and comfort noise generation (DTX/CNG)（非連続送信とコンフォートノイズ生成）

音声区間検出（voice activity detection）で無音と判定された時の無音データフレーム生成、

まったくの無音を避けるため、デコーダ側での適切なレベルのバックグラウンドノイズ（コンフォートノイズ）生成

generic speech encoding（ジェネリック符号化）

上記のいずれにも分類できない場合の処理

符号化には基本的にACELP のアルゴリズムが使われるが、アルゴリズムの詳細は信号フレーム内容と選択ビットレートにより異なる。

復号では、符号化データに含まれる線形予測係数の情報、適応コードブック/固定コードブック/ゲインのベクトル値などを用いて音声信号を復元する。大まかには以下の処理で復号を行う。

適応コードブック/固定コードブック/ゲインのベクトル値から励起信号を生成
励起信号を線形予測フィルタに入力し音声信号を合成
低域周波数のピッチ周波数成分の強調など音質改善のための後処理
16 kHz にアップサンプリング
6.4 kHz ～ 7 kHz の信号成分を付加

通信エラーなどでフレーム消失が発生した場合、それまでの信号フレームの分類を用いて音質低下を少なくする処理も行う。

用途

[編集]

携帯電話での音声通信用以外に、VMR-WB は3GPP2 で定義されたファイルフォーマット（3G2）を使い、各種マルチメディアサービスで使用することができる。

マルチメディアメッセージングサービス（MMS）
マルチメディアストリーミングサービス（MSS）

脚注

[編集]

^^a ^b ^c ^d ^e ^f3GPP2. C.S0052-A Version 1.0Source-Controlled Variable-Rate Multimode Wideband Speech Codec (VMR-WB) Service Options 62 and 63 for Spread Spectrum Systems. 3GPP2, April, 2005.
^IETF (2006年). “Real-Time Transport Protocol (RTP) Payload Format for the Variable-Rate Multimode Wideband (VMR-WB) Audio Codec”. IETF Network Working Group.. 2010年7月14日閲覧。
^IETF (2006年). “Real-Time Transport Protocol (RTP) Payload Format for the Variable-Rate Multimode Wideband (VMR-WB) Extension Audio Codec”. IETF Network Working Group.. 2010年7月14日閲覧。

参考文献

[編集]

3GPP2. C.S0052-0 Version 1.0Source-Controlled Variable-Rate Multimode Wideband Speech Codec (VMR-WB) Service Option 62 for Spread Spectrum Systems. 3GPP2, June, 2004.
3GPP2. C.S0052-A Version 1.0Source-Controlled Variable-Rate Multimode Wideband Speech Codec (VMR-WB) Service Options 62 and 63 for Spread Spectrum Systems. 3GPP2, April, 2005.
3GPP2. C.S0050-0 Version 1.03GPP2 File Formats for Multimedia Services. 3GPP2, December, 2003.
IETF Network Working Group. RFC4348Real-Time Transport Protocol (RTP) Payload Format for the Variable-Rate Multimode Wideband (VMR-WB) Audio Codec. IETF. January 2006.
IETF Network Working Group. RFC4424Real-Time Transport Protocol (RTP) Payload Format for the Variable-Rate Multimode Wideband (VMR-WB) Extension Audio Codec. IETF. February 2006.

外部リンク

[編集]

3GPP2 C.S0052-0 (VMR-WB Rev.0) specification
3GPP2 C.S0052-A (VMR-WB Rev.A) specification
C.S0050-0 (3GPP2 File Formats) specification
RFC 4424 - Real-Time Transport Protocol (RTP) Payload Format for the Variable-Rate Multimode Wideband (VMR-WB) Extension Audio Codec
RFC 4348 - Real-Time Transport Protocol (RTP) Payload Format for the Variable-Rate Multimode Wideband (VMR-WB) Audio Codec

マルチメディア圧縮フォーマット

動画ファイルフォーマット

ISO/IEC	MJPEG Motion JPEG 2000 MPEG-1 MPEG-2 Part 2（英語版） MPEG-4 Part 2/ASP（英語版） Part 10/AVC MPEG-H Part 2/HEVC MPEG-I VVC MPEG-5
ITU-T	H.120（英語版） H.261 H.262 H.263 H.264 H.265 DV H.266 H.267
SMPTE	VC-1 VC-2 (Dirac) VC-3 VC-5（英語版） VC-6
AOMedia	AV1
IETF	VP8
SAC	AVS（英語版）
その他	Apple Video（英語版） Bink（英語版） DVI（英語版） EVC（英語版） GIFアニメーション Microsoft Video 1（英語版） MSU Lossless（英語版） OMS Video（英語版） ProRes 422 ProRes 4444 RTVideo（英語版） SheerVideo（英語版） Smacker（英語版） Snow Sorenson Video, Spark（英語版） VP6 VP9 WMV YULS（英語版） XVC Xvid
可逆圧縮	FFV1（英語版） Ut Video Codec Suite
開発停止	Zlib Cinepak Daala Huffyuv Lagarith（英語版） RealVideo RMP4 Indeo Microsoft MPEG-4 QuickTime Pixlet Animation（英語版） Graphics（英語版） Theora Thor VP3 VP7 XEB XVD

音声ファイルフォーマット

ISO/IEC	MPEG-1 Layer III (MP3) MPEG-1 Layer II Multichannel（英語版） MPEG-1 Layer I（英語版） AAC HE-AAC AAC-LD（英語版） MPEG Surround（英語版） MPEG-4 ALS MPEG-4 SLS MPEG-4 DST MPEG-4 HILN MPEG-4 HVXC MPEG-4 CELP MPEG-D USAC（英語版） MPEG-H 3D Audio（英語版）
ITU-T	G.711 (A-law,µ-law) G.718 G.719 G.721 G.722 G.722.1 G.722.2 G.723 G.723.1 G.726 G.728 G.729 G.729.1
IETF	Opus iLBC Vorbis
3GPP	AMR AMR-WB AMR-WB+ EVRC EVRC-B（英語版） EVS GSM-HR GSM-FR GSM-EFR
ETSI	AC-3 AC-4（英語版） DTS
SAC	AVS（英語版） DRA（英語版）
その他	ADPCM ALAC Codec 2（英語版） FLAC Monkey's Audio OptimFROG（英語版） PCM WavPack TAK MQA（英語版）
開発停止	ACELP Asao（英語版） ATRAC CELT iSAC（英語版） La Musepack MT9（英語版） OSQ（英語版） PASC QCELP（英語版） RealAudio RCELP RTAudio（英語版） SD2 SHN SILK（英語版） Siren（英語版） SMV Speex SVOPC（英語版） VMR-WB TTA TwinVQ VSELP（英語版） WMA
Bluetooth	SBC (codec)（英語版） aptX LDAC LC3

画像ファイルフォーマット

IEC,ISO, ITU-T,W3C,IETF	CCITT Group 4（英語版） GIF HEIF HEVC JBIG JBIG2 JPEG JPEG-LS JPEG 2000 JPEG XR JPEG XS（英語版） JPEG XT（英語版） JPEG XL Lossless JPEG PNG TIFF TIFF/EP（英語版） TIFF/IT（英語版）
その他	APNG AVIF BPG DjVu DNG EXR FLIF（英語版） ICER（英語版） ILBM JPEG Network Graphics MNG PCX PGF（英語版） QTVR（英語版） TGA WBMP WebP

マルチメディアコンテナフォーマット

ISO/IEC	MPEG-ES（英語版） MPEG-PES（英語版） MPEG-PS（英語版） MPEG-TS ISO base media file format（英語版） MPEG-4 Part 14 (MP4) Motion JPEG 2000 MPEG-21 Part 9 MPEG media transport（英語版）
ITU-T	H.222.0 T.802
IETF	RTP Ogg
SMPTE	GXF（英語版） MXF
3GPP	3GP and 3G2（英語版） 3GP 3G2
その他	AMV ASF AIFF AVI AU BPG Bink（英語版） Smacker（英語版） BMP DivX Media Format DPX DSM EVO（英語版） Flash Video (FLV) IFF M2TS（英語版） Matroska WebM QuickTime File Format（英語版） (MOV) RatDVD RealMedia RIFF WAV MOD and TOD（英語版） VOB, IFO and BUP（英語版）