Movatterモバイル変換

[0]ホーム

コンテンツにスキップ

SMV

リンクを編集

出典: フリー百科事典『ウィキペディア（Wikipedia）』

「SMV」のその他の用法については「SMV (曖昧さ回避)」をご覧ください。

SMV（selectable mode vocoder）はCDMA2000 ネットワークで利用される可変ビットレートの音声符号化方式である。それ以前からCDMA ネットワークで使われている符号化方式のEVRC のように通話中に音声の内容によりビットレートを変えることができることに加え、モード指定により基地局側から音質と平均ビットレートの制御を行うことができる特徴がある。

この特徴はその後に規格化されたCDMA2000 ネットワーク用の音声符号化方式であるVMR-WB やEVRC-B 以降の仕様などにも引き継がれている。

概要

[編集]

SMV はCDMA ネットワークのために提案された音声符号化方式で、1999年にCDMA 方式の業界団体であるCDG（CDMA Development Group）が要求仕様を作成し^[1]、その後様々な評価を経て 2001年6月に3GPP2 の標準規格 C.S0030-0 として採用された^[2]。

ビットレートは入力となる音声信号の種類（有声音/無声音/無音状態など）と指定されているモードとの組み合わせにより動的に変わる。音声信号の内容に応じて8.55 kbps（フルレート）、4.0 kbps（ハーフレート）、2.0 kbps（1/4レート）0.8 kbps（1/8レート）のいずれかのビットレートに符号化する。1/8レートは無音状態（しゃべっていない状態）のみで使われる。

これらの符号化データはそれぞれCDMA2000 ネットワークのレートセット1（9.6 Kbps を基準とする通信レート）でのフレームレート 9600 bps、4800 bps、2400 bps、1200 bps を使い送受信される。CDMA2000 ネットワークで使われているCDMA 方式は、各利用者のビットレートが下がるほど多くの利用者が同時接続できる特性があり、コーデックのビットレートを可変にして平均ビットレートを下げることは1基地局あたりの収容数（同時に通話可能な利用者数）の向上に役立っている。

平均ビットレートは基地局側が指示する「符号化モード」（パラメータ名 "RATE_REDUC"）で制御する。符号化モードは、基地局当たりの収容数や携帯電話と基地局との間の無線状態など通信ネットワーク側の状態と、要求される通信品質（QoS）により決められる。平均ビットレートは符号化モード 0 が最も高く 1、2 と順次低くなり、また音声の品質も同様に低下する。

符号化モードは 0 から 3 までの4モードがあり、それぞれプレミアムモード、スタンダードモード、エコノミーモード、キャパシティセービングモードとも呼ばれる。加えて、最大ビットレートをハーフレート（4.0 kbps）に抑えるハーフレートマックスモード（half-rate max mode）があり、モード 0 とモード 1 に適用できる。

平均ビットレートは音声の内容により変わるが、符号化モードと平均的な会話での想定平均ビットレート（符号化のレート）との関係は以下のようになる^[3]。

SMV の符号化レート
RATE_REDUC (binary)	符号化モード	想定平均ビットレート	説明
‘000’	0	7.95 kbps	プレミアムモード
‘001’	1	5.82 kbps	スタンダードモード
‘010’	2	4.50 kbps	エコノミーモード
‘011’	3	3.95 kbps	キャパシティセービングモード
‘100’	4	4.00 kbps	モード0 ＋ハーフレートマックスモード
‘101’	5	3.67 kbps	モード1 ＋ハーフレートマックスモード
‘110’			将来のために予約
‘111’			将来のために予約

SMV で使うアルゴリズムは、CELPの一種であるeX-CELP（eXtended CELP）を用いる。これは1つの技術ではなく、EVRC で使用されているRCELP アルゴリズムなど様々なアイデアを組み合わせ選択して使うものである^[4]。

また、それ以前に開発されたEVRC と同様の雑音抑制の機能が仕様に組み込まれており、フロントエンドとして使われる。

SMV の特徴は以下の通りである。

入出力のサンプリング周波数は 8 kHz/ 16 bit
入力となる音声信号の種類による可変ビットレート、8.55 kbps/4.0 kbps/0.8 kbps
CELPの一種である eX-CELP を使用
20 msのフレーム長
モード指定により音質と平均ビットレートを制御
雑音抑制の機能が規格自体に組み込まれている

CDMA2000 ネットワークでのサービス種別を表すサービスオプションとしては SO56（Service Option 56）が割り当てられている。

SMV の符号化データをRTP を用いインターネット上で送るためのデータ形式は、IETF標準のRFC 3558 で定義されている^[5]。

SMV は3GPP2 でのマルチメディア用ファイルフォーマットである3G2 でも使うことができる。携帯電話での音声通信用以外に、マルチメディアメッセージングサービスやマルチメディアストリーミングサービスなどの3GPP2 で定義された各種マルチメディアサービスで使用することができる。

eX-CELP

[編集]

SMV ではCELP の一種であるeX-CELP（eXtended CELP）と呼ばれる技術を用いる。

一般的なCELP は人間の音声を声道に相当する線形予測フィルターと声帯に相当する適応型と固定型のコードブックとでモデル化し、「合成による分析」（analysis-by-synthesis）の手法を用いてコードブックから誤差が最小になるものを探索する。

eX-CELP の基本的となる考え方は、通常のCELP が固定的なアルゴリズムを使い入力信号とできるだけ同じ波形になるように符号化しようとするのに対し、様々なアルゴリズムを組み合わせて知覚上重要な部分を強化した符号化を行うことである^[6]。

具体的には、CELP をベースとしながら、以下のような方法で聴感上の音質を落とすことなくビットレートの低減を行っている^[6]^[7]^[4]。

オープンループとクローズドループの組み合わせ（closed-loop-open-loop-analysis、COLA）

合成による分析でのクローズドループだけでなく、完全な一致が必要ないパラメータはオープンループで符号化するなど、柔軟に切り替える

入力信号の細かい分類とアルゴリズムの切り替え（variant algorithm structures、VAS）

入力信号を細かくカテゴリー分けして処理を切り替え

（定常的な有声音、非定常的な有声音、発声の開始、定常的な無声音、非定常的な無声音、背景雑音のみ、など）

信号の修正

EVRC で使われるRCELP アルゴリズムのように、入力信号を知覚上影響が無い範囲で効率的に符号化できるよう修正する

柔軟性のある固定コードブック

CELP での固定コードブックを入力信号の分類に合わせた複数のサブコードブックに分け、それぞれの信号を適切に表現できるようにする

マルチモード

定常的な有声音（ほぼ同じ波形の繰り返し）とそれ以外とで符号化処理の全体構成を変える（Type 1/0 の2種類の構成が存在）

SMV とCDMA2000 ネットワークで長く使われているEVRC（EVRC revision 0）の、MOS 値は以下のようになる^[4]。MOS 値は、総合的な音質を表す主観評価値で1から5の値をとり、5が最も音質が高く1が最も低い。

コーデック	MOS (Clean)	MOS (Noisy)	説明
EVRC	3.581	3.346	EVRC revision 0 での値
SMV (モード0)	3.900	3.569	EVRC と同じ平均ビットレート
SMV (モード1)	3.636	3.528
SMV (モード2)	3.464	3.526

ここで "MOS (Clean)" は背景雑音が無い時の、"MOS (Noisy)" は背景雑音がある時のMOS 値である。同じ平均ビットレートでの総合的な音質は EVRC より高く、7 割程度の平均ビットレート（モード1）でも EVRC とさほど変わらない。

脚注

[編集]

^S. Craig Greer, Andrew DeJaco. “Standardization of the Selectable Mode Vocoder” (PDF). 2010年7月14日閲覧。
^“3GPP2 C.S0030-0 v1.0 Selectable Mode Vocoder (SMV) Service Option for Wideband Spread Spectrum Communication Systems” (PDF). 3rd Generation Partnership Project 2 (2001年6月). 2010年7月14日閲覧。
^“3GPP2 C.S0030-0 v3.0 Selectable Mode Vocoder (SMV) Service Option for Wideband Spread Spectrum Communication Systems” (PDF). 3rd Generation Partnership Project 2 (2004年1月). 2010年7月14日閲覧。
^^a ^b ^cY. Gao, A. Benyassine, J. Thyssen, H. Su, E. Shlomot.Ex-Celp : A Speech Coding Paradigm, IEEE Int. Conf. Acoust. Speech Signal Process, pp.689-692, 2001.
^IETF (2003年7月). “RTP Payload Format for Enhanced Variable Rate Codecs (EVRC) and Selectable Mode Vocoders (SMV)”. IETF Network Working Group.. 2010年7月14日閲覧。
^^a ^bJacob Benesty, M. M. Sondhi, Yiteng Huang (ed).Springer Handbook of Speech Processing. pp.381-382, Springer, 2007.ISBN 978-3540491255.
^Y. Gao, E. Shlomot, A. Benyassine, J. Thyssen, H. Su, C. Murgia.The Smv Algorithm Selected By Tia And 3gpp2 For Cdma, IEEE Int. Conf. Acoust. Speech Signal Process, pp.709-712, 2001.

参考文献

[編集]

Jacob Benesty, M. M. Sondhi, Yiteng Huang (ed).Springer Handbook of Speech Processing. Springer, 2007.ISBN 978-3540491255.
“3GPP2 C.S0030-0 v1.0 Selectable Mode Vocoder (SMV) Service Option for Wideband Spread Spectrum Communication Systems” (PDF). 3rd Generation Partnership Project 2 (2001年6月). 2010年7月14日閲覧。
“3GPP2 C.S0030-0 v3.0 Selectable Mode Vocoder (SMV) Service Option for Wideband Spread Spectrum Communication Systems” (PDF). 3rd Generation Partnership Project 2 (2004年1月). 2010年7月14日閲覧。
S. Craig Greer, Andrew DeJaco. “Standardization of the Selectable Mode Vocoder”. 2010年7月14日閲覧。
Y. Gao, A. Benyassine, J. Thyssen, H. Su, E. Shlomot.Ex-Celp : A Speech Coding Paradigm, IEEE Int. Conf. Acoust. Speech Signal Process, pp.689-692, 2001.
Y. Gao, E. Shlomot, A. Benyassine, J. Thyssen, H. Su, C. Murgia.The Smv Algorithm Selected By Tia And 3gpp2 For Cdma, IEEE Int. Conf. Acoust. Speech Signal Process, pp.709-712, 2001.
J. Makinen, P. Ojala, H. Toukomaa. “Performance Comparison of Source Controlled GSM AMR and SMV Vocoders” (PDF). Nokia Research Center, Multimedia Technologies Laboratory. 2010年7月14日閲覧。

外部リンク

[編集]

3GPP2 Specifications 3GPP2 仕様のウェブページ
RFC 3558 - RTP Payload Format for Enhanced Variable Rate Codecs (EVRC) and Selectable Mode Vocoders (SMV)

マルチメディア圧縮フォーマット

動画ファイルフォーマット

ISO/IEC	MJPEG Motion JPEG 2000 MPEG-1 MPEG-2 Part 2（英語版） MPEG-4 Part 2/ASP（英語版） Part 10/AVC MPEG-H Part 2/HEVC MPEG-I VVC MPEG-5
ITU-T	H.120（英語版） H.261 H.262 H.263 H.264 H.265 DV H.266 H.267
SMPTE	VC-1 VC-2 (Dirac) VC-3 VC-5（英語版） VC-6
AOMedia	AV1
IETF	VP8
SAC	AVS（英語版）
その他	Apple Video（英語版） Bink（英語版） DVI（英語版） EVC（英語版） GIFアニメーション Microsoft Video 1（英語版） MSU Lossless（英語版） OMS Video（英語版） ProRes 422 ProRes 4444 RTVideo（英語版） SheerVideo（英語版） Smacker（英語版） Snow Sorenson Video, Spark（英語版） VP6 VP9 WMV YULS（英語版） XVC Xvid
可逆圧縮	FFV1（英語版） Ut Video Codec Suite
開発停止	Zlib Cinepak Daala Huffyuv Lagarith（英語版） RealVideo RMP4 Indeo Microsoft MPEG-4 QuickTime Pixlet Animation（英語版） Graphics（英語版） Theora Thor VP3 VP7 XEB XVD

音声ファイルフォーマット

ISO/IEC	MPEG-1 Layer III (MP3) MPEG-1 Layer II Multichannel（英語版） MPEG-1 Layer I（英語版） AAC HE-AAC AAC-LD（英語版） MPEG Surround（英語版） MPEG-4 ALS MPEG-4 SLS MPEG-4 DST MPEG-4 HILN MPEG-4 HVXC MPEG-4 CELP MPEG-D USAC（英語版） MPEG-H 3D Audio（英語版）
ITU-T	G.711 (A-law,µ-law) G.718 G.719 G.721 G.722 G.722.1 G.722.2 G.723 G.723.1 G.726 G.728 G.729 G.729.1
IETF	FLAC Opus iLBC Vorbis
3GPP	AMR AMR-WB AMR-WB+ EVRC EVRC-B（英語版） EVS GSM-HR GSM-FR GSM-EFR
ETSI	AC-3 AC-4（英語版） DTS
SAC	AVS（英語版） DRA（英語版）
その他	ADPCM ALAC Codec 2（英語版） Monkey's Audio OptimFROG（英語版） PCM WavPack TAK MQA（英語版）
開発停止	ACELP Asao（英語版） ATRAC CELT iSAC（英語版） La Musepack MT9（英語版） OSQ（英語版） PASC QCELP（英語版） RealAudio RCELP RTAudio（英語版） SD2 SHN SILK（英語版） Siren（英語版） SMV Speex SVOPC（英語版） VMR-WB TTA TwinVQ VSELP（英語版） WMA
Bluetooth	SBC (codec)（英語版） aptX LDAC LC3

画像ファイルフォーマット

IEC,ISO, ITU-T,W3C,IETF	CCITT Group 4（英語版） GIF HEIF HEVC JBIG JBIG2 JPEG JPEG-LS JPEG 2000 JPEG XR JPEG XS（英語版） JPEG XT（英語版） JPEG XL Lossless JPEG PNG APNG TIFF TIFF/EP（英語版） TIFF/IT（英語版） WebP
その他	AVIF BPG DjVu DNG EXR FLIF（英語版） ICER（英語版） ILBM JPEG Network Graphics MNG PCX PGF（英語版） QTVR（英語版） TGA WBMP

マルチメディアコンテナフォーマット

ISO/IEC	MPEG-ES（英語版） MPEG-PES（英語版） MPEG-PS（英語版） MPEG-TS ISO base media file format（英語版） MPEG-4 Part 14 (MP4) Motion JPEG 2000 MPEG-21 Part 9 MPEG media transport（英語版）
ITU-T	H.222.0 T.802
IETF	Matroska Ogg RTP
SMPTE	GXF（英語版） MXF
3GPP	3GP and 3G2（英語版） 3GP 3G2
その他	AMV ASF AIFF AVI AU BPG Bink（英語版） Smacker（英語版） BMP DivX Media Format DPX DSM EVO（英語版） Flash Video (FLV) IFF M2TS（英語版） WebM QuickTime File Format（英語版） (MOV) RatDVD RealMedia RIFF WAV MOD and TOD（英語版） VOB, IFO and BUP（英語版）