【0001】[0001]
【発明の属する技術分野】本発明は、通信や放送によっ
て伝えられた、音声信号の音声パラメータ符号を使って
音声信号を合成する受信装置及び方法、通信装置及び方
法に関する。BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a receiving apparatus and method for synthesizing an audio signal using an audio parameter code of an audio signal transmitted by communication or broadcasting, and a communication apparatus and method.
【0002】[0002]
【従来の技術】従来の通信装置では、受話側における入
力音声と出力音声のサンプリング周波数が同一であると
共に、音声周波数帯域も同一であった。これは、電話回
線の伝送帯域が例えば300〜3400Hzと狭く、電
話回線を介して送られてくる音声信号の周波数帯域が制
限されてしまうためである。2. Description of the Related Art In a conventional communication device, a sampling frequency of an input voice and an output voice on a receiving side are the same, and a voice frequency band is also the same. This is because the transmission band of the telephone line is narrow, for example, 300 to 3400 Hz, and the frequency band of the audio signal transmitted via the telephone line is limited.
【0003】[0003]
【発明が解決しようとする課題】ところで、上記伝送帯
域が制限された、入力音声と同様の音声周波数帯域で出
力される音声では音質はあまり良好とは言えない。つま
り、聴覚的品質が劣る。また、ディジタル携帯電話の音
質についても不満がある。By the way, the sound quality of the sound output in the same sound frequency band as the input sound whose transmission band is limited is not so good. That is, the auditory quality is inferior. They also complain about the sound quality of digital mobile phones.
【0004】本発明は、上記実情に鑑みてなされたもの
であり、聴覚的品質を向上させた受話音声を得ることの
できる受信装置及び方法、通信装置及び方法の提供を目
的とする。[0004] The present invention has been made in view of the above circumstances, and has as its object to provide a receiving apparatus and method, a communication apparatus, and a method capable of obtaining a received voice with improved auditory quality.
【0005】[0005]
【課題を解決するための手段】本発明に係る受信装置
は、上記課題を解決するために、第1のサンプリング周
波数fs1の音声信号を生成するために送信装置から伝送
されてきた伝送信号に基づく音声パラメータ符号を使っ
て生成した第1の帯域B1の音声信号のサンプリング周
波数を第2のサンプリング周波数fs2(fs2>fs1)に
変換するサンプリングレート変換手段と、上記音声パラ
メータ符号を使って生成した第1のサンプリング周波数
fs1の第1の帯域B1の音声信号に第1のポストフィル
タ処理を施すと共に、上記サンプリングレート変換手段
からの第2のサンプリング周波数fs2の第1の帯域B1
の音声信号に第2のポストフィルタ処理を施すポストフ
ィルタ手段と、このポストフィルタ手段からの第1のフ
ィルタ処理出力と第2のフィルタ処理出力とを切り換え
る切り換え手段とを備える。A receiving apparatus according to the present invention.
In order to solve the above-mentioned problem,
Wave number fs1Transmitted from transmitter to generate audio signal
Using speech parameter codes based on the transmitted signal
Generated first band B1Sampling frequency of the audio signal
Change the wave number to the second sampling frequency fs2(Fs2> Fs1)
Sampling rate conversion means for converting
First sampling frequency generated using meter code
fs1First band B of11st post-fill to the audio signal
The sampling rate conversion means.
From the second sampling frequency fs2First band B of1
Post-filtering the audio signal of
Filter means and a first filter from the post-filter means.
Switching between filter processing output and second filter processing output
Switching means.
【0006】ここで、上記ポストフィルタ手段は、上記
第1のサンプリング周波数fs1の音声信号を生成するた
めに送信装置から伝送されてきた伝送信号に基づく音声
パラメータ符号に応じたポストフィルタ処理を上記第1
のポストフィルタ処理として上記第1のサンプリング周
波数fs1の第1の帯域B1の音声信号に施す。Here, the post-filter means performs post-filter processing according to a voice parameter code based on a transmission signal transmitted from a transmitting device to generate a voice signal of the first sampling frequency fs1. First
As the post-filter process performed on the first band B1 of the audio signal of the first sampling frequency fs1.
【0007】また、上記ポストフィルタ手段は、復号化
された信号が入力され、フィルタ係数が第1の周期で更
新されるスペクトル整形フィルタ手段と、このスペクト
ル整形フィルタ手段からの出力が入力され、ゲインが上
記第1の周期とは異なる第2の周期で更新されるゲイン
調整手段とを有する。Further, the post-filter means receives the decoded signal as input and updates the filter coefficient in the first cycle. The spectrum-shaping filter means receives the output from the spectral-shaping filter means as input, Has gain adjustment means updated in a second cycle different from the first cycle.
【0008】本発明に係る受信方法は、上記課題を解決
するために、第1のサンプリング周波数fs1の音声信号
を生成するために送信装置から伝送されてきた伝送信号
に基づく音声パラメータ符号を使って生成した第1のサ
ンプリング周波数fs1の第1の帯域B1の音声信号に第
1のポストフィルタ処理を施して得られる第1の処理出
力と、上記音声パラメータ符号を使って生成した第1の
帯域B1の音声信号のサンプリング周波数を第2のサン
プリング周波数fs2(fs2>fs1)に変換して得た第2
のサンプリング周波数fs2の第1の帯域B1の音声信号
に第2のポストフィルタ処理を施して得られた第2の処
理出力とを、切り換える。[0008] In order to solve the above-mentioned problems, a receiving method according to the present invention uses an audio parameter code based on a transmission signal transmitted from a transmitting apparatus to generate an audio signal having a first sampling frequency fs1. first first first the process output obtained in the audio signal band B1 subjected to the first post-filter processing of the sampling frequency fs1 generated Te, first produced by using the speech parameters reference numeral 1 the sampling frequency of the band B1 of the audio signal a second sampling frequency fs2 second obtained by converting the (fs2> fs1)
And a second processed output obtained by subjecting the audio signal of thefirst bandB1 of the sampling frequency fs2 to the second post-filter processing.
【0009】上記第1のポストフィルタ処理は、上記第
1のサンプリング周波数fs1の音声信号を生成するため
に送信装置から伝送されてきた伝送信号に基づく音声パ
ラメータ符号に応じたポストフィルタ処理を上記第1の
サンプリング周波数fs1の第1の帯域B1の音声信号に
施す。The first post-filter processing includes a post-filter processing corresponding to a voice parameter code based on a transmission signal transmitted from a transmitting device to generate a voice signal of the first sampling frequency fs1. It performed to the first first band B1 of the audio signal having the sampling frequency fs1.
【0010】また、上記第2のポストフィルタ処理は、
上記第1のポストフィルタ処理を、上記サンプリングレ
ート変換された第2のサンプリング周波数fs2の第1の
帯域B1の音声信号におけるfs2/fs1倍のサンプルに
対して施す。[0010] Further, the second post-filter processing includes:
The first post-filter processing, performed on the fs2 / fs1 times of samples in the first band B1 of the audio signal of the second sampling frequency fs2, which has been converted the sampling rate.
【0011】本発明に係る通信装置は、上記課題を解決
するために、入力音声信号に第1のサンプリング周波数
fs1による符号化処理を施して伝送信号を生成する送信
手段と、上記第1のサンプリング周波数fs1の音声信号
を生成するために送信手段から伝送されてきた伝送信号
に基づく音声パラメータ符号を使って生成した第1のサ
ンプリング周波数fs1の第1の帯域B1の音声信号に第
1のポストフィルタ処理を施して得られる第1の処理出
力と、上記音声パラメータ符号を使って生成した第1の
帯域B1の音声信号のサンプリング周波数を第2のサン
プリング周波数fs2(fs2>fs1)に変換して得た第2
のサンプリング周波数fs2の第1の帯域B1の音声信号
に第2のポストフィルタ処理を施して得られた第2の処
理出力とを、切り換えて出力する受信手段とを備える。[0011] In order to solve the above-mentioned problems, a communication device according to the present invention includes: a transmitting unit that performs an encoding process on an input audio signal at a first sampling frequency fs1 to generate a transmission signal; first the first first band B1 of the audio signal having the sampling frequency fs1 generated using the speech parameters code based on the transmission signal transmitted from the transmitting means to generate an audio signal having the sampling frequency fs1 the first and the process output obtained by performing the first post-filter processing, the speech parameter codes to use the sampling frequency of the first band B1 of the audio signal generated by a second sampling frequency fs2 (fs2> fs1 )
Receiving means for switching and outputting a second processed output obtained by subjecting the audio signal of thefirst bandB1 of the sampling frequency fs2 to the second post-filter processing.
【0012】ここで、上記受信手段は、上記第1のサン
プリング周波数fs1の音声信号を生成するために送信装
置から伝送されてきた伝送信号に基づく音声パラメータ
符号を使って生成した第1の帯域B1の音声信号のサン
プリング周波数を第2のサンプリング周波数fs2(fs2
>fs1)に変換するサンプリングレート変換手段と、上
記音声パラメータ符号を使って生成した第1のサンプリ
ング周波数fs1の第1の帯域B1の音声信号に第1のポ
ストフィルタ処理を施すと共に、上記サンプリングレー
ト変換手段からの第2のサンプリング周波数fs2の第1
の帯域B1の音声信号に第2のポストフィルタ処理を施
すポストフィルタ手段と、このポストフィルタ手段から
の第1のフィルタ処理出力と第2のフィルタ処理出力と
を切り換える切り換え手段とを備える。Here, the receiving means includes a first band generated by using a voice parameter code based on a transmission signal transmitted from a transmitting device to generate a voice signal of the first sampling frequency fs1. the sampling frequency of the B1 of the audio signal a second sampling frequency fs2 (fs2
> Fs1 ), and a first post-filter process on the audio signal of the first band B1 of the first sampling frequency fs1 generated using the audio parameter code, The first sampling frequency fs2 from the sampling rate converter
Comprising of a post-filter means for performing a second post-filter processing to the audio signal of the band B1, and a switching means for switching a first filtered output and the second filtered output from the post-filter unit.
【0013】本発明に係る通信方法は、上記課題を解決
するために、入力音声信号に第1のサンプリング周波数
fs1による符号化処理を施して伝送信号を生成すると共
に、上記第1のサンプリング周波数fs1の音声信号を生
成するために送信装置から伝送されてきた伝送信号に基
づく音声パラメータ符号を使って生成した第1のサンプ
リング周波数fs1の第1の帯域B1の音声信号に第1の
ポストフィルタ処理を施して得られる第1の処理出力
と、上記音声パラメータ符号を使って生成した第1の帯
域B1の音声信号のサンプリング周波数を第2のサンプ
リング周波数fs2(fs2>fs1)に変換して得た第2の
サンプリング周波数fs2の第1の帯域B1の音声信号に
第2のポストフィルタ処理を施して得られた第2の処理
出力とを、切り換えて出力する。In order to solve the above-mentioned problems, a communication method according to the present invention performs an encoding process on an input audio signal at a first sampling frequency fs1 to generate a transmission signal, and generates a transmission signal. f tos1 first first band B1 of the audio signal having the sampling frequency fs1 generated using the speech parameters code based on the transmission signal transmitted from the transmitting apparatus to generate an audio signal of the first postfiltering first and processing output obtained by performing the above sound parameter codes to use the sampling frequency of the first band B1 of the audio signal generated by a second sampling frequency fs2 (fs2> fs1 and a second processing output obtained in the first band B1 of the audio signal subjected to the second post-filter processing of the second sampling frequency fs2 obtained by converting the) switching To output.
【0014】[0014]
【発明の実施の形態】以下、本発明の実施の形態につい
て図面を参照しながら説明する。この実施の形態は、本
発明に係る受信装置の具体例となる、図1に示す受信装
置1であり、本発明に係る受信方法を適用している。こ
の受信装置1は、パーソナルディジタルセルラー(Pers
onal Digital Cellular,PDC)として、現在広く使
用されている、ディジタル携帯電話の受話側として用い
ることができる。Embodiments of the present invention will be described below with reference to the drawings. This embodiment is a receiving apparatus 1 shown in FIG. 1 which is a specific example of a receiving apparatus according to the present invention, to which a receiving method according to the present invention is applied. This receiving device 1 is a personal digital cellular (Pers
onal Digital Cellular (PDC), which can be used as a receiving side of a digital mobile phone that is currently widely used.
【0015】受信装置1は、第1のサンプリング周波数
fs1の音声信号を生成するために後述する送信装置から
基地局を介して伝送されてきた音声パラメータ符号か
ら、第1のサンプリング周波数fs1の第1の帯域B1の
音声信号と、第2のサンプリング周波数fs2(fs2>f
s1)の第1の帯域B1の音声信号と、第2のサンプリン
グ周波数fs2(fs2>fs1)の広帯域Bw(第1の帯域
B1+第2の帯域B2)の音声信号を生成し、これら3種
類の音声信号を切り換えて出力する。第1のサンプリン
グ周波数fs1としては8KHzを、第2のサンプリング
周波数fs2としては16KHzを用いる。また、第1の
帯域B1としては300Hz〜3400Hzを、第2の
帯域B2としては3400Hz〜6000Hzを用い
る。したがって、広帯域BWとしては300Hz〜60
00Hzを用いる。The receiving apparatus 1, from the speech parameter code transmitted via a base station from the transmitting apparatus to be described later to generate an audio signal of a first sampling frequency fs1, the first sampling frequency fs1 The audio signal of the first band B1 and the second sampling frequency fs2 (fs2 > f
a first audio signal having a bandwidth B1s1), a second sampling frequencyf s2 (f s2> f s1 ) wideband Bw (first band B1 + second band B2) of the speech signal Is generated, and these three types of audio signals are switched and output. 8 KHz is used as the first sampling frequency fs1 and 16 KHz is used as the second sampling frequency fs2 . As the first band B1 of 300Hz~3400Hz, using 3400Hz~6000Hz the second as band B2. Therefore, the wide-band BW 300Hz~60
00 Hz is used.
【0016】図1において受信装置1がアンテナ2を介
して基地局から受信した音声パラメータ符号は、RF受
信部3、制御部4を経由して信号処理装置5のメモリ5
aに格納される。In FIG. 1, the speech parameter code received by the receiving apparatus 1 from the base station via the antenna 2 is transmitted to the memory 5 of the signal processing apparatus 5 via the RF receiving section 3 and the control section 4.
a.
【0017】信号処理装置5のメモリ5aに格納された
音声パラメータ符号は、信号処理装置5の復号部で復号
処理された後、所定の信号処理が施されて出力される。The speech parameter code stored in the memory 5a of the signal processing device 5 is decoded by the decoding unit of the signal processing device 5, and then subjected to predetermined signal processing and output.
【0018】信号処理装置5からの出力信号は、D/A
変換器6でアナログ信号とされた後、アンチエイリアシ
ングフィルタ7、ボリューム8及びアンプ9を経由して
スピーカ10から出力される。なお、制御部4には例え
ばキー操作部11とLCD表示部12が接続されてい
る。The output signal from the signal processing device 5 is D / A
After being converted into an analog signal by the converter 6, the analog signal is output from the speaker 10 via the anti-aliasing filter 7, the volume 8 and the amplifier 9. The control unit 4 is connected to, for example, a key operation unit 11 and an LCD display unit 12.
【0019】図2には、上記音声パラメータ符号を例え
ば無線伝送路、及び基地局を介して送信する、送信装置
15の構成を示す。この送信装置15もPDCとして、
現在広く使用されている、ディジタル携帯電話の送話側
として使うことができる。FIG. 2 shows a configuration of a transmitting device 15 that transmits the above-mentioned voice parameter code via, for example, a radio transmission path and a base station. This transmitting device 15 is also a PDC,
It can be used as a transmitting side of a digital mobile phone which is widely used at present.
【0020】マイクロホン16から入力された音声信号
は、アンプ17,ボリューム18,アンチエイリアシン
グフィルタ19及びA/D変換器20を経由して信号処
理装置21のメモリ21aに格納される。The audio signal input from the microphone 16 is stored in the memory 21a of the signal processing device 21 via the amplifier 17, the volume 18, the anti-aliasing filter 19, and the A / D converter 20.
【0021】メモリ21aに格納された音声信号は、信
号処理装置21内部の音声符号化部で符号処理され、音
声パラメータ符号として出力される。この音声パラメー
タ符号は、制御部22及びRF送信部23及びアンテナ
24を経由して基地局へ送信される。なお、制御部22
にはキー操作部25とLCD表示部26が接続されてい
る。The audio signal stored in the memory 21a is subjected to code processing in an audio encoding unit inside the signal processing device 21, and is output as an audio parameter code. This voice parameter code is transmitted to the base station via the control unit 22, the RF transmission unit 23, and the antenna 24. The control unit 22
Is connected to a key operation unit 25 and an LCD display unit 26.
【0022】ここで、信号処理装置21内部の音声符号
化部は、無線伝送路により制限される狭帯域化を考慮し
た音声パラメータ符号を生成する。一般的には、300
Hz〜3400Hzの伝送帯域を考慮している。上記伝
送信号に基づく音声パラメータ符号は、制御部22を介
してRF送信部23に供給される。例えば、音声パラメ
ータ符号としては、励振源に関する線形予測(LPC)
残差や、線形予測係数αがある。他には、ピッチ周波数
に関するラグLAGや、例えば20msecのフレームにお
けるフレームパワーR0等がある。Here, the speech coding unit in the signal processing device 21 generates a speech parameter code in consideration of the narrow band limited by the radio transmission path. Generally, 300
A transmission band of 3 Hz to 3400 Hz is considered. The voice parameter code based on the transmission signal is supplied to the RF transmission unit 23 via the control unit 22. For example, as the voice parameter code, linear prediction (LPC) for the excitation source
There are residuals and linear prediction coefficients α. Other examples include a lag LAG related to the pitch frequency and a frame power R0 in a frame of, for example, 20 msec.
【0023】図1の受信装置1内部の信号処理装置5
は、図3に示すデコーダ27と、図4に示す信号切換部
32とを備えてなる。The signal processing device 5 inside the receiving device 1 of FIG.
Comprises a decoder 27 shown in FIG. 3 and a signal switching unit 32 shown in FIG.
【0024】上記図2に示した送信装置15の信号処理
装置21における音声符号部での符号化方法がPSI−
CELP(Pitch Synchronus Innovation - CELP:ピッ
チ同期雑音励振源−CELP)符号化方式によるもので
あるとすれば、デコーダ27は、PSI−CELP符号
化による伝送信号を用いて音声をデコードし、出力端子
28にデコード音声SndNを、出力端子29に線形予
測係数αNを、出力端子30に励振源NExcNを供給す
る。PSI−CELP符号化による伝送信号は、第1の
サンプリング周波数fs1=8KHzの第1の帯域B1=
300〜3400Hzの音声信号を生成するために伝送
されてきたものである。The encoding method in the speech encoding unit in the signal processing device 21 of the transmitting device 15 shown in FIG.
If it is based on the CELP (Pitch Synchronous Innovation-CELP) coding method, the decoder 27 decodes the sound using the transmission signal based on the PSI-CELP coding, and outputs an output terminal 28. supplying an excitation source NExcN decoded audio SndN, the linear prediction coefficient alphaN to the output terminal 29, an output terminal 30 to. The transmission signal by the PSI-CELP coding has a first sampling frequency fs1 = first band B1 of 8 kHz = B1 =
It has been transmitted to generate an audio signal of 300 to 3400 Hz.
【0025】信号切換部32は、第1のサンプリング周
波数fs1(=8KHz)の音声信号を生成するために送
信装置から伝送されてきたPSI−CELP符号による
伝送信号を使ってデコーダ27が復号した第1の帯域B
1(300Hz〜3400Hz)のデコード音声SndN
のサンプリングレートを第2のサンプリング周波数fs2
(=16KHz)に変換するサンプリグレート変換手段
と、上記音声パラメータ符号を使って生成した第1のサ
ンプリング周波数fs1の第1の帯域B1の音声信号に第
1のポストフィルタ処理を施すと共に、上記サンプリン
グレート変換手段からの第2のサンプリング周波数fs2
の第1の帯域B1の音声信号に第2のポストフィルタ処
理を施すポストフィルタ手段と、このポストフィルタ手
段からの第1のフィルタ処理出力と第2のフィルタ処理
出力とを切り換える切り換え手段とを備える。The signal switching unit 32 uses the PSI-CELP code transmitted from the transmitting apparatus to generate a speech signal of the first sampling frequency fs1 (= 8 KHz), and the decoder 27 decodes the signal. First band B
1 (300Hz-3400Hz) decoded sound SndN
Of the second sampling frequency fs2
(= 16 KHz) and a first post-filter process on the audio signal of the first band B1 of the first sampling frequency fs1 generated using the audio parameter code, The second sampling frequency fs2 from the sampling rate conversion means
And post-filtering means for performing a second post-filtering process on the audio signal of thefirst band B1 , and switching means for switching between the first filter-processed output and the second filter-processed output from the post-filtering device. Prepare.
【0026】さらに、この受信装置は、上記デコーダ2
7が上記PSI−CELP符号をデコードして得た線形
予測係数αNと、励振源NExcNとを使って第2のサン
プリング周波数fs2(=16KHz)の第2の帯域B2
(3400Hz〜6000Hz)の信号を推測する帯域
外成分推測手段と、上記サンプリングレート変換手段か
らの第2のサンプリング周波数fs2の第1の帯域B1の
音声信号に上記帯域外成分推測手段で推測された第2の
サンプリング周波数fs2の第2の帯域B2の音声信号を
加算する加算手段とを備え、上記ポストフィルタ手段は
上記加算手段からの加算出力に第3のポストフィルタ処
理を施し、上記切り換え手段は上記第3のフィルタ処理
出力も上記第1及び第2のフィルタ処理出力とともに切
り換える。Further, the receiving apparatus is provided with the decoder 2
7 uses a linear prediction coefficient αN obtained by decoding the PSI-CELP code and an excitation source NExcN to obtain a second band B2 of a second sampling frequency fs2 (= 16 KHz).
And out-of-band component predicting unit to estimate signal (3400Hz~6000Hz), guess second first band B1 of the audio signal to the out-of-band component predicting unit of the sampling frequency fs2 from the sampling rate converting means It is second and an adding means for adding a second audio signal having a bandwidth B2 of the sampling frequency fs2 was, the post-filtering means performs a third post filter processing to the addition output from said adding means, The switching means switches the third filtered output together with the first and second filtered outputs.
【0027】ここで、上記ポストフィルタ手段は図4に
示す第1のポストフィルタ処理(a)47、第2のポス
トフィルタ処理(b)48、第3のポストフィルタ処理
(b)49を行う。これら各ポストフィルタ処理47〜
49は、上記ポストフィルタ手段の行う、ポストフィル
タ処理をブロックとして示したものである。第2又は第
3のポストフィルタ処理(b)48又は49は、第1の
ポストフィルタ処理(a)47を第2のサンプリング周
波数fs2の第1の帯域B1又は広帯域BWの音声信号にお
けるfs2/fs1倍のサンプルに対して施す。なお、上記
ポストフィルタ処理に付加している(a),(b)は、
サンプリング周波数fs1で動作する処理と、fs2で動作
する処理を区別する記号である。Here, the post-filter means performs the first post-filter processing (a) 47, the second post-filter processing (b) 48, and the third post-filter processing (b) 49 shown in FIG. Each of these post-filter processes 47 to
Reference numeral 49 denotes the post-filter processing performed by the post-filter means as a block. The second or third post-filter processing (b) 48 or 49 performs the first post-filter processing (a) 47 on the audio signal of the first band B1 or the wide band BW at the second sampling frequency fs2 . It is applied to a sample offs2 /fs1 times. (A) and (b) added to the post-filter processing are
A process that operates at the sampling frequency fs1, a processing to distinguish symbols operating at fs2.
【0028】上記サンプリングレート変換手段は図4に
おけるアップサンプル部45である。上記切り換え手段
は切り換えスイッチ部150である。上記加算手段は加
算部46である。そして、上記帯域外成分推測手段は、
アップサンプル部45とポストフィルタ処理(a)4
7,(b)48及び(b)49と切り換えスイッチ部1
50と加算部46を除いた部分である。The sampling rate conversion means is the up-sampling section 45 in FIG. The switching means is the switching unit 150. The adding means is the adding unit 46. Then, the out-of-band component estimating means includes:
Up-sampling unit 45 and post-filter processing (a) 4
7, (b) 48 and (b) 49 and changeover switch unit 1
This is a part excluding 50 and the adder 46.
【0029】以下、信号切換部32の構成を詳細に説明
する。Hereinafter, the configuration of the signal switching section 32 will be described in detail.
【0030】先ず、上記帯域外成分推測手段は、線形予
測係数→自己相関(αN→rN)変換部36と、自己相関
(r)広帯域化部37と、広帯域コードブック(rwC
B)38と、自己相関→線形予測係数(rw→αw)変換
部39と、LPC合成部40と、励振源拡張部41と、
高域抽出&抑圧フィルタ42と、乗算部43とからな
る。First, the out-of-band component estimating means includes a linear prediction coefficient → autocorrelation (αN → rN ) conversion section 36, an autocorrelation (r) widening section 37, and a wide band codebook (rw C
B) 38, an autocorrelation → linear prediction coefficient (rw → αw ) conversion unit 39, an LPC synthesis unit 40, an excitation source extension unit 41,
It comprises a high-frequency extraction & suppression filter 42 and a multiplier 43.
【0031】入力端子34から供給された線形予測係数
αNは、線形予測係数→自己相関(αN→rN)変換部3
6に供給される。このαN→rN変換部36は、線形予測
係数αNを自己相関rNに変換し、自己相関(r)広帯域
化部37に供給する。自己相関(r)広帯域化部37は
広帯域コードブック(rwCB)38を用いて自己相関
rを広帯域化(拡張化)する。広帯域コードブック(r
wCB)38は広帯域音から抽出した自己相関パラメー
タrwを用いて予め作成されている。The linear prediction coefficient αN supplied from the input terminal 34 is converted into a linear prediction coefficient → autocorrelation (αN → rN ) conversion unit 3
6. The αN → rN conversion unit 36 converts the linear prediction coefficient αN into an autocorrelation rN , and supplies the auto correlation rN to the autocorrelation (r) widening unit 37. The autocorrelation (r) widening unit 37 widens (extends) the autocorrelation r using the wideband codebook (rw CB) 38. Wideband codebook (r
w CB) 38 is created in advance using the autocorrelation parameter rw extracted from the wideband sound.
【0032】広帯域コードブック(rwCB)38を用
い、自己相関(r)広帯域化部37が拡張した拡張自己
相関rwは自己相関→線形予測係数(rw→αw)変換部
39に供給される。rw→αw変換部39は拡張自己相関
rwを拡張線形予測係数αwに再度変換してからLPC合
成部40に供給する。[0032] Using the wide band code book (rw CB) 38, extended autocorrelation rw autocorrelation (r) broadband portion 37 is expanded in the autocorrelation → linear prediction coefficients (rw → αw) conversion unit 39 Supplied. The rw → αw conversion unit 39 converts the extended auto-correlation rw into the extended linear prediction coefficient αw again, and supplies it to the LPC synthesis unit 40.
【0033】LPC合成部40はrw→αw変換部39か
らの広帯域線形予測係数αwと後述する励振源拡張部4
1からの拡張励振源に基づいて広帯域音声を合成する。The LPC synthesizing section 40 receives the wideband linear prediction coefficient αw from the rw → αw converting section 39 and the excitation source expanding section 4 described later.
A wideband speech is synthesized based on the extended excitation source from No. 1.
【0034】LPC合成部40の合成出力は、高域抽出
&抑圧フィルタ42に供給される。高域抽出&抑圧フィ
ルタ42は、周波数帯域300Hz〜3400Hzの信
号成分を除去し、第2の帯域B2=3400Hz〜60
00Hzの信号成分を抽出するように、高い周波数成分
を抑圧する。このフィルタ42からのフィルタ出力に
は、端子44から供給されるゲインが乗算部43で乗算
される。乗算部43でゲインが乗算された出力(第2の
帯域B2=3400Hz〜6000Hz)は、加算部4
6に供給される。The combined output of the LPC combining section 40 is supplied to a high-frequency extraction and suppression filter 42. The high-frequency extraction & suppression filter 42 removes signal components in the frequency band of 300 Hz to 3400 Hz, and the second band B2 = 3400 Hz to 60
High frequency components are suppressed so that 00 Hz signal components are extracted. The filter output from the filter 42 is multiplied by a gain supplied from a terminal 44 by a multiplier 43. The output (second band B2 = 3400 Hz to 6000 Hz) multiplied by the gain in the multiplier 43 is output to the adder 4
6.
【0035】上記LPC合成部40には、励振源拡張部
41からの拡張励振源も供給される。励振源拡張部41
は、入力端子35から供給された励振源に関するパラメ
ータとしてのLPC残差(このLPC残差を励振源NE
xcNと記す。)を拡張する。励振源拡張部41の詳細
な構成を図5に示す。The extended excitation source from the excitation source extension unit 41 is also supplied to the LPC synthesis unit 40. Excitation source expansion unit 41
Is the LPC residual as a parameter relating to the excitation source supplied from the input terminal 35 (this LPC residual is referred to as the excitation source NE
xcN. ) To expand. FIG. 5 shows a detailed configuration of the excitation source extension unit 41.
【0036】先ず、入力端子35を介して供給された励
振源NExcNは、アップサンプル部50によりアップ
サンプルされる。アップサンプル部50の出力は、LP
F51、ブースト部52を介して出力端子55からLP
C合成部40に送られる。すなわち、励振源NExcN
をアップサンプルした信号は、音声信号を合成する際の
上記拡張励振源として用いられる。ブースト部52は、
破擦音や摩擦音が検出された場合に、上記拡張励振源を
ブーストするためのもので、そのブースト量は破擦音検
出部54の出力により制御される。破擦音検出部54
は、入力端子53を介して上記αN→rN変換部36から
の自己相関rNを受け取り、破擦音や摩擦音を検出す
る。First, the excitation source NExcN supplied via the input terminal 35 is up-sampled by the up-sampling section 50. The output of the up-sampling unit 50 is LP
F51, LP from output terminal 55 via boost section 52
It is sent to the C synthesizing unit 40. That is, the excitation source NExcN
Is used as the above-mentioned extended excitation source when synthesizing the audio signal. The boost unit 52
This is for boosting the extended excitation source when an affricate or fricative is detected, and the boost amount is controlled by an output of the affricate detector 54. Affricate detector 54
Receives the autocorrelation rN from the αN → rN conversion unit 36 via the input terminal 53 and detects affricate and fricative.
【0037】このような構成の励振源拡張部41からの
励振源が上記LPC合成部40に供給される。そして、
LPC合成部40は、rw→αw変換部39からの広帯域
線形予測係数αwと上記拡張励振源に基づいて広帯域音
声を合成する。ここまでの構成が上記帯域外成分推測手
段である。The excitation source from the excitation source extension unit 41 having such a configuration is supplied to the LPC synthesis unit 40. And
LPC synthesis section 40 synthesizes a wideband speech based on the wideband linear prediction coefficient alphaw and the extended excitation source from rw →α w conversion unit 39. The configuration up to here is the out-of-band component estimating means.
【0038】次に、入力端子33を介して上記図3のデ
コーダ27から供給されるデコード音声SndNにポス
トフィルタ処理を施すポストフィルタについて説明す
る。Next, a description will be given of a post-filter for performing post-filter processing on the decoded sound SndN supplied from the decoder 27 of FIG. 3 through the input terminal 33.
【0039】このポストフィルタは、本件出願人が既に
出願した、特開平9−127996号公報に開示されて
いる、音声復号化方法及び装置で適用している技術によ
り、上記デコード音声信号SndNのスペクトル整形及
び聴感上の品質向上を実現する。[0039] The post-filter is present applicant has already filed by disclosed in Japanese Patent Laid-Open No. 9-127996, is applied in the speech decoding method and apparatus technology, the decoded audio signal SndN Realizes spectral shaping and quality improvement in audibility.
【0040】図6には上記音声復号化方法及び装置を適
用したポストフィルタの詳細な構成を示す。ポストフィ
ルタの要部となるスペクトル整形フィルタ131は、ホ
ルマント強調フィルタ132と高域強調フィルタ133
とからなっている。このスペクトル整形フィルタ131
からの出力は、スペクトル整形によるゲイン変化を補正
するためのゲイン調整器134に送られており、このゲ
イン調整器134のゲインGは、ゲイン制御部136に
より決定される。ゲイン制御部136は、スペクトル整
形フィルタ131の入力と出力とを比較してゲイン変化
を計算し、ゲイン調整器134のゲインGの補正値を算
出する。ここで、スペクトル整形フィルタ131の上記
入力とは端子135を介して供給される、上記デコード
音声信号SndNであり、上記出力とは端子137を介
してこのポストフィルタから導出されるフィルタ出力で
ある。このような構成のポストフィルタの詳細な動作に
ついては後述する。FIG. 6 shows a detailed configuration of a post filter to which the above-described speech decoding method and apparatus are applied. A spectrum shaping filter 131 which is a main part of the post filter includes a formant emphasis filter 132 and a high-frequency emphasis filter 133.
It consists of This spectrum shaping filter 131
Are sent to a gain adjuster 134 for correcting a gain change due to spectrum shaping. The gain G of the gain adjuster 134 is determined by the gain control unit 136. The gain control section 136 compares the input and output of the spectrum shaping filter 131 to calculate a gain change, and calculates a correction value of the gain G of the gain adjuster 134. Here, the input of the spectrum shaping filter 131 is the decoded audio signal SndN supplied via a terminal 135, and the output is a filter output derived from the post filter via a terminal 137. . The detailed operation of the post filter having such a configuration will be described later.
【0041】次に、上記サンプリング周波数変換手段と
してのアップサンプル部45は、サンプリング周波数が
第1のサンプリング周波数fs1=8kHzの第1の帯域
B1=300Hz〜3400Hzの音声信号のサンプリ
ング周波数を第2のサンプリング周波数fs2=16kH
zに変換する。このアップサンプル部45からの、サン
プリング周波数が第2のサンプリング周波数fs2=16
kHzに変換された第1の帯域B1=300Hz〜34
00Hzの音声信号成分は、加算部46及び第2のポス
トフィルタ処理(b)48に供給される。Next, the up-sampling unit 45 as the sampling frequency conversion means converts the sampling frequency of the audio signal having thefirst band B1 = 300 Hz to 3400 Hz with the first sampling frequency fs1 = 8 kHz. 2 sampling frequency fs2 = 16 kHz
Convert to z. The sampling frequency from this up-sampling unit 45 is the second sampling frequency fs2 = 16.
first band converted into the kHz B1 = 300Hz~34
The 00 Hz audio signal component is supplied to the adder 46 and the second post-filter processing (b) 48.
【0042】また、加算部46が乗算部43からの乗算
出力である、第2のサンプリング周波数fs2=16kH
zの第2の帯域B2=3400Hz〜6000Hzの音
声信号成分に、アップサンプル部45からの上記音声信
号成分を加算することによって得られた加算出力は第3
のポストフィルタ処理(b)49に供給される。The second sampling frequency fs2 = 16 kHz, which is a multiplication output from the multiplication unit 43 by the addition unit 46.
the sound signal component of the second band B2 = 3400Hz~6000Hz of z, the added output is the third obtained by adding the audio signal component from the up-sampling unit 45
(B) 49 of the post-filter processing.
【0043】また、信号切換部32は、上述したよう
に、上記切換手段として切換スイッチ150を備え、第
1のポストフィルタ処理(a)47でスペクトル整形及
び聴感上の品質が向上された上記第1のサンプリング周
波数fs1(=8KHz)の第1の帯域B1(300Hz
〜3400Hz)の音声信号と、第2のポストフィルタ
処理(b)48でスペクトル整形及び聴感上の品質が向
上された第2のサンプリング周波数fs2(=16KH
z)の第1の帯域B1(300Hz〜3400Hz)の
音声信号と、第3のポストフィルタ処理(b)49でス
ペクトル整形及び聴感上の品質が向上された第2のサン
プリング周波数fs2(=16KHz)の広帯域Bw(3
00Hz〜6000Hz)の音声信号を切り換える。Further, as described above, the signal switching section 32 includes the changeover switch 150 as the above-mentioned switching means, and the first post-filter processing (a) 47 improves the spectral shaping and the quality of the audibility by the first post-filter processing (a) 47. 1 sampling frequency fs1 (= 8 KHz) in a first band B1 (300 Hz
33400 Hz) and a second sampling frequency fs2 (= 16 KH) whose spectral shaping and audible quality have been improved by the second post-filter processing (b) 48
z) the audio signal of the first band B1 (300 Hz to 3400 Hz) and the second sampling frequency fs2 (= 16 KHz) broadband Bw (3
(00 Hz to 6000 Hz).
【0044】切り換えスイッチ150は、上記第1のサ
ンプリング周波数fs1(=8KHz)の第1の帯域B1
(300Hz〜3400Hz)の音声信号を被選択端子
aで受け、第2のサンプリング周波数fs2(=16KH
z)の第1の帯域B1(300Hz〜3400Hz)の
音声信号を被選択端子bで受け、第2のサンプリング周
波数fs2(=16KHz)の広帯域Bw(300Hz〜
6000Hz)の音声信号を被選択端子cで受ける。そ
して、切り換え制御信号端子151からの切り換え制御
信号に基づいて選択片dを切り換えることにより、いず
れか一の音声信号をD/A変換器6に供給する。The changeover switch 150 is connected to the first band B1 of the first sampling frequency fs1 (= 8 KHz).
(300 Hz to 3400 Hz) is received at the selected terminal a, and the second sampling frequency fs2 (= 16 KH)
z) receives an audio signal in the first band B1 (300 Hz to 3400 Hz) at the selected terminal b, and outputs a wide band Bw (300 Hz to 300 kHz) with the second sampling frequency fs2 (= 16 KHz).
6000 Hz) at the selected terminal c. Then, by switching the selection piece d based on the switching control signal from the switching control signal terminal 151, one of the audio signals is supplied to the D / A converter 6.
【0045】以上の構成の信号切換部32における、主
要な動作原理について以下に説明する。信号切換部32
は、300Hz〜3400Hzの第1の帯域B1の音声
信号を生成するための音声パラメータ符号から3400
Hz〜6000Hzという第2の帯域B2用の音声符号
化パラメータを生成し、広帯域LPC合成を行う。その
後、原音声の周波数帯域である低域(300Hz〜34
00Hz)側を、原音声を16KHzにアップサンプル
したものに置換する。すなわち、高域通過フィルタを施
し高域(3400Hz〜6000Hz)のみを残し、こ
の高域成分の中でも高い周波数成分を抑圧し、さらにゲ
インを調整し、その後、原音声(300Hz〜3400
Hz)をアップサンプル(第2のサンプリング周波数f
s2)したものに加算して、第2のサンプリング周波数f
s2(=16KHz)の広帯域Bw(300Hz〜600
0Hz)の音声信号を得る。The main operation principle of the signal switching section 32 having the above configuration will be described below. Signal switching unit 32
Is 3400 from a speech parameter code for generating a speech signal of afirst band B1 of 300 Hz to 3400 Hz.
A speech coding parameter for asecond band B2 of2 Hz to 6000 Hz is generated, and wideband LPC synthesis is performed. Then, the low frequency band (300 Hz to 34 Hz)
00 Hz) side is replaced with the original sound up-sampled to 16 KHz. That is, a high-pass filter is applied to leave only the high band (3400 Hz to 6000 Hz), high frequency components among these high band components are suppressed, and the gain is further adjusted.
Hz) is up-sampled (second sampling frequency f
s2 ) and add the second sampling frequency f
s2 (= 16KHz) of broadband Bw (300Hz~600
0 Hz).
【0046】ここで、音声パラメータ符号の広帯域化
(或いは拡張化)は、線形予測係数αの広帯域化、励振
源NExcNの広帯域化の二つが必要である。また、α
の広帯域化には、αと相互に変換可能なパラメータであ
る自己相関rによるコードブックを予め作成しておく必
要がある。このコードブックによる量子化、逆量子化に
よって自己相関rが広帯域化される。Here, to widen (or expand) the speech parameter code, it is necessary to widen the linear prediction coefficient α and widen the excitation source NExcN. Also, α
In order to widen the bandwidth, it is necessary to previously create a codebook based on autocorrelation r, which is a parameter that can be mutually converted with α. The band of the autocorrelation r is widened by quantization and inverse quantization by the codebook.
【0047】先ず、線形予測係数αの広帯域化について
説明する。αはスペクトル包絡を表すフィルタ係数であ
ることに着目し、高域側を推定しやすい別のスペクトル
包絡を表すパラメータである自己相関rに一旦変換し、
これを広帯域化し、その後で広帯域(或いは拡張)自己
相関rwから広帯域(或いは拡張)線形予測係数αwに逆
変換する。拡張にはベクトル量子化を用いる。狭帯域自
己相関rnをベクトル量子化し、そのインデックスから
対応するrwを求めればよい。First, the widening of the linear prediction coefficient α will be described. Note that α is a filter coefficient representing a spectral envelope, and is temporarily converted into an autocorrelation r, which is a parameter representing another spectral envelope that makes it easy to estimate the high frequency side,
This is widened, and then inversely converted from the wideband (or extended) autocorrelation rw to the wideband (or extended) linear prediction coefficient αw . Vector quantization is used for extension. Narrowband autocorrelation rn to vector quantization, may be obtained the corresponding rw from that index.
【0048】狭帯域自己相関と広帯域自己相関には、後
述するように一定の関係が成り立つため、広帯域自己相
関によるコードブックのみを用意すればよく、狭帯域自
己相関をこれによりベクトル量子化でき、また逆量子化
により広帯域自己相関が求まる。Since a certain relationship is established between the narrowband autocorrelation and the wideband autocorrelation as described later, only the codebook based on the wideband autocorrelation needs to be prepared, and the narrowband autocorrelation can be vector-quantized by this. Wideband autocorrelation is obtained by inverse quantization.
【0049】狭帯域信号を、広帯域信号を帯域制限した
ものとすれば、広帯域自己相関と狭帯域自己相関には以
下の(1)式に示す関係がある。Assuming that the narrow-band signal is obtained by band-limiting the wide-band signal, the wide-band auto-correlation and the narrow-band auto-correlation have a relationship represented by the following equation (1).
【0050】[0050]
【数1】(Equation 1)
【0051】ここで、φは自己相関、xnは狭帯域信
号、xwは広帯域信号、hは帯域制限フィルタのインパ
ルス応答である。Here, φ is an autocorrelation,xn is a narrow band signal,xw is a wide band signal, and h is an impulse response of a band limiting filter.
【0052】さらに、自己相関とパワースペクトルの関
係から、次の(2)式が得られる。Further, the following equation (2) is obtained from the relationship between the autocorrelation and the power spectrum.
【0053】[0053]
【数2】(Equation 2)
【0054】この帯域制限フィルタのパワー特性と等し
い周波数特性を持つ、もう一つの帯域制限フィルタを考
え、これをH’とすれば、上記(2)式は、次の(3)
式のようになる。If another band-limiting filter having a frequency characteristic equal to the power characteristic of this band-limiting filter is considered, and this is set to H ′, the above equation (2) becomes the following equation (3)
It looks like an expression.
【0055】[0055]
【数3】(Equation 3)
【0056】この新たなフィルタの通過域、阻止域は当
初の帯域制限フィルタと同等であり、減衰特性が2乗と
なる。したがって、この新たなフィルタもまた、帯域制
限フィルタといえる。これを考慮すると、狭帯域自己相
関は、広帯域自己相関と帯域制限のフィルタのインパル
ス応答との畳み込み、すなわち広帯域自己相関を帯域制
限したものと単純化される。すなわち、次の(4)式と
なる。The pass band and the stop band of this new filter are the same as those of the original band limiting filter, and the attenuation characteristic is squared. Therefore, this new filter can also be said to be a band limiting filter. With this in mind, narrowband autocorrelation is simplified to the convolution of broadband autocorrelation with the impulse response of a band-limited filter, ie, band-limited wideband autocorrelation. That is, the following equation (4) is obtained.
【0057】[0057]
【数4】(Equation 4)
【0058】以上より、狭帯域自己相関をベクトル量子
化するにあたっては、広帯域コードブックのみを用意す
れば、量子化時に必要な狭帯域ベクトルは演算により作
成が可能であり、狭帯域自己相関から予めコードブック
を用意しておく必要がないことが分かる。As described above, when performing vector quantization of the narrow-band autocorrelation, if only a wide-band codebook is prepared, the narrow-band vector required at the time of quantization can be created by calculation. It turns out that there is no need to prepare a codebook.
【0059】さらに、各広帯域自己相関のrwコードベ
クタは単調減少もしくはなだらかに増減するカーブを持
つために、上記H’により低域通過させても大きな変化
がなく、rn量子化は、直接rwコードブックで行える。
ただし、サンプリング周波数が1/2のため、1次おき
に比較する必要がある。[0059] Further, in order to have a curve rw code vector of each wide-band autocorrelation increase or decrease monotonically decreasing or gradually, the H 'by no significant change be passed through a low-pass, rn quantization directly It can be carried out in the rw code book.
However, since the sampling frequency is 1/2, it is necessary to compare every other order.
【0060】線形予測係数αの拡張は有声音(V)と無
声音(UV)に分けることによって、さらに精度良い拡
張が可能であるため、これも行っている。これに伴いコ
ードブックもV用、UV用の二つを用いている。The linear prediction coefficient α is expanded because it can be more accurately expanded by dividing it into voiced sound (V) and unvoiced sound (UV). Accordingly, two codebooks for V and UV are used.
【0061】次に、励振源の拡張について説明する。P
SI−CELPにおいては狭帯域での励振源を、図5の
アップサンプル部50でゼロ値を挿入することでアップ
サンプルし、エイリアシング歪みを発生させたものを用
いる。この方法は非常に単純であるが、元の音声のパワ
ーや調波構造の差分が保存されるので、励振源としては
十分な品質であるといえる。Next, expansion of the excitation source will be described. P
In the SI-CELP, an excitation source in a narrow band is upsampled by inserting a zero value in an upsampling unit 50 in FIG. 5 to generate an aliasing distortion. Although this method is very simple, it can be said that the quality is sufficient as an excitation source because the difference between the power and the harmonic structure of the original voice is preserved.
【0062】そして、以上で得られた広帯域αと広帯域
励振源によりLPC合成部40でLPC合成を行う。Then, LPC combining is performed by the LPC combining section 40 using the broadband α and the broadband excitation source obtained as described above.
【0063】また、広帯域LPC合成された音声は、こ
のままでは品質が悪いので、低域側はコーデック出力の
オリジナル音声SndNで置換する。このために、合成
音のうち3400Hz以上を抽出し、一方でコーデック
出力をfs=16KHzにアップサンプルし、これらを
加算する。Since the sound obtained by wideband LPC synthesis is inferior in quality as it is, the original sound SndN of the codec output is replaced on the low frequency side. For this purpose, 3400 Hz or more is extracted from the synthesized sound, while the codec output is up-sampled to fs = 16 KHz, and these are added.
【0064】このとき、乗算部43で高域側に乗算する
ゲインをユーザの好みに応じてゲイン調整器で調整可能
としている。ユーザ毎の個人差が大きいため、この値を
可変にしている。高域側ゲインの値をユーザからの入力
により予め設定しておき、この値を参照し、乗算を行
う。At this time, the gain by which the multiplier 43 multiplies the high frequency side can be adjusted by the gain adjuster according to the user's preference. This value is variable because individual differences between users are large. The value of the high-frequency gain is set in advance by an input from the user, and multiplication is performed with reference to this value.
【0065】また、加算前に高域側に対し、高域抽出&
抑圧フィルタ42で約6KHz以上の成分を若干抑圧す
るフィルタリングを施すことで、聴きやすい音にしてい
る。このフィルタ係数を選択可能とし、予め選択された
フィルタにより処理を行うことで、好みに応じ高域側の
周波数帯域を選択可能とした。このフィルタの選択もユ
ーザの入力により設定する。Before addition, high-frequency extraction &
By applying a filtering that slightly suppresses a component of about 6 KHz or more by the suppression filter 42, a sound that is easy to hear is obtained. This filter coefficient is selectable, and processing is performed using a filter selected in advance, so that a higher frequency band can be selected as desired. The selection of this filter is also set by the user's input.
【0066】なお、このフィルタ42を用いての処理
は、低域側のパワー特性に影響を与えないため、加算後
に行っても良い。あるいは、あえて低域側にも影響のあ
るフィルタを加算後に施す事も可能である。以上により
広帯域音声が得られる。The processing using the filter 42 does not affect the power characteristics on the low frequency side, and may be performed after the addition. Alternatively, it is also possible to apply a filter that also affects the low-frequency side after addition. As described above, a wideband sound can be obtained.
【0067】次に、以上の動作原理に基づいて、信号切
換部32が広帯域音声信号を生成する動作について図7
のフローチャートを用いて説明する。Next, the operation of the signal switching section 32 for generating a wideband audio signal based on the above-described operation principle will be described with reference to FIG.
This will be described with reference to the flowchart of FIG.
【0068】ステップS1で図4に示したαN→rN変換
部36は、図3に示したデコーダ27によりデコードさ
れた線形予測係数αNを自己相関rNに変換する。また、
デコーダ27でデコードされた音声信号SndNはステ
ップS2でV/UV判定される。In step S1, the αN → rN conversion section 36 shown in FIG. 4 converts the linear prediction coefficient αN decoded by the decoder 27 shown in FIG. 3 into an autocorrelation rN. Also,
The audio signal SndN decoded by the decoder 27 is subjected to V / UV determination in step S2.
【0069】このステップS2での判定結果がVである
と、ステップS4では有声音用自己相関rNを量子化す
る。この量子化は、ステップS3で求めた狭帯域V用パ
ラメータを用いる。すなわち、広帯域Vのコードブック
38から、1次おきに比較して求めた狭帯域V用パラメ
ータを用いる。If the result of the determination in step S2 is V, in step S4 the voiced autocorrelation rN is quantized. This quantization uses the narrowband V parameter obtained in step S3. That is, the parameters for the narrow band V obtained by comparing every other order from the code book 38 of the wide band V are used.
【0070】一方、ステップS2での判定結果がUVで
あるときには、ステップS4ではステップS3で求めた
狭帯域UV用パラメータを用いて無声音用自己相関rを
量子化する。On the other hand, when the result of the determination in step S2 is UV, in step S4 the autocorrelation r for unvoiced sound is quantized using the narrow-band UV parameters obtained in step S3.
【0071】そして、ステップS5でそれぞれ広帯域V
コードブック又は広帯域UVコードブックを用いて逆量
子化し、これにより広帯域自己相関rWが得られる。広
帯域自己相関rWはステップS6でrW→αW変換部39
によりαWに変換される。Then, in step S5, the wide band V
Inverse quantization using a codebook or a wideband UV codebook, which results in a wideband autocorrelation rW. The broadband autocorrelation rW is calculated in step S 6 by rW → αW converter 39
To αW.
【0072】一方、デコーダ27からの励振源は、ステ
ップS7で図5に示したアップサンプル部50によりサ
ンプル間にゼロが詰められることでアップサンプルさ
れ、エイリアシングにより広帯域化される。これが広帯
域励振源として、LPC合成部40に供給される。On the other hand, the excitation source from the decoder 27 is up-sampled by padding zeros between the samples by the up-sampling unit 50 shown in FIG. 5 in step S7, and is widened by aliasing. This is supplied to the LPC synthesis section 40 as a broadband excitation source.
【0073】そして、ステップS8で、LPC合成部4
0が広帯域αWと広帯域励振源とを、LPC合成し、広
帯域の音声信号が得られる。Then, in step S8, the LPC synthesizing unit 4
0 indicates that the wideband αW and the wideband excitation source are LPC-combined to obtain a wideband audio signal.
【0074】しかし、このままでは予測によって求めら
れた広帯域信号にすぎず、予測による誤差が含まれてい
るので品質が悪い。特に入力狭帯域音声の周波数範囲
(300Hz〜3400Hz)に関しては、コーデック
出力のオリジナル音声SndN(入力音声)をそのまま利
用したほうが良い。However, if this is the case, it is merely a wideband signal obtained by prediction, and the quality is poor because it contains errors due to prediction. In particular, regarding the frequency range of the input narrowband audio (300 Hz to 3400 Hz), it is better to use the original audio SndN (input audio) output from the codec as it is.
【0075】したがって、LPC合成部40からの合成
音のうち、入力狭帯域音声の周波数範囲300〜340
0HzをステップS9でバンドストップフィルタ(BS
P)を用いたフィルタリングにより除去する。Therefore, of the synthesized sounds from the LPC synthesizing section 40, the frequency range of the input narrowband sound is 300 to 340.
0 Hz is set to the band stop filter (BS
It is removed by filtering using P).
【0076】そして、ステップS10でアップサンプル
部45により上記オリジナル音声SndNをアップサン
プルしたものと、ステップS13で加算部46により加
算する。このとき、ステップS11で高域側に対し、約
6KHz以上の成分を若干抑圧する高域抽出&抑圧フィ
ルタ42によりフィルタリングすることで、聴きやすい
音にしている。このフィルタ係数は上述したように選択
可能とされている。Then, in step S10, the up-sampler 45 up-samples the original sound SndN and adds it in step S13 by the adder 46. At this time, by filtering the high-frequency side with a high-frequency extraction and suppression filter 42 that slightly suppresses a component of about 6 KHz or more in step S11, the sound is easy to hear. This filter coefficient can be selected as described above.
【0077】さらに、ステップS12では、乗算部43
を用いてユーザの好みに応じて高域側ゲインを調整可能
としている。Further, in step S12, the multiplication section 43
To adjust the high-frequency gain according to the user's preference.
【0078】なお、ここで、信号切換部32で用いる、
コードブックの作成について説明する。コードブックの
作成は一般によく知られたGLA(Generalized Lloyd A
lgorithm)による方法である。広帯域音声を一定時間、
例えば20msecごとのフレームに区切り、そのフレーム
毎に、一定次例えば6次までの自己相関を求めておく。
このフレーム毎の自己相関をトレーニングデータとし、
6次元のコードブックを作成する。このとき、有声音、
無声音の区別を行い、有声音の自己相関、無声音の自己
相関を別々に集め、それぞれのコードブックを作成して
もよい。この場合、帯域拡張処理中αの拡張時、コード
ブックを参照するが、このときにも有声音、無声音の判
別を行い、対応するコードブックを利用する。Here, the signal switching unit 32 uses
The creation of a codebook will be described. The creation of the codebook is generally well-known by GLA (Generalized Lloyd A
lgorithm). Broadband audio for a certain time,
For example, the frame is divided into frames every 20 msec, and the autocorrelation of a certain order, for example, the sixth order is obtained for each frame.
The autocorrelation for each frame is used as training data,
Create a 6-dimensional codebook. At this time, voiced sound,
Unvoiced sounds may be distinguished, and the autocorrelation of voiced sounds and the autocorrelation of unvoiced sounds may be separately collected to create respective codebooks. In this case, the code book is referred to when α is expanded during the band expansion processing. At this time, a voiced sound or an unvoiced sound is determined, and the corresponding code book is used.
【0079】信号切換部32では、広帯域有声音用コー
ドブックと広帯域無声音用コードブックを用いている。
この広帯域有声音用コードブックの作成については図8
を、広帯域無声音用コードブックの作成については図9
を参照しながら説明する。The signal switching section 32 uses a codebook for wideband voiced sound and a codebook for wideband unvoiced sound.
For the creation of the codebook for the wideband voiced sound, see FIG.
Figure 9 shows how to create a codebook for wideband unvoiced sound.
This will be described with reference to FIG.
【0080】先ず、広帯域音声信号を学習用に用意し、
図8のステップS31で1フレーム20msecにフレーミ
ングする。次に、ステップS32で各フレームにおい
て、例えばフレームエネルギーやゼロクロスの値等を調
べることによって有声音(V)か無声音(UV)かの分
類を行う。First, a wideband audio signal is prepared for learning,
In step S31 in FIG. 8, framing is performed for 20 msec per frame. Next, in step S32, for each frame, classification is performed as to whether it is a voiced sound (V) or an unvoiced sound (UV) by examining, for example, a frame energy, a value of zero crossing, and the like.
【0081】そして、ステップS33で広帯域有声音フ
レームにおいて、例えば6次までの自己相関パラメータ
rを計算する。また、ステップS34では広帯域無声音
フレームにおける、例えば6次までの自己相関パラメー
タrを求める。Then, in step S33, for example, the autocorrelation parameter r up to the sixth order is calculated in the wideband voiced sound frame. In step S34, for example, the autocorrelation parameter r up to the sixth order in the wideband unvoiced sound frame is obtained.
【0082】この各フレームの6次の自己相関パラメー
タから、図9のステップS41で広帯域パラメータを抽
出し、GLAにより次元6の広帯域V(UV)コードブ
ックをステップS42で作成する。A wideband parameter is extracted from the sixth-order autocorrelation parameters of each frame in step S41 of FIG. 9 and a wideband V (UV) codebook of dimension 6 is created in step S42 by GLA.
【0083】以上のようにして広帯域有声音用及び広帯
域無声音用コードブックを作成できる。As described above, a codebook for a wideband voiced sound and a wideband unvoiced sound can be created.
【0084】次に、上記図6に示したポストフィルタの
動作について詳細に説明する。Next, the operation of the post filter shown in FIG. 6 will be described in detail.
【0085】図6のスペクトル整形フィルタ131の特
性PF(Z)は、線形予測係数αiを用いると、次の
(5)式のように表せる。The characteristic PF (Z) of the spectrum shaping filter 131 shown in FIG. 6 can be expressed by the following equation (5) using the linear prediction coefficient αi.
【0086】[0086]
【数5】(Equation 5)
【0087】この(5)式の分数部分がホルマント強調
フィルタ特性を、(1−kz-1)の部分が高域強調フィ
ルタ特性をそれぞれ表す。また、β,γ,kは定数であ
り、一例としてβ=0.6,γ=0.8,k=0.3を挙げるこ
とができる。The fractional part of the equation (5) represents the formant enhancement filter characteristic, and the part (1-kz−1 ) represents the high-frequency enhancement filter characteristic. Β, γ, and k are constants, for example, β = 0.6, γ = 0.8, and k = 0.3.
【0088】また、ゲイン調整部134のゲインGは、
次の(6)式のように表せる。The gain G of the gain adjusting unit 134 is
It can be expressed as the following equation (6).
【0089】[0089]
【数6】(Equation 6)
【0090】この式中のx(i)はスペクトル整形フィ
ルタ131の入力、すなわち上記広帯域音声信号Snd
wであり、y(i)はスペクトル整形フィルタの出力で
ある。X (i) in this equation is the input of the spectrum shaping filter 131, that is, the wideband audio signal Snd
w and y (i) is the output of the spectral shaping filter.
【0091】ここで、上記スペクトル整形フィルタ13
1の係数の更新周期は、図10に示すように、LPC合
成部40の係数であるαwの更新周期と同じく、20サ
ンプル、2.5msecであるのに対し、ゲイン調整部
134のゲインGの更新周期は、160サンプル、20
msecである。Here, the spectrum shaping filter 13
As shown in FIG. 10, the update cycle of the coefficient of 1 is 20 samples and 2.5 msec, similarly to the update cycle of the coefficient αw of the LPC synthesis unit 40, whereas the gain G of the gain adjustment unit 134 is Update cycle is 160 samples, 20
msec.
【0092】このように、ポストフィルタのスペクトル
整形フィルタ131の係数の更新周期に比較して、ゲイ
ン調整部134のゲインGの更新周期を長くとることに
より、ゲイン調整の変動による悪影響を防止している。As described above, the update cycle of the gain G of the gain adjustment unit 134 is made longer than the update cycle of the coefficient of the spectrum shaping filter 131 of the post filter, thereby preventing adverse effects due to fluctuations in gain adjustment. I have.
【0093】すなわち、一般のポストフィルタにおいて
は、スペクトル整形フィルタの係数の更新周期とゲイン
の更新周期とを同じにしており、このとき、ゲインの更
新周期を20サンプル、2.5msecとすると、図1
0からも明らかなように、1ピッチ周期の中で変動する
ことにより、クリックノイズを生じる原因となる。そこ
で、ポストフィルタでは、ゲインの切換周期をより長
く、例えば1フレーム分の160サンプル、20mse
cとすることにより、ゲインの変動を防止することがで
きる。また逆に、スペクトル整形フィルタ131の係数
の更新周期を160サンプル、20msecと長くする
ときには、短時間の音声スペクトルの変化にポストフィ
ルタ特性が追従できず、良好な聴感上の品質改善が行え
ないが、このフィルタ係数の更新周期を20サンプル、
2.5msecと短くすることにより、効果的なポスト
フィルタ処理が可能となる。That is, in a general post-filter, the update cycle of the coefficient of the spectrum shaping filter and the update cycle of the gain are set to be the same. At this time, if the update cycle of the gain is 20 samples and 2.5 msec, FIG. 1
As is clear from 0, the fluctuation within one pitch period causes click noise. Therefore, in the post filter, the switching period of the gain is made longer, for example, 160 samples for one frame, 20 msec.
By setting c, it is possible to prevent a change in gain. Conversely, when the update cycle of the coefficient of the spectrum shaping filter 131 is increased to 160 samples and 20 msec, the post-filter characteristic cannot follow a short-time change in the audio spectrum, and good audibility quality cannot be improved. , The update cycle of this filter coefficient is 20 samples,
By making the length as short as 2.5 msec, effective post-filter processing can be performed.
【0094】ところで、このポストフィルタは、上記第
1のサンプリング周波数fs1(8KHz)の音声信号を
生成するために送信装置から伝送されてきた伝送信号に
基づく音声パラメータ符号(例えばα)を用いて上記デ
コード音声信号に第1のポストフィルタ処理(a)47
を施しているが、上記第2のポストフィルタ処理(b)
48及び第3のポストフィルタ処理(b)49が実際に
ポストフィルタ処理を施すのは、第2のサンプリング周
波数fs2(16KHz)とされた音声信号に対してであ
る。このため、第2のポストフィルタ処理(b)48及
び第3のポストフィルタ処理(b)49は、上記第1の
ポストフィルタ処理(a)47をサンプリング周波数が
16KHzの音声信号における2(=fs2/fs1)倍の
サンプルに対して施す。By the way, this post-filter uses an audio parameter code (for example, α) based on a transmission signal transmitted from a transmission device to generate an audio signal of the first sampling frequency fs1 (8 KHz). First post-filter processing (a) 47 on the decoded audio signal
But the second post-filter processing (b)
48 and the third post-filter processing (b) 49 actually perform post-filter processing on an audio signal having the second sampling frequency fs2 (16 KHz). For this reason, the second post-filter processing (b) 48 and the third post-filter processing (b) 49 perform the first post-filter processing (a) 47 on the basis of 2 (= fs2 /fs1 ) times as many samples.
【0095】このようにして、第1のポストフィルタ処
理(a)47は上記デコード音声信号のスペクトル整形
及び聴感上の品質を効果的に向上できる。また、第2の
ポストフィルタ処理(b)48及び第3のポストフィル
タ処理(b)49は第2のサンプリング周波数fs2(1
6KHz)とされた第1の帯域B1及び広帯域BWの音声
信号のスペクトル整形及び聴感上の品質を効果的に向上
できる。In this manner, the first post-filter processing (a) 47 can effectively improve the spectral shaping of the decoded audio signal and the quality of the audibility. The second post-filter processing (b) 48 and the third post-filter processing (b) 49perform the second sampling frequency fs2 (1
The spectrum shaping and audible quality of the audio signal of the first band B1 and the wide band BW of 6 KHz) can be effectively improved.
【0096】そして、図4に示した信号切換部32は、
切り換えスイッチ150により、第1のポストフィルタ
処理(a)47,第2のポストフィルタ(b)48及び
第3のポストフィルタ(b)49でスペクトル整形及び
聴感上の品質が効果的に向上された音声信号、つまりサ
ンプリング周波数が8KHzの第1の帯域B1(300
〜3400Hz)の音声信号と、サンプリング周波数が
16KHzの第1の帯域B1(300〜3400Hz)
の音声信号と、サンプリング周波数が16KHzの広帯
域BW(300〜6000Hz)の広帯域音声信号とを
切り換えてD/A変換器6に送ることができる。The signal switching section 32 shown in FIG.
With the changeover switch 150, the first post-filter processing (a) 47, the second post-filter (b) 48, and the third post-filter (b) 49 effectively improve the spectral shaping and audibility. An audio signal, that is, a first band B1 (300
33400 Hz) and a first band B1 (300 to 3400 Hz) with a sampling frequency of 16 KHz.
And audio signal can be sent to the D / A converter 6 sampling frequency by switching between wideband speech signal of the wide band BW (300~6000Hz) of 16 KHz.
【0097】このため、上記図1に示した受信装置1
は、サンプリング周波数が8KHz,16KHzと異な
る、第1の帯域B1(300Hz〜3400Hz)のP
SI−CELPによる受話音声信号や、サンプリング周
波数が16KHzの広帯域(300Hz〜6000H
z)のPSI−CELPによる受話音声信号にポストフ
ィルタ処理を施した上で、ユーザに選択させることがで
きる。ユーザ側では選択肢が広がる。また、状況に応じ
て受話音声を帯域拡張するだけでなく、入力時の帯域と
同様にすることができるので、内蔵のバッテリーの減り
を抑えることもできる。Therefore, the receiving apparatus 1 shown in FIG.
Is the P of thefirst band B1 (300 Hz to 3400 Hz) whose sampling frequency is different from 8 kHz and 16 kHz.
The received voice signal by SI-CELP and a wide band (300 Hz to 6000H) with a sampling frequency of 16 KHz
After subjecting the received voice signal by the PSI-CELP of z) to post-filter processing, the user can make a selection. The user has more options. In addition, not only the band of the received voice can be extended according to the situation, but also the band can be made the same as the band at the time of input, so that the built-in battery can be reduced.
【0098】なお、D/A変換器6でのサンプリング周
波数を16KHzに固定して、16KHz固定での第1
の帯域B1の音声信号と、広帯域BWの音声信号を切り換
えるようにしてもよい。D/A変換器6で用いるクロッ
クを8Kz/16KHzと切り換えなくて済むため、ハ
ードウェア負担を減らすことができる。The sampling frequency of the D / A converter 6 is fixed at 16 KHz, and the first frequency is fixed at 16 KHz.
And the audio signal having a bandwidth B1 in, may be switched to the audio signal of the wide band BW. Since the clock used in the D / A converter 6 does not need to be switched to 8 kHz / 16 kHz, the hardware load can be reduced.
【0099】また、アップサンプル部45では、切り換
えスイッチ150における、サンプリング周波数の8K
Hz/16KHz切り換え持に、フィルタ出力をクリア
しておく。ノイズ発生を防ぐためである。In the up-sampling section 45, the changeover switch 150 sets the sampling frequency to 8K.
The filter output is cleared before switching between Hz and 16 kHz. This is to prevent generation of noise.
【0100】次に、図1の受信装置1内部の信号処理装
置5の他の具体例について図11〜図13を用いて説明
する。この他の具体例は、図11に示すデコーダ58
と、図12に示す信号切換部65とを備えてなる。Next, another specific example of the signal processing device 5 inside the receiving device 1 of FIG. 1 will be described with reference to FIGS. Another specific example is the decoder 58 shown in FIG.
And a signal switching unit 65 shown in FIG.
【0101】上記図2に示した送信装置15の信号処理
装置21における音声符号器での符号化方法がVSEL
P(Vector Sum Excited Linear Prediction:ベクトル
和励起線形予測)符号化方式によるものであるとすれ
ば、デコーダ58はVSELP符号化による伝送信号を
デコードして出力端子59にデコード音声SndNを、
出力端子60に線形予測係数αNを、出力端子61に励
振源1ExcN1を、出力端子62に励振源2ExcN2を
供給する。The encoding method in the speech encoder in the signal processing device 21 of the transmitting device 15 shown in FIG.
If it is based on the P (Vector Sum Excited Linear Prediction) encoding method, the decoder 58 decodes the transmission signal by VSELP encoding and outputs the decoded audio SndN to the output terminal 59.
The linear prediction coefficient αN is supplied to the output terminal 60, the excitation source 1ExcN1 is supplied to the output terminal 61, and the excitation source 2ExcN2 is supplied to the output terminal 62.
【0102】信号切換部65は、図12に示すような構
成であり、上記図4に示した信号切換部32と異なるの
は励振源切換&拡張部68を設けている点である。The signal switching unit 65 has a configuration as shown in FIG. 12, and is different from the signal switching unit 32 shown in FIG. 4 in that an excitation source switching and extension unit 68 is provided.
【0103】PSI−CELPは、コーデック自体、特
に有声音Vを聴感上滑らかに聞こえるような処理を行っ
ているが、VSELPにはこれがなく、このために帯域
幅拡張したときに若干雑音が混入したように聞こえる。
そこで、広帯域励振源を作成する際に、励振源を切り換
える部を内部に備えた励振源切換&拡張部68を用い、
図12に示すような処理を施す。この図12に示す処理
は、上記図7に示した励振源処理をステップS87〜ス
テップS89のように変えたものである。The PSI-CELP performs a process for allowing the codec itself, particularly the voiced sound V, to be heard audibly smoothly. However, the VSELP does not have this, and therefore, when the bandwidth is expanded, noise is mixed slightly. Sounds like.
Therefore, when creating a broadband excitation source, an excitation source switching & extension unit 68 having a unit for switching the excitation source is used.
The processing shown in FIG. 12 is performed. The processing shown in FIG. 12 is obtained by changing the excitation source processing shown in FIG. 7 to steps S87 to S89.
【0104】VSELPの励振源は、コーデックに利用
されるパラメータβ(長期予測係数), bL[i](長期フィル
タ状態),γ(利得), c1[i](励起コードベクタ)により、 β * bL[i] + γ * c1[i] として作成されるが、このうち前者がピッチ成分、後者
がノイズ成分を表すので、これをβ * bL[i]とγ * c1
[i]に分け、ステップS87で、一定の時間範囲におい
て、前者のエネルギーが大きい場合にはピッチが強い有
声音と考えられるため、ステップS88でYESに進
み、励振源をパルス列とし、ピッチ成分のない部分では
NOに進み0に抑圧した。また、ステップS87でエネ
ルギーが大きくない場合には従来どおりとし、こうして
作成された狭帯域励振源にステップS89でゼロ詰め処
理によりPSI-CELP同様0を詰めアップサンプルすること
で広帯域励振源とした。これにより、VSELPにおけ
る有声音の聴感上の品質が向上する。The excitation source of VSELP is represented by β * using parameters β (long-term prediction coefficient), bL [i] (long-term filter state), γ (gain), and c1 [i] (excitation code vector) used for the codec. bL [i] + γ * c1 [i], the former of which represents the pitch component and the latter of which represents the noise component, which are represented by β * bL [i] and γ * c1
[i], and if the former energy is large in a certain time range in step S87, the voice is considered to be a voiced sound having a strong pitch. Therefore, the process proceeds to YES in step S88, the excitation source is set to a pulse train, and the pitch component When there was no part, the process proceeded to NO and suppressed to zero. If the energy is not large in step S87, the conventional narrow band excitation source is filled up with zero by PZ-CELP in step S89 by zero padding in step S89 to obtain a wide band excitation source. As a result, the auditory quality of voiced sound in VSELP is improved.
【0105】そして、ステップS92でアップサンプル
部45により上記オリジナル音声SndNをアップサン
プルしたものと、ステップS95で加算部46により加
算する。このとき、ステップS91で高域側に対し、約
6KHz以上の成分を若干抑圧する高域抽出&抑圧フィ
ルタ42によりフィルタリングを施すことで、聴きやす
い音にしている。このフィルタ係数は上述したように選
択可能としている。Then, in step S92, the upsampling section 45 upsamples the original sound SndN and adds it in step S95 with the adding section 46. At this time, the high-frequency side is filtered by a high-frequency extraction and suppression filter 42 that slightly suppresses a component of about 6 KHz or more in step S91, so that the sound is easy to hear. This filter coefficient is selectable as described above.
【0106】さらに、ステップS93では、乗算部43
を用いてユーザの好みに応じて高域側ゲインを調整可能
としている。Further, in step S93, the multiplication section 43
To adjust the high-frequency gain according to the user's preference.
【0107】この信号切換部65でも第1のポストフィ
ルタ処理(a)47,第2のポストフィルタ処理(b)
48及び第3のポストフィルタ処理(b)49を行うポ
ストフィルタを備えている。第1のポストフィルタ処理
(a)47は上記デコード音声信号のスペクトル整形及
び聴感上の品質を効果的に向上でき、第2のポストフィ
ルタ処理(b)48及び第3のポストフィルタ処理
(b)49は第2のサンプリング周波数fs2(16KH
z)とされた第1の帯域B1及び広帯域BWの音声信号の
スペクトル整形及び聴感上の品質を効果的に向上でき
る。The signal switching section 65 also performs the first post-filter processing (a) 47 and the second post-filter processing (b).
48 and a post filter for performing the third post filter processing (b) 49. The first post-filter processing (a) 47 can effectively improve the spectral shaping and audibility of the decoded audio signal, and the second post-filter processing (b) 48 and the third post-filter processing (b) 49 is the second sampling frequency fs2 (16 KH
z) It is possible to effectively improve the spectral shaping and audible quality of the audio signals of the first band B1 and the wide band BW set as z).
【0108】したがって、VSELPによる復号化方法
を用いた信号切換部65でも、ユーザの好みに基づい
て、サンプリング周波数が8KHzの第1の帯域B
1(300〜3400Hz)の音声信号,サンプリング
周波数が16KHzの第1の帯域B1の音声信号又はサ
ンプリング周波数が16KHzの広帯域BWの音声信号
のスペクトル整形及び聴感上の品質を効果的に向上した
上で切り換えてD/A変換器6に送ることができる。Therefore, even in the signal switching section 65 using the decoding method based on VSELP, the first band B having a sampling frequency of 8 KHz is used based on the user's preference.
Audio signal1 (ranging from 300 to 3400 Hz), the sampling frequency is first audio signal or the sampling frequency of the band B1 of 16KHz has improved the quality of the spectral shaping and audibility of the audio signal of the wide band BW of 16KHz effectively It can be switched above and sent to the D / A converter 6.
【0109】このため、上記図1に示した受信装置1
は、サンプリング周波数が8KHz,16KHzと異な
る、第1の帯域B1(300Hz〜3400Hz)のV
SELPによる受話音声信号や、サンプリング周波数が
16KHzの広帯域(300Hz〜6000Hz)のV
SELPによる受話音声信号にポストフィルタ処理を施
した上で、ユーザに選択させることができる。ユーザ側
では選択肢を広げることができる。状況に応じてVSE
LPによる受話音声を帯域拡張するだけでなく、入力時
の帯域と同様にすることができるので、内蔵のバッテリ
ーの減りを抑えることもできる。For this reason, the receiving apparatus 1 shown in FIG.
Is the V of thefirst band B1 (300 Hz to 3400 Hz) whose sampling frequency is different from 8 kHz and 16 kHz.
Received voice signal by SELP and V of wide band (300Hz-6000Hz) with sampling frequency of 16KHz
After performing post-filter processing on the received voice signal by the SELP, the user can make a selection. The user has more options. VSE depending on the situation
In addition to extending the band of the voice received by the LP, the band can be made the same as the band at the time of input, so that the built-in battery can be reduced.
【0110】さらに、図1の受信装置1内部の信号処理
装置5としては、図14に示す信号切換部70とその前
段の、図15に示すデコード部とからなる信号処理装置
を他の具体例としてもよい。Further, as the signal processing device 5 in the receiving device 1 of FIG. 1, a signal processing device comprising a signal switching unit 70 shown in FIG. 14 and a decoding unit shown in FIG. It may be.
【0111】図15に示したデコード部は、VSELP
デコーダ77とPSI−CELPデコーダ81とを備
え、送信装置側から伝送されてくる、音声パラメータ符
号の符号化方式に応じて、デコーダ77又は81への音
声パラメータ符号の入力を切り換える。つまり、入力端
子75を介して受け取った上記音声パラメータ符号を切
換スイッチ76で、上記符号化方式の種類、つまりVS
ELP又はPSI-CELPに応じて切り換えている。The decoding section shown in FIG.
It includes a decoder 77 and a PSI-CELP decoder 81, and switches the input of the speech parameter code to the decoder 77 or 81 according to the encoding method of the speech parameter code transmitted from the transmitting device side. That is, the voice parameter code received via the input terminal 75 is switched by the changeover switch 76 to the type of the coding method, that is, VS.
Switching is performed according to ELP or PSI-CELP.
【0112】VSELPデコーダ77からの二つの励振
源1ExcN1及び励振源2ExcN2は出力端子78及び
79を介して図14の入力端子66及び67に供給され
る。また、PSI-CELPデコーダ81からの励振源
NExcNは出力端子82を介して図14の入力端子3
5に供給される。The two excitation sources 1ExcN1 and 2ExcN2 from the VSELP decoder 77 are supplied via the output terminals 78 and 79 to the input terminals 66 and 67 of FIG. Moreover, the excitation source NExcN from PSI-CELP decoder 81 input terminal 3 of FIG. 14 through the output terminal 82
5 is supplied.
【0113】また、VSELPデコーダ77又はPSI
−CELPデコーダ81からの線形予測係数αV又はαp
は上記符号化方式の種類に応じて切換スイッチ80によ
り選択されてから出力端子83を介して図14の入力端
子34に供給される。The VSELP decoder 77 or PSI
-Linear prediction coefficient αV or αp from CELP decoder 81
Is selected by the changeover switch 80 in accordance with the type of the encoding method, and is supplied to the input terminal 34 of FIG.
【0114】同様に、VSELPデコーダ77又はPS
I−CELPデコーダ81からのデコード音声も上記符
号化方式の種類に応じて切換スイッチ84により選択さ
れてから出力端子85を介して図14の入力端子33に
供給される。Similarly, the VSELP decoder 77 or PS
The decoded audio from the I-CELP decoder 81 is also selected by the changeover switch 84 in accordance with the type of the above-mentioned encoding method, and is then supplied to the input terminal 33 of FIG.
【0115】また、図14に示す、信号切換部70側で
は、上記符号化方式の種類に応じて切り換わる切換スイ
ッチ71により、励振源切換&拡張部68又は励振源拡
張部41からの励振源出力を切り換えて、LPC合成部
40に供給する。Further, on the signal switching section 70 side shown in FIG. 14, an excitation source switching & extension section 68 or an excitation source from the excitation source extension section 41 is switched by a changeover switch 71 which switches according to the type of the above-mentioned encoding method. The output is switched and supplied to the LPC synthesis unit 40.
【0116】この信号切換部70でも第1のポストフィ
ルタ処理(a)47,第2のポストフィルタ処理(b)
48及び第3のポストフィルタ処理(b)49を行うポ
ストフィルタを備えている。第1のポストフィルタ処理
(a)47は上記デコード音声信号のスペクトル整形及
び聴感上の品質を効果的に向上でき、第2のポストフィ
ルタ処理(b)48及び第3のポストフィルタ処理
(b)49は第2のサンプリング周波数fs2(16KH
z)とされた第1の帯域B1及び広帯域BWの音声信号の
スペクトル整形及び聴感上の品質を効果的に向上でき
る。The signal switching section 70 also performs the first post-filter processing (a) 47 and the second post-filter processing (b).
48 and a post filter for performing the third post filter processing (b) 49. The first post-filter processing (a) 47 can effectively improve the spectral shaping and audibility of the decoded audio signal, and the second post-filter processing (b) 48 and the third post-filter processing (b) 49 is the second sampling frequency fs2 (16 KH
z) It is possible to effectively improve the spectral shaping and audible quality of the audio signals of the first band B1 and the wide band BW set as z).
【0117】したがって、この信号切換部70によれ
ば、送信装置側から伝送されてくる伝送信号の符号化方
式の種類に応じ、サンプリング周波数が8KHz,16
KHzと異なる、第1の帯域B1(300Hz〜340
0Hz)の受話音声信号や、サンプリング周波数が16
KHzの広帯域(300Hz〜6000Hz)の受話音
声信号にポストフィルタ処理を施した上で、ユーザに選
択させることができる。ユーザ側では選択肢を広げるこ
とができる。状況に応じて受話音声を帯域拡張するだけ
でなく、入力時の帯域と同様にすることができるので、
内蔵のバッテリーの減りを抑えることもできる。Therefore, according to the signal switching section 70, the sampling frequency is 8 KHz, 16 KHz in accordance with the type of the encoding system of the transmission signal transmitted from the transmitting device side.
KHz, the first band B1 (300 Hz to 340
0 Hz) and a sampling frequency of 16
A post-filtering process can be performed on a received voice signal of a wide band (300 Hz to 6000 Hz) of KHz, and the user can make a selection. The user has more options. Depending on the situation, it is possible to not only extend the received voice band but also make it the same as the input band,
The built-in battery can be reduced.
【0118】さらに、上記図1の受信装置1内部の信号
処理装置5は、図16に示すような信号切換部90を備
えてもよい。Further, the signal processing device 5 inside the receiving device 1 of FIG. 1 may include a signal switching unit 90 as shown in FIG.
【0119】信号切換部90の入力端子91には、上記
音声パラメータ符号の内、LPC残差である励振源が供
給される。また、入力端子92には線形予測係数αが供
給される。入力端子91からの励振源は、LPC合成フ
ィルタ93に送られると共に、アップサンプル部100
に送られる。入力端子92からの線形予測係数はLPC
合成フィルタ93に送られる。An input terminal 91 of the signal switching section 90 is supplied with an excitation source which is an LPC residual among the above speech parameter codes. The input terminal 92 is supplied with a linear prediction coefficient α. The excitation source from the input terminal 91 is sent to the LPC synthesis filter 93 and the up-sampler 100
Sent to The linear prediction coefficient from the input terminal 92 is LPC
The signal is sent to the synthesis filter 93.
【0120】LPC合成フィルタ93は、入力端子91
からの励振源を基に、入力端子92からの線形予測係数
を用いて音声信号を合成する。LPC合成フィルタ93
で合成された音声信号は、第1のポストフィルタ処理
(a)161及びアップサンプル部94に供給される。The LPC synthesis filter 93 has an input terminal 91
The speech signal is synthesized using the linear prediction coefficient from the input terminal 92 on the basis of the excitation source from. LPC synthesis filter 93
Are supplied to the first post-filter processing (a) 161 and the up-sampling unit 94.
【0121】第1のポストフィルタ処理(a)161
は、上記第1のポストフィルタ処理(a)47と同様に
動作する。ここでは説明を省略する。First post-filter processing (a) 161
Operates similarly to the first post-filter processing (a) 47 described above. Here, the description is omitted.
【0122】アップサンプル部94は、LPC合成フィ
ルタ93で合成された音声信号のサンプリング周波数f
s1をアップサンプルする。アップサンプルされた上記音
声信号は、第2のポストフィルタ処理(b)162及び
バンドバスフィルタ(BPF)95に供給される。The up-sampling section 94 outputs the sampling frequency f of the audio signal synthesized by the LPC synthesis filter 93.
Upsample s1 . The upsampled audio signal is supplied to the second post-filter processing (b) 162 and the band-pass filter (BPF) 95.
【0123】第2のポストフィルタ処理(b)162は
上記第2のポストフィルタ処理(b)48と同様に動作
する。すなわち、上記第1のポストフィルタ処理(a)
161をサンプリング周波数が16KHzの音声信号に
おける2(=fs2/fs1)倍のサンプルに対して施す。The second post-filter processing (b) 162 operates in the same manner as the second post-filter processing (b) 48. That is, the first post-filter processing (a)
161 is applied to 2 (=fs2 /fs1 ) times the sample of the audio signal whose sampling frequency is 16 kHz.
【0124】バンドパスフィルタ95はアップサンプル
部94からの出力のうち所定の帯域のみを通過させ、加
算部96に供給する。このアップサンプル部94、バン
ドパスフィルタ95、加算部96に通じる経路は、元の
周波数帯域の成分の信号を合成された音声信号に付加す
るための経路である。The band-pass filter 95 allows only a predetermined band of the output from the up-sampling section 94 to pass therethrough and supplies it to the adding section 96. The path leading to the up-sampling section 94, the band-pass filter 95, and the adding section 96 is a path for adding the signal of the component of the original frequency band to the synthesized audio signal.
【0125】また、LPC合成フィルタ93から線形予
測係数−自己相関変換部97に線形予測係数が送られ
る。線形予測係数−自己相関変換部97は、線形予測係
数を自己相関に変換するものである。この自己相関は狭
帯域コードブック98に送られると共に、破擦音検出部
99に送られる。The LPC synthesis filter 93 sends the linear prediction coefficient to the linear prediction coefficient-autocorrelation conversion section 97. The linear prediction coefficient-autocorrelation converter 97 converts the linear prediction coefficient into autocorrelation. This autocorrelation is sent to the narrowband codebook 98 and also to the affricate detector 99.
【0126】また、入力端子91からの励振源は、アッ
プサンプル部100でアップサンプルされ、ローパスフ
ィルタ101、ブースト部102を介して、LPC合成
フィルタ103に送られる。ブースト部102は、破擦
音や摩擦音が検出された場合に励振源をブーストするた
めのもので、ブースト部102のブースト量は、破擦音
検出部99の出力により制御される。The excitation source from the input terminal 91 is up-sampled by the up-sampling unit 100 and sent to the LPC synthesis filter 103 via the low-pass filter 101 and the boost unit 102. The boost unit 102 boosts the excitation source when an affricate or a fricative is detected, and the boost amount of the boost unit 102 is controlled by an output of the affricate detector 99.
【0127】狭帯域コードブック98には、予め複数の
音声信号のパターンから得られた狭帯域音声信号の自己
相関情報がコードベクタとして格納されている。狭帯域
コードブック98で、線形予測係数−自己相関変換部9
7からの自己相関と、狭帯域コードブック98に格納さ
れている自己相関情報とが比較され、マッチング処理が
行われる。そして、最もマッチしている自己相関情報の
インデックスが広帯域コードブック104に送られる。In the narrow band code book 98, autocorrelation information of narrow band audio signals obtained from a plurality of audio signal patterns is stored in advance as code vectors. In the narrowband codebook 98, the linear prediction coefficient-autocorrelation conversion unit 9
7 and the autocorrelation information stored in the narrowband codebook 98, and a matching process is performed. Then, the index of the best matching autocorrelation information is sent to wideband codebook 104.
【0128】広帯域コードブック104には、狭帯域コ
ードブック98と対応して、狭帯域コードブック98を
作成したときと同一のパターンの音声信号から得られる
広帯域音声信号の自己相関情報がコードベクタとして格
納されている。狭帯域コードブック98で最もマッチし
ている自己相関情報が判断されると、このインデックス
が広帯域コードブック104に送られ、広帯域コードブ
ック104により、最もマッチしていると判断された狭
帯域の自己相関情報に対応する広帯域の自己相関情報が
読み出される。In the wideband codebook 104, corresponding to the narrowband codebook 98, autocorrelation information of a wideband audio signal obtained from an audio signal of the same pattern as when the narrowband codebook 98 was created is used as a code vector. Is stored. When the best matching autocorrelation information is determined in the narrowband codebook 98, this index is sent to the wideband codebook 104, and the wideband codebook 104 determines the narrowband autocorrelation information determined to be the best match. Broadband autocorrelation information corresponding to the correlation information is read.
【0129】広帯域コードブック104から読み出され
た広帯域の自己相関情報は、自己相関−線形予測係数変
換部105に送られる。自己相関−線形予測係数変換部
105により、自己相関から線形予測係数への変換が行
われる。この線形予測係数がLPC合成フィルタ103
に送られる。The wideband autocorrelation information read from wideband codebook 104 is sent to autocorrelation / linear prediction coefficient conversion section 105. The autocorrelation-to-linear prediction coefficient conversion unit 105 converts the autocorrelation to a linear prediction coefficient. The LPC synthesis filter 103
Sent to
【0130】LPC合成フィルタ103ではLPC合成
が行われ、これにより、広帯域音声信号が合成される。
LPC合成フィルタ103で合成された音声信号は、高
域抽出&抑圧フィルタ106及び乗算部107に供給さ
れる。The LPC synthesis filter 103 performs the LPC synthesis, thereby synthesizing a wideband audio signal.
The audio signal synthesized by the LPC synthesis filter 103 is supplied to a high-frequency extraction and suppression filter 106 and a multiplication unit 107.
【0131】高域抽出&抑圧フィルタ106は、LPC
合成フィルタ103からの合成出力から入力狭帯域音声
信号の周波数帯域300Hz〜3400Hzの信号成分
を除去し、3400Hz以上の信号成分を抽出すると共
に、ユーザの好みに応じて高い周波数成分を抑圧する。
乗算部107は、高域抽出&抑圧フィルタ106からの
フィルタ出力に端子108から調整されたゲインを乗算
する。The high-frequency extraction & suppression filter 106 is an LPC
A signal component in the frequency band of 300 Hz to 3400 Hz of the input narrow band audio signal is removed from the combined output from the combining filter 103 to extract a signal component of 3400 Hz or more, and suppresses a high frequency component according to the user's preference.
The multiplication unit 107 multiplies the filter output from the high-frequency extraction & suppression filter 106 by the gain adjusted from the terminal 108.
【0132】そして、加算部96は、乗算部107から
の乗算出力に、BPF95を介した元の狭帯域音声信号
成分を加算し、広帯域の音声信号を出力する。この広帯
域の音声信号は第3のポストフィルタ処理(b)163
に供給される。The adding section 96 adds the original narrowband audio signal component via the BPF 95 to the multiplied output from the multiplying section 107, and outputs a wideband audio signal. This wideband audio signal is subjected to third post-filter processing (b) 163.
Supplied to
【0133】第3のポストフィルタ処理(b)163は
上記第3のポストフィルタ処理(b)49と同様に動作
する。すなわち、上記第2のポストフィルタ処理(b)
162と同様に、上記第1のポストフィルタ処理(a)
161をサンプリング周波数が16Hzの音声信号にお
ける2(=fs2/fs1)倍のサンプルに対して施す。The third post-filter processing (b) 163 operates similarly to the above-mentioned third post-filter processing (b) 49. That is, the second post-filter processing (b)
162, the first post-filter processing (a)
161 is applied to 2 (=fs2 /fs1 ) times the sample of the audio signal whose sampling frequency is 16 Hz.
【0134】第1のポストフィルタ処理(a)161か
らの第1のフィルタ処理出力と、第2のポストフィルタ
処理(b)162からの第2のフィルタ処理出力と、第
3のポストフィルタ処理(b)163からの第3のフィ
ルタ処理出力は切り換えスイッチ109の被選択端子
a,b,cに供給される。The first filter processing output from the first post-filter processing (a) 161, the second filter processing output from the second post-filter processing (b) 162, and the third post-filter processing ( b) The third filtered output from 163 is supplied to the selected terminals a, b, c of the changeover switch 109.
【0135】すなわち、切り換えスイッチ109は、上
記第1のサンプリング周波数fs1(=8KHz)の第1
の帯域B1(300Hz〜3400Hz)のポストフィ
ルタ処理が施された音声信号を被選択端子aで受け、第
2のサンプリング周波数fs2(=16KHz)の第1の
帯域B1(300Hz〜3400Hz)のポストフィル
タ処理が施された音声信号を被選択端子bで受け、第2
のサンプリング周波数fs2(=16KHz)の広帯域B
w(300Hz〜6000Hz)のポストフィルタ処理
が施された音声信号を被選択端子cで受ける。そして、
切り換え制御信号端子129からの切り換え制御信号に
基づいて選択片dを切り換えることにより、いずれか一
のポストフィルタ処理が施された音声信号をD/A変換
器6に供給する。That is, the changeover switch 109 is connected to the first sampling frequency fs1 (= 8 KHz).
The post-filter-processed audio signal of the band B1 (300 Hz to 3400 Hz) is received at the selected terminal a, and the first band B1 (300 Hz to 3400 Hz) of the second sampling frequency fs2 (= 16 KHz) is received. The post-filtered audio signal is received at the selected terminal b,
Broadband B with sampling frequency fs2 (= 16 KHz)
The audio signal subjected tow (300 Hz to 6000 Hz) post-filter processing is received at the selected terminal c. And
By switching the selection piece d based on the switching control signal from the switching control signal terminal 129, any one of the post-filtered audio signals is supplied to the D / A converter 6.
【0136】以上より、この図16に示した信号切換部
90を備える受信装置でも、サンプリング周波数が8K
Hz,16KHzと異なる、第1の帯域B1(300H
z〜3400Hz)の受話音声信号や、サンプリング周
波数が16KHzの広帯域(300Hz〜6000H
z)の受話音声信号を、ポストフィルタ処理を施した上
でユーザに選択させることができる。As described above, even in the receiving apparatus provided with signal switching section 90 shown in FIG.
Hz, 16 KHz, the first band B1 (300H
z to 3400 Hz) or a wide band (300 Hz to 6000 H) with a sampling frequency of 16 KHz.
The user can select the received voice signal of z) after the post-filter processing.
【0137】なお、上記受信装置1内部の信号処理装置
5は、各信号切換部32,65,70及び90内に、各
ポストフィルタ処理の後又は前で第1〜第3の雑音低減
処理を行う雑音低減処理部を備えても良い。The signal processing device 5 in the receiving device 1 performs the first to third noise reduction processes in each of the signal switching units 32, 65, 70, and 90 before or after each post-filter process. A noise reduction processing unit may be provided.
【0138】この雑音低減処理部は、本件出願人が既に
出願した、特開平7−193548号公報に開示されて
いる、雑音低減処理方法を用いて、背景雑音を検出し、
抑圧する。この雑音低減処理方法は、上記第1のサンプ
リング周波数fs1の音声信号を生成するために送信装置
から伝送されてきた伝送信号に基づく音声パラメータ符
号から検出された背景雑音区間の雑音レベルに応じて制
御信号を形成し、この制御信号に基づいて雑音低減処理
の内容を変化させる。This noise reduction processing unit detects background noise by using a noise reduction processing method disclosed in Japanese Patent Application Laid-Open No. 7-193548, which has already been filed by the present applicant.
Oppress. This noise reduction processing method is based on a noise level of a background noise section detected from a voice parameter code based on a transmission signal transmitted from a transmission device to generate a voice signal of the first sampling frequency fs1. A control signal is formed, and the content of the noise reduction processing is changed based on the control signal.
【0139】図17には、上記雑音低減処理方法を適用
した雑音低減処理部の第1の雑音低減処理(a)17
1,第2の雑音低減処理(b)172,第3の雑音低減
処理(b)173を、第1のポストフィルタ処理(a)
47,第2のポストフィルタ処理(b)48,第3のポ
ストフィルタ処理(b)49の後段で行う信号切換部3
2を示す。また、図18には、上記雑音低減処理部の詳
細な構成を示す。上記加算部46からの加算出力とな
る、帯域300〜6000Hz、サンプリング周波数が
16kHzの広帯域音声信号Sndwは入力端子141
を介して、フレームパワー計算部142に供給される。
フレームパワー計算部142は、例えば周期20mse
cのフレーム毎のパワーとして、例えば自乗平均の平方
根、いわゆるrms値を計算する。このフレームパワー
計算部142で計算されたフレーム平均パワー値は、抑
圧比計算部143に供給される。抑圧比計算部143
は、上記フレームパワー計算部142で計算されたフレ
ーム平均パワーを用いて、雑音を抑圧するための係数で
ある抑圧比を計算する。抑圧比計算部143で計算され
た抑圧比は、スムージング部144に送られる。スムー
ジング部144は、抑圧比計算部143で計算された抑
圧比にスムージング処理を施す。このスムージング処理
とは、例えば20msecで160サンプルのフレーム
単位で分割された入力音声信号のつながりの不連続性を
避けるための処理である。このスムージング処理が施さ
れた抑圧比は、ノイズリデュース部145に送られ、こ
のノイズリデュース部145において上記広帯域音声信
号Sndwの雑音を除去するために用いられる。FIG. 17 shows the first noise reduction processing (a) 17 of the noise reduction processing section to which the above-described noise reduction processing method is applied.
1, a second noise reduction process (b) 172, a third noise reduction process (b) 173, a first post-filter process (a)
47, a second post-filtering process (b) 48, and a signal switching unit 3 to be performed in a subsequent stage of the third post-filtering process (b) 49
2 is shown. FIG. 18 shows a detailed configuration of the noise reduction processing unit. A wideband audio signal Sndw having a band of 300 to 6000 Hz and a sampling frequency of 16 kHz, which is an addition output from the adder 46, is input to an input terminal 141
Is supplied to the frame power calculation unit 142 via the.
The frame power calculation unit 142 has, for example, a cycle of 20 msec.
For example, a so-called rms value, which is the root of the root mean square, is calculated as the power of each frame of c. The frame average power value calculated by the frame power calculation unit 142 is supplied to the suppression ratio calculation unit 143. Suppression ratio calculator 143
Calculates a suppression ratio, which is a coefficient for suppressing noise, using the frame average power calculated by the frame power calculation unit 142. The suppression ratio calculated by the suppression ratio calculation unit 143 is sent to the smoothing unit 144. The smoothing unit 144 performs a smoothing process on the suppression ratio calculated by the suppression ratio calculation unit 143. The smoothing process is a process for avoiding discontinuity of connection between input audio signals divided in units of 160 samples in, for example, 20 msec. The suppression ratio that has been subjected to the smoothing processing is sent to the noise reducer 145, and is used by the noise reducer 145 to remove noise from the wideband audio signal Sndw .
【0140】抑圧比計算部143には、端子148を介
して入力された雑音レベル検出信号をレベル弁別部14
7で弁別して得られた制御信号が供給されており、この
制御信号に応じて、例えば上記抑圧比計算のしきい値が
切換制御されるようになっている。The noise-ratio detection signal input via the terminal 148 is supplied to the suppression-ratio calculator 143.
A control signal obtained by discrimination in step 7 is supplied, and in response to this control signal, for example, a threshold for the above-described suppression ratio calculation is switched and controlled.
【0141】次に、この雑音低減処理部の動作について
詳細に説明する。図18のフレームパワー計算部142
は、上記フレーム当たりの上記デコード音声信号Snd
Nの平均パワーrmsを計算する。この平均パワーrm
sは抑圧比計算部143に供給される。Next, the operation of the noise reduction processing section will be described in detail. The frame power calculation unit 142 in FIG.
Is the decoded audio signal Snd per frame
Calculate the average power rms ofN. This average power rm
s is supplied to the suppression ratio calculation unit 143.
【0142】抑圧比計算部143は、平均パワーrms
と、あるしきい値nr1とを比較し、その比較結果によ
り、抑圧比scaleを計算する。すなわち、この抑圧比sca
leは、上記平均パワーrmsがしきい値nr1以上のと
き1とし、しきい値nr1よりも小さいとき、 scale=rms/K ・・・(7) とする。ここで、Kは定数である。この例の場合には、
K=nr1となる。The suppression ratio calculator 143 calculates the average power rms
And a certain threshold value nr1, and the suppression ratio scale is calculated based on the comparison result. That is, this suppression ratio sca
le is set to 1 when the average power rms is equal to or larger than the threshold value nr1, and is set to scale = rms / K (7) when the average power rms is smaller than the threshold value nr1. Here, K is a constant. In this case,
K = nr1.
【0143】あるいは、全てのrmsについて上記
(7)式を計算し、その計算結果としての抑圧比scale
が1よりも小(scale<1)となる場合には、この
(7)式で計算された抑圧比scaleを上記デコード音声
信号SndNに乗算する。これは、上記平均パワーrm
sが上記しきい値rn1よりも小となるフレームにおい
ては、上記デコード音声信号SndNに1よりも小さい
ゲインを乗算することを意味する。また、この(7)式
の結果、抑圧比scaleが1以上(scale≧1)となる場合
には、上記デコード音声信号SndNには何も処理を施
さずそのまま出力する。これは、抑圧比scaleが上記し
きい値となるフレームにおいては、上記デコード音声信
号SndNに1のゲインを乗算することを意味する。し
たがって、このしきい値nr1を適切に選ぶことによ
り、雑音部分のようなパワーの小さい部分ではゲインが
小さく制御されることになり、実質的に雑音低減の効果
が得られる。なお、上記(7)式を用いた場合のノイズ
抑圧の効果は、入力信号の平均パワーに対して1/2倍
となる。Alternatively, the above equation (7) is calculated for all rms, and the suppression ratio scale as the calculation result is calculated.
Is smaller than 1 (scale <1), the decoded speech signal SndN is multiplied by the suppression ratio scale calculated by the equation (7). This is the average power rm
In a frame in which s is smaller than the threshold value rn1, this means that the decoded audio signal SndN is multiplied by a gain smaller than 1. When the suppression ratio scale is 1 or more (scale ≧ 1) as a result of Expression (7), the decoded audio signal SndN is output without any processing. This suppression ratio scale is in the frame to be the threshold value, it means that multiplies a gain of 1 to the decode voice signal SndN. Therefore, by appropriately selecting the threshold value nr1, the gain is controlled to be small in a portion having a small power such as a noise portion, and the effect of substantially reducing noise is obtained. Note that the effect of noise suppression when using the above equation (7) is 倍 of the average power of the input signal.
【0144】また、ノイズの抑圧がききすぎる場合や、
一定レベル以下をミュートする部と組み合わせて使用す
る場合などにおいては、上記しきい値nr1(これを第
1のしきい値とする。)よりも小さい第2のしきい値n
r2を設定し、入力レベルがこの第2のしきい値nr2
よりも小さくなる領域で、抑圧を小さく、すなわちエキ
スパンダの伸長作用の強さを弱めることが好ましい。When the noise suppression is too strong,
In a case where the second threshold value nr1 is used in combination with a unit that mutes a certain level or less, the second threshold value n is smaller than the threshold value nr1 (this is referred to as a first threshold value).
r2, and the input level is set to the second threshold value nr2
It is preferable to reduce the suppression, that is, to weaken the strength of the expanding action of the expander in a region where the expansion is smaller.
【0145】ところで、入力された信号に対して音声と
雑音とを区別して処理しているわけではないので、子音
などの音声パワーが相対的に小さいところで音声が無く
なる傾向がある。特に強くノイズリデュースをかけたと
きにこの現象が顕著に現れ、音声の種類によってはかな
りの違和感を感じる。したがって、フレーム平均パワー
に対して、どの程度の強さでノイズリデュースをかける
か、またどのくらいの大きさからかけるかの検討が必要
になってくる。By the way, since the input signal is not processed by distinguishing between speech and noise, there is a tendency that the speech disappears when the speech power of a consonant or the like is relatively small. This phenomenon is particularly noticeable when a strong noise reduction is applied, and depending on the type of voice, a considerable sense of discomfort is felt. Therefore, it is necessary to consider how strong the noise reduction should be applied to the frame average power and from what size.
【0146】また、上記のような処理をフレーム単位で
行うと、フレームでの音声のつながりが不連続になり、
聞いたときに不自然感を感じてしまう。When the above-described processing is performed in units of frames, the connection of audio in frames becomes discontinuous.
When you hear it, you feel unnatural.
【0147】これらのことを考慮して、上記抑圧比scal
eに対してアタックタイム、リカバリタイムを設定し、
例えばフレーム単位のスムージングを行うことにより、
上記不自然感が出ないようにすることが考えられる。In consideration of the above, the above suppression ratio scal
Set attack time and recovery time for e,
For example, by performing smoothing in frame units,
It is conceivable to prevent the unnatural feeling from appearing.
【0148】すなわち、上記図18の構成からも明らか
なように、抑圧比計算部143で計算して求められた抑
圧比scaleは、一旦スムージング部144によるスムー
ジング処理を施した後、ノイズリデュース部145に送
るようにしている。That is, as is clear from the configuration of FIG. 18, the suppression ratio scale calculated by the suppression ratio calculation unit 143 is once subjected to a smoothing process by the smoothing unit 144 and then to the noise reduction unit 145. To send to.
【0149】このスムージング部144は、上述したよ
うなノイズ低減処理において生じる問題を解決するため
に設けられたものであり、上記アタックタイム、リカバ
リタイムを設定している。この例では、アタックタイム
を“0”とし、リカバリータイムは可変としている。The smoothing section 144 is provided to solve the above-described problem that occurs in the noise reduction processing, and sets the attack time and the recovery time. In this example, the attack time is “0” and the recovery time is variable.
【0150】すなわち、計算した現在のフレームの音声
パワーが前のフレームより大きい時にはその値をそのま
ま使い、逆に小さい場合は所定の特性を備えるローパス
フィルタ(LPF)によりスムージングを行い、フレー
ムパワーの変化による処理の不自然感が出ないようにす
る。ノイズリデュース部145は、上記広帯域音声信号
Sndwにスムージング部144を介した抑圧比scaleを
乗算して入力信号Sndwの雑音低減処理を行い、雑音
が低減された出力信号を出力端子146から出力してい
る。That is, when the calculated speech power of the current frame is larger than the previous frame, the value is used as it is. On the other hand, when the calculated speech power is smaller, smoothing is performed by a low-pass filter (LPF) having a predetermined characteristic to change To avoid unnatural feeling of processing. The noise reducer 145 multiplies the wideband audio signal Sndw by the suppression ratio scale via the smoothing unit 144 to perform noise reduction processing on the input signal Sndw , and outputs an output signal with reduced noise from the output terminal 146. are doing.
【0151】ところで、上記抑圧比計算部143には、
端子148を介した雑音レベル検出信号をレベル弁別部
147で弁別して得られた制御信号が供給されている。
この制御信号に応じて、上記抑圧比計算のしきい値が切
換制御されている。すなわち、抑圧比計算のしきい値
は、雑音レベル検出信号に基づいている。Incidentally, the above-mentioned suppression ratio calculating section 143 includes:
A control signal obtained by discriminating the noise level detection signal via the terminal 148 by the level discriminator 147 is supplied.
In response to the control signal, the threshold for the above-described suppression ratio calculation is switched and controlled. That is, the threshold for the suppression ratio calculation is based on the noise level detection signal.
【0152】この雑音レベル検出信号は、上記第1のサ
ンプリング周波数fs1の音声信号を生成するために送信
装置から伝送されてきた伝送信号に基づく音声パラメー
タ符号から検出された背景雑音区間の音声レベルにより
表すことができる。The noise level detection signal is an audio level of a background noise section detected from an audio parameter code based on a transmission signal transmitted from the transmission device to generate the audio signal of the first sampling frequency fs1. Can be represented by
【0153】ここでは、図示を省略しているが、上記音
声パラメータ符号から背景雑音区間を検出する雑音区間
検出部と、この雑音区間検出部で検出された雑音区間の
雑音レベルを検出する雑音レベル検出部が必要とされ、
端子148には雑音レベル検出部で検出された雑音レベ
ル検出信号が供給される。Although not shown here, a noise section detecting section for detecting a background noise section from the speech parameter code, and a noise level detecting the noise level of the noise section detected by the noise section detecting section. A detector is needed,
A terminal 148 is supplied with a noise level detection signal detected by the noise level detection unit.
【0154】また、この雑音低減処理部は、上記第1の
サンプリング周波数fs1(8KHz)の音声信号を生成
するために送信装置から伝送されてきた伝送信号に基づ
く音声パラメータ符号を第1の雑音低減処理に用いてい
るが、他の雑音低減処理(b)172,雑音低減処理
(b)173が実際に雑音低減処理を施すのは、第2の
サンプリング周波数fs2(16KHz)とされた音声信
号に対してである。このため、第2の雑音低減処理
(b)172,第3の雑音低減処理(b)173は、上
記第1の雑音低減処理(a)171をサンプリング周波
数が16KHzの音声信号における2(=fs2/fs1)
倍のサンプルに対して施す。Further, the noise reduction processing section converts the speech parameter code based on the transmission signal transmitted from the transmission device to generate the speech signal of the first sampling frequency fs1 (8 kHz) into the first noise. Although the noise reduction processing (b) 172 and the noise reduction processing (b) 173 that are used for the reduction processing actually perform the noise reduction processing, the sound having the second sampling frequency fs2 (16 KHz) is used. For the signal. For this reason, the second noise reduction processing (b) 172 and the third noise reduction processing (b) 173 perform the above-described first noise reduction processing (a) 171 by 2 (= fs2 / fs1 )
Apply to doubled sample.
【0155】このようにして、第1の雑音低減処理
(a)171は、上記ポストフィルタ(a)47でスペ
クトル整形及び聴感上の品質が向上された音声信号中の
雑音成分を低減できる。また、第2の雑音低減処理
(b)172,第3の雑音低減処理(b)173はポス
トフィルタ処理済みの第2のサンプリング周波数f
s2(16KHz)とされた第1の帯域B1及び広帯域BW
の音声信号の雑音成分を低減できる。As described above, the first noise reduction processing (a) 171 can reduce the noise component in the audio signal whose spectral shaping and audibility have been improved by the post filter (a) 47. The second noise reduction processing (b) 172 and the third noise reduction processing (b) 173 are performed at the second sampling frequency f after the post-filter processing.
s2 (16 KHz) and have been the first band B1 and wide band BW
Can reduce the noise component of the audio signal.
【0156】すなわち、図17に示した信号切換部32
は、切り換えスイッチ150により、第1のポストフィ
ルタ処理(a)47,第2のポストフィルタ処理(b)
48及び第3のポストフィルタ処理(b)49でスペク
トル整形及び聴感上の品質が効果的に向上され、第1の
雑音低減処理(a)171,第2の雑音低減処理(b)
172及び第3の雑音低減処理(b)173で雑音が低
減された音声信号、つまりサンプリング周波数が8KH
zの第1の帯域B1(300〜3400Hz)の音声信
号と、サンプリング周波数が16KHzの第1の帯域B
1(300〜3400Hz)の音声信号と、サンプリン
グ周波数が16KHzの広帯域BW(300〜6000
Hz)の広帯域音声信号とを切り換えてD/A変換器6
に送ることができる。That is, the signal switching section 32 shown in FIG.
The first post-filter processing (a) 47 and the second post-filter processing (b) are performed by the changeover switch 150.
48 and the third post-filter processing (b) 49 effectively improve the spectral shaping and audible quality. The first noise reduction processing (a) 171 and the second noise reduction processing (b)
172 and the third noise reduction processing (b) The audio signal whose noise is reduced by 173, that is, the sampling frequency is 8 KH
audio signal in the first band B1 (300-3400 Hz) of z and the first band B having a sampling frequency of 16 KHz
1 and the audio signal (ranging from 300 to 3400 Hz), the sampling frequency is 16KHz wideband BW (300 to 6000
Hz) and the D / A converter 6
Can be sent to
【0157】なお、上記信号切換部32、65、70又
は90を備えた信号処理装置を用いた受信装置は、送信
装置と一体化され、図19に示すような、携帯電話装置
110を構成してもよい。この携帯電話装置110も、
PDCとして、現在広くしようされている、ディジタル
携帯電話に適用できる。A receiving device using a signal processing device provided with the above-described signal switching unit 32, 65, 70 or 90 is integrated with a transmitting device to constitute a portable telephone device 110 as shown in FIG. You may. This mobile phone device 110 also
As a PDC, it can be applied to digital mobile phones that are currently being widely used.
【0158】この携帯電話装置110で、マイクロホン
111から入力された音声信号は、アンプ112,ボリ
ューム113,アンチエイリアシングフィルタ114及
びA/D変換器115を経由して信号処理装置116の
メモリ116aに格納される。In the portable telephone device 110, the audio signal input from the microphone 111 is stored in the memory 116a of the signal processing device 116 via the amplifier 112, the volume 113, the anti-aliasing filter 114 and the A / D converter 115. Is done.
【0159】メモリ116aに格納された音声信号は、
信号処理装置116内部の音声符号化部で符号処理さ
れ、音声パラメータ符号として出力される。The audio signal stored in the memory 116a is
The audio signal is encoded by an audio encoding unit in the signal processing device 116 and output as an audio parameter code.
【0160】この音声パラメータ符号は、制御部117
及びRF(RF送信)アンプ118及びアンテナ119
を経由して基地局へ送信される。This voice parameter code is transmitted to the control unit 117.
And RF (RF transmission) amplifier 118 and antenna 119
Is transmitted to the base station via.
【0161】ここで、信号処理装置116内部の音声符
号化部は、伝送路により制限される狭帯域化を考慮した
音声パラメータ符号を制御部117を介してRFアンプ
118に供給する。Here, the audio encoding unit in the signal processing device 116 supplies the audio parameter code to the RF amplifier 118 via the control unit 117 in consideration of the narrow band limited by the transmission path.
【0162】また、アンテナ119を介して基地局から
受信した音声パラメータ符号は、RFアンプ118、制
御部117を経由して信号処理装置122のメモリ12
2aに格納される。The voice parameter code received from the base station via the antenna 119 is transmitted to the memory 12 of the signal processing device 122 via the RF amplifier 118 and the control unit 117.
2a.
【0163】信号処理装置122のメモリ122aに格
納された音声パラメータ符号は、信号処理装置122の
復号部で復号処理された後、所定の信号処理が施されて
出力される。The speech parameter code stored in the memory 122a of the signal processing device 122 is decoded by the decoding section of the signal processing device 122, and then subjected to predetermined signal processing and output.
【0164】信号処理装置122から出力信号は、D/
A変換器123でアナログ信号とされた後、アンチエイ
リアシングフィルター124、ボリューム125及びア
ンプ128を経由してスピーカ127から出力される。The output signal from the signal processing device 122 is D /
After being converted into an analog signal by the A converter 123, the analog signal is output from the speaker 127 via the anti-aliasing filter 124, the volume 125 and the amplifier 128.
【0165】ここで、信号処理装置122は、上記信号
切換部32、65、70又は90を備えてなる。したが
って、この図19に示した携帯電話装置110は、受話
側でサンプリング周波数を2倍にした高品質の広帯域音
声信号の、スペクトル整形及び聴感上の品質を効果的に
向上し、かつ、雑音成分を低減することができる。Here, the signal processing device 122 includes the above-described signal switching unit 32, 65, 70 or 90. Therefore, the mobile phone device 110 shown in FIG. 19 can effectively improve the spectral shaping and audibility of a high-quality wideband audio signal whose sampling frequency is doubled on the receiving side, and can improve the noise component. Can be reduced.
【0166】なお、上記実施の形態では、受信装置、送
信装置、携帯電話装置を、PDCとして使用されている
ディジタル携帯電話装置に適用できるとして説明した
が、広帯域(ワイドバンド)CDMA方式、すなわち、
周波数帯域幅が広い移動体通信システムにも適用が可能
である。In the above embodiment, the receiving device, the transmitting device, and the mobile phone device have been described as being applicable to a digital mobile phone device used as a PDC. However, the wideband (wideband) CDMA system, that is,
The present invention is also applicable to a mobile communication system having a wide frequency bandwidth.
【0167】[0167]
【発明の効果】以上、本発明によれば、サンプリング周
波数が例えば8KHz,16KHzと異なる、第1の帯
域B1(300Hz〜3400Hz)のPSI−CEL
P又はVSELPによる受話音声信号や、サンプリング
周波数が16KHzの広帯域(300Hz〜6000H
z)の受話音声信号にポストフィルタ処理を施した上
で、ユーザに選択させることができる。このため、ユー
ザ側では選択肢が広がる。また、状況に応じて受話音声
を帯域拡張するだけでなく、入力時の帯域と同様にする
ことができるので、内蔵のバッテリーの減りを抑えるこ
ともできる。また、雑音低減処理を施し、雑音成分を低
減した上で、ユーザに選択させてもよい。Effect of the Invention] According to the present invention, the sampling frequency is for example 8 KHz, different from the 16 KHz, PSI-CEL of the first band B1 (300Hz~3400Hz)
A received voice signal by P or VSELP, or a wide band (300 Hz to 6000 H) with a sampling frequency of 16 KHz
After the post-filter processing is performed on the received voice signal of z), the user can make the selection. For this reason, the user has more options. Further, not only the band of the received voice can be expanded according to the situation, but also the band can be made the same as the band at the time of input, so that the built-in battery can be prevented from being reduced. Alternatively, the user may be allowed to make a selection after performing noise reduction processing to reduce noise components.
【0168】したがって、聴覚的品質を向上させた受話
音声を得ることのできる受信装置及び方法、通信装置及
び方法の提供を実現できる。Therefore, it is possible to provide a receiving apparatus and method, a communication apparatus and a method capable of obtaining a received voice with improved auditory quality.
【図1】本発明の実施の形態となる受信装置の構成を示
すブロック図である。FIG. 1 is a block diagram illustrating a configuration of a receiving device according to an embodiment of the present invention.
【図2】上記図1に示した受信装置に音声パラメータ符
号を基地局を介して送信する送信装置の構成を示すブロ
ック図である。FIG. 2 is a block diagram showing a configuration of a transmitting apparatus for transmitting a voice parameter code to the receiving apparatus shown in FIG. 1 via a base station.
【図3】上記図1に示した受信装置内部の信号処理装置
を信号切換部と共に構成するPSI−CELPデコーダ
を示す図である。FIG. 3 is a diagram showing a PSI-CELP decoder which constitutes a signal processing device inside the receiving device shown in FIG. 1 together with a signal switching unit.
【図4】上記図1に示した受信装置内部の信号処理装置
をPSI−CELPデコーダと共に構成する信号切換部
の処理を説明するための機能ブロック図である。FIG. 4 is a functional block diagram for explaining a process of a signal switching unit configuring the signal processing device inside the receiving device shown in FIG. 1 together with a PSI-CELP decoder.
【図5】上記図4に示した信号切換部に含まれる励振源
拡張部の詳細な構成を示すブロック図である。FIG. 5 is a block diagram showing a detailed configuration of an excitation source extension unit included in the signal switching unit shown in FIG. 4;
【図6】上記図4に示した信号切換部に含まれるポスト
フィルタの詳細な構成を示すブロック図である。FIG. 6 is a block diagram showing a detailed configuration of a post filter included in the signal switching unit shown in FIG. 4;
【図7】上記図4に示した信号切換部の詳細な動作を説
明するためのフローチャートである。FIG. 7 is a flowchart illustrating a detailed operation of the signal switching unit shown in FIG. 4;
【図8】上記図4に示した信号切換部で用いられるコー
ドブックに使われるトレーニングデータ生成処理を説明
するためのフローチャートである。FIG. 8 is a flowchart for explaining a training data generation process used for a codebook used in the signal switching unit shown in FIG. 4;
【図9】上記コードブックの生成を説明するためのフロ
ーチャートである。FIG. 9 is a flowchart illustrating the generation of the code book.
【図10】上記ポストフィルタのフィルタ係数更新周期
とゲイン更新周期とを説明するための図である。FIG. 10 is a diagram for explaining a filter coefficient update cycle and a gain update cycle of the post filter.
【図11】上記図1に示した受信装置内部の信号処理装
置の他の具体例に含まれるVSELPデコーダを示す図
である。FIG. 11 is a diagram showing a VSELP decoder included in another specific example of the signal processing device inside the receiving device shown in FIG. 1;
【図12】上記図1に示した受信装置内部の信号処理装
置の他の具体例に含まれる信号切換部の処理を説明する
ための機能ブロック図である。FIG. 12 is a functional block diagram for explaining processing of a signal switching unit included in another specific example of the signal processing device inside the receiving device shown in FIG. 1;
【図13】上記図12に示した信号切換部の詳細な動作
を説明するためのフローチャートである。FIG. 13 is a flowchart illustrating a detailed operation of the signal switching unit shown in FIG. 12;
【図14】上記図1に示した受信装置内部の信号処理装
置のさらに他の具体例に含まれる信号切換部の処理を説
明するための機能ブロック図である。FIG. 14 is a functional block diagram for explaining a process of a signal switching unit included in still another specific example of the signal processing device inside the receiving device shown in FIG. 1;
【図15】上記図1に示した受信装置内部の信号処理装
置のさらに他の具体例に含まれるデコード部の構成を示
すブロック図である。FIG. 15 is a block diagram showing a configuration of a decoding unit included in still another specific example of the signal processing device inside the receiving device shown in FIG. 1;
【図16】上記図1に示した受信装置内部の信号処理装
置の、またさらに他の具体例に含まれる信号切換部の処
理を説明するための機能ブロック図である。FIG. 16 is a functional block diagram for explaining processing of a signal switching unit included in still another specific example of the signal processing device inside the receiving device shown in FIG. 1;
【図17】上記図4に示した信号切換部内のポストフィ
ルタの後段で雑音低減処理を行う信号切換部の処理を説
明するための機能ブロック図である。FIG. 17 is a functional block diagram for explaining a process of a signal switching unit that performs a noise reduction process after the post filter in the signal switching unit shown in FIG. 4;
【図18】上記図17に示した信号切換部に含まれる雑
音低減処理部の詳細な構成を示すブロック図である。FIG. 18 is a block diagram illustrating a detailed configuration of a noise reduction processing unit included in the signal switching unit illustrated in FIG. 17;
【図19】上記各信号切換部を用いた信号処理装置を含
んだ受信装置を、送信装置と一体化して有してなる、携
帯電話装置の構成を示すブロック図である。FIG. 19 is a block diagram illustrating a configuration of a mobile phone device including a receiving device including a signal processing device using each of the signal switching units and a transmitting device.
1 受信装置、15 送信装置、21 信号処理装置、
27 PSI−CELPデコーダ、32 信号切換部、
36 線形予測係数→自己相関(αN→rN)変換部、3
7 自己相関広帯域化部、38 広帯域コードブック、
39 自己相関→線形予測係数変換部、40 LPC合
成部、41 励振源拡張部、45 アップサンプル部、
46 加算部、47 ポストフィルタ(a)、48,4
9 ポストフィルタ(b)、150 切り換えスイッチ1 receiving device, 15 transmitting device, 21 signal processing device,
27 PSI-CELP decoder, 32 signal switching unit,
36 Linear prediction coefficient → autocorrelation (αN → rN ) converter, 3
7 autocorrelation broadband unit, 38 wideband codebook,
39 autocorrelation → linear prediction coefficient conversion section, 40 LPC synthesis section, 41 excitation source expansion section, 45 upsample section,
46 adder, 47 post filter (a), 48, 4
9 Post filter (b), 150 changeover switch
フロントページの続き (72)発明者 大森 士郎 東京都品川区北品川6丁目7番35号 ソニ ー株式会社内 Fターム(参考) 5D045 CB10 5K052 AA00 BB02 EE07 EE40 FF07 GG34 GG48 9A001 CC02 EE05 JJ12 KK56Continuing from the front page (72) Inventor Shiro Omori 6-7-35 Kita-Shinagawa, Shinagawa-ku, Tokyo Sony Corporation F-term (reference) 5D045 CB10 5K052 AA00 BB02 EE07 EE40 FF07 GG34 GG48 9A001 CC02 EE05 JJ12 KK12
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP11007000AJP2000206996A (en) | 1999-01-13 | 1999-01-13 | Receiver and receiving method, communication equipment and communicating method |
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP11007000AJP2000206996A (en) | 1999-01-13 | 1999-01-13 | Receiver and receiving method, communication equipment and communicating method |
| Publication Number | Publication Date |
|---|---|
| JP2000206996Atrue JP2000206996A (en) | 2000-07-28 |
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP11007000ACeasedJP2000206996A (en) | 1999-01-13 | 1999-01-13 | Receiver and receiving method, communication equipment and communicating method |
| Country | Link |
|---|---|
| JP (1) | JP2000206996A (en) |
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2003533717A (en)* | 2000-05-08 | 2003-11-11 | ノキア コーポレイション | Method and arrangement for changing source signal band in a communication connection having multi-band capability |
| JP2005258226A (en)* | 2004-03-12 | 2005-09-22 | Toshiba Corp | Wideband speech decoding method and wideband speech decoding apparatus |
| WO2006075663A1 (en)* | 2005-01-14 | 2006-07-20 | Matsushita Electric Industrial Co., Ltd. | Audio switching device and audio switching method |
| US7249020B2 (en) | 2001-04-18 | 2007-07-24 | Nec Corporation | Voice synthesizing method using independent sampling frequencies and apparatus therefor |
| JP2010055002A (en)* | 2008-08-29 | 2010-03-11 | Toshiba Corp | Signal band extension device |
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2003533717A (en)* | 2000-05-08 | 2003-11-11 | ノキア コーポレイション | Method and arrangement for changing source signal band in a communication connection having multi-band capability |
| US7249020B2 (en) | 2001-04-18 | 2007-07-24 | Nec Corporation | Voice synthesizing method using independent sampling frequencies and apparatus therefor |
| US7418388B2 (en) | 2001-04-18 | 2008-08-26 | Nec Corporation | Voice synthesizing method using independent sampling frequencies and apparatus therefor |
| JP2005258226A (en)* | 2004-03-12 | 2005-09-22 | Toshiba Corp | Wideband speech decoding method and wideband speech decoding apparatus |
| WO2006075663A1 (en)* | 2005-01-14 | 2006-07-20 | Matsushita Electric Industrial Co., Ltd. | Audio switching device and audio switching method |
| US8010353B2 (en) | 2005-01-14 | 2011-08-30 | Panasonic Corporation | Audio switching device and audio switching method that vary a degree of change in mixing ratio of mixing narrow-band speech signal and wide-band speech signal |
| JP2010055002A (en)* | 2008-08-29 | 2010-03-11 | Toshiba Corp | Signal band extension device |
| Publication | Publication Date | Title |
|---|---|---|
| US6539355B1 (en) | Signal band expanding method and apparatus and signal synthesis method and apparatus | |
| KR100915733B1 (en) | Method and device for the artificial extension of the bandwidth of speech signals | |
| AU763471B2 (en) | A method and device for adaptive bandwidth pitch search in coding wideband signals | |
| JP3653826B2 (en) | Speech decoding method and apparatus | |
| JP4662673B2 (en) | Gain smoothing in wideband speech and audio signal decoders. | |
| EP1008984A2 (en) | Windband speech synthesis from a narrowband speech signal | |
| US6694018B1 (en) | Echo canceling apparatus and method, and voice reproducing apparatus | |
| JPH07193548A (en) | Noise reduction processing method | |
| JPH11126098A (en) | Voice synthesizing method and device therefor, band width expanding method and device therefor | |
| EP2954525B1 (en) | Systems and methods of performing noise modulation and gain adjustment | |
| JP2000305599A (en) | Speech synthesizing device and method, telephone device, and program providing media | |
| EP2774148B1 (en) | Bandwidth extension of audio signals | |
| JPH0946233A (en) | Speech coding method and apparatus, speech decoding method and apparatus | |
| JP4135242B2 (en) | Receiving apparatus and method, communication apparatus and method | |
| JP2000206995A (en) | Receiver and receiving method, communication equipment and communicating method | |
| JP4135240B2 (en) | Receiving apparatus and method, communication apparatus and method | |
| JP2000206996A (en) | Receiver and receiving method, communication equipment and communicating method | |
| JP4099879B2 (en) | Bandwidth extension method and apparatus | |
| JP2000122679A (en) | Audio range expanding method and device, and speech synthesizing method and device | |
| JP2000099095A (en) | Device and method for filtering voice signal, handset and telephone communication system | |
| JP2000181494A (en) | Device and method for reception and device and method for communication | |
| JP4269364B2 (en) | Signal processing method and apparatus, and bandwidth expansion method and apparatus | |
| JP2000206998A (en) | Receiver and receiving method, communication equipment and communicating method | |
| JP2000181495A (en) | Device and method for reception and device and method for communication | |
| JP2000206997A (en) | Receiver and receiving method, communication equipment and communicating method |
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination | Free format text:JAPANESE INTERMEDIATE CODE: A621 Effective date:20051118 | |
| A977 | Report on retrieval | Free format text:JAPANESE INTERMEDIATE CODE: A971007 Effective date:20080715 | |
| A131 | Notification of reasons for refusal | Free format text:JAPANESE INTERMEDIATE CODE: A131 Effective date:20080805 | |
| A521 | Request for written amendment filed | Free format text:JAPANESE INTERMEDIATE CODE: A523 Effective date:20081006 | |
| A01 | Written decision to grant a patent or to grant a registration (utility model) | Free format text:JAPANESE INTERMEDIATE CODE: A01 Effective date:20090818 | |
| A045 | Written measure of dismissal of application [lapsed due to lack of payment] | Free format text:JAPANESE INTERMEDIATE CODE: A045 Effective date:20091222 |