Movatterモバイル変換


[0]ホーム

URL:


JPH0816192A - Data compression device - Google Patents

Data compression device

Info

Publication number
JPH0816192A
JPH0816192AJP6152006AJP15200694AJPH0816192AJP H0816192 AJPH0816192 AJP H0816192AJP 6152006 AJP6152006 AJP 6152006AJP 15200694 AJP15200694 AJP 15200694AJP H0816192 AJPH0816192 AJP H0816192A
Authority
JP
Japan
Prior art keywords
data
discrete cosine
dimensional
dct
audio data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP6152006A
Other languages
Japanese (ja)
Other versions
JP2969047B2 (en
Inventor
Akira Okamoto
彰 岡本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kanebo Ltd
Original Assignee
Kanebo Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kanebo LtdfiledCriticalKanebo Ltd
Priority to JP6152006ApriorityCriticalpatent/JP2969047B2/en
Publication of JPH0816192ApublicationCriticalpatent/JPH0816192A/en
Application grantedgrantedCritical
Publication of JP2969047B2publicationCriticalpatent/JP2969047B2/en
Anticipated expirationlegal-statusCritical
Expired - Fee Relatedlegal-statusCriticalCurrent

Links

Landscapes

Abstract

PURPOSE:To provide a voice data compression device in which the compression rate is improved while keeping a high tone quality. CONSTITUTION:Analogue voice signals are converted into a series of voice data by an A/D converter 2 and the converted voice data are temporarily stored in a register 3. By the address specification of the address selector 5, a series of voice data kept in the register 3 are arranged in a matrix memory 4. At this time, the voice data are arranged in a two-dimensional matrix so that the data are correlated in horizontal and vertical directions. The voice data arranged in the memory 4 are two-dimensional discrete cosine converted by a two-dimensional DCT section 6 and DCT coefficients are obtained.

Description

Translated fromJapanese
【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、データ圧縮を行うデー
タ圧縮装置およびデータ圧縮方法に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a data compression device and a data compression method for performing data compression.

【0002】[0002]

【従来の技術】従来より、情報通信においてデータの伝
送量を削減して通信効率を高めるために、種々のデータ
圧縮技術が開発されている。画像データの圧縮技術とし
ては、例えば離散コサイン変換(DCT)方式が国際標
準の1つとして採用されている。
2. Description of the Related Art Conventionally, various data compression techniques have been developed in order to reduce the amount of data transmission and improve communication efficiency in information communication. As a technique for compressing image data, for example, the discrete cosine transform (DCT) method is adopted as one of international standards.

【0003】一方、音声データ(オーディオデータ)の
圧縮技術としては、例えば適応差分PCM(ADPC
M)方式がある。この適応差分PCM方式では、高品質
の音声が得られるが、量子化ビット数はあまり削減でき
ない。
On the other hand, as a compression technique of voice data (audio data), for example, adaptive differential PCM (ADPC)
M) method is available. With this adaptive difference PCM method, high quality speech can be obtained, but the number of quantization bits cannot be reduced so much.

【0004】そこで、音声データの高能率なデータ圧縮
を実現するために、特開平6−67699号公報に二次
元離散コサイン変換を音声データに適用する方法が開示
されている。
Therefore, in order to realize highly efficient data compression of voice data, Japanese Patent Laid-Open No. 6-67699 discloses a method of applying two-dimensional discrete cosine transform to voice data.

【0005】ここで、まず、図25〜図27を参照しな
がら画像データ圧縮のために用いられる二次元離散コサ
イン変換方式について説明する。図25は離散コサイン
変換方式を実行するためのシステムの基本構成を示すブ
ロック図である。
First, the two-dimensional discrete cosine transform method used for image data compression will be described with reference to FIGS. 25 to 27. FIG. 25 is a block diagram showing the basic configuration of a system for executing the discrete cosine transform method.

【0006】符号化側では、DCT装置100が、入力
される原画像データの二次元離散コサイン変換を行い、
DCT係数を出力する。量子化器200は、量子化テー
ブル400を参照してDCT係数に量子化処理を行い、
量子化されたDCT係数(以下、量子化DCT係数と呼
ぶ)を出力する。エントロピー符号化器300は、符号
化テーブル500を参照して量子化DCT係数にエント
ロピー符号化処理を行い、圧縮データを出力する。エン
トロピー符号化の方式としてハフマン符号化方式が用い
られる。
On the encoding side, the DCT device 100 performs a two-dimensional discrete cosine transform of the input original image data,
Output the DCT coefficient. The quantizer 200 refers to the quantization table 400 to perform a quantization process on the DCT coefficient,
The quantized DCT coefficient (hereinafter referred to as a quantized DCT coefficient) is output. The entropy encoder 300 refers to the encoding table 500, performs entropy encoding processing on the quantized DCT coefficient, and outputs compressed data. The Huffman coding method is used as the entropy coding method.

【0007】復号化側では、エントロピー復号器600
が、符号化テーブル500を参照して圧縮データにエン
トロピー復号化処理を行い、量子化DCT係数を出力す
る。逆量子化器700は、量子化テーブル400を参照
して量子化DCT係数に逆量子化処理を行い、DCT係
数を出力する。逆DCT装置800は、DCT係数に逆
二次元離散コサイン変換を行い、再生画像データを出力
する。
On the decoding side, the entropy decoder 600
Performs the entropy decoding process on the compressed data with reference to the encoding table 500, and outputs the quantized DCT coefficient. The inverse quantizer 700 refers to the quantization table 400, performs inverse quantization processing on the quantized DCT coefficient, and outputs the DCT coefficient. The inverse DCT device 800 performs inverse two-dimensional discrete cosine transform on the DCT coefficient and outputs reproduced image data.

【0008】次に、二次元離散コサイン変換方法を説明
する。まず、図26に示すように、画像データを複数の
8×8画素ブロックに分割する。図27に示すように、
1つの8×8画素ブロック内の各画素データの値をP
X Y(X,Y=0,…,7)で示す。ここで、X,Yが
ブロック内の画素データの位置を表わしている。
Next, a two-dimensional discrete cosine transform method will be described. First, as shown in FIG. 26, the image data is divided into a plurality of 8 × 8 pixel blocks. As shown in FIG. 27,
The value of each pixel data in one 8 × 8 pixel block is set to P
It is indicated byXY (X, Y = 0, ..., 7). Here, X and Y represent the position of the pixel data in the block.

【0009】分割された各8×8画素ブロックに対し
て、数1による二次元離散コサイン変換を行う。
Two-dimensional discrete cosine transform according to equation 1 is performed on each of the divided 8 × 8 pixel blocks.

【0010】[0010]

【数1】[Equation 1]

【0011】ここで、SU V(U,V=0,…,7)は
DCT係数を表わし、U,VはDCT係数の位置を表わ
す。U=V=0の場合にはCU=CV=1/√2とな
り、その他の場合にはCU=CV=1となる。さらに、
画素データPX Yのビット精度が8ビットの場合にはL
S=128となり、画素データPX Yのビット精度が1
2ビットの場合にはLS=2048となる。
Here, SUV (U, V = 0, ..., 7) represents the DCT coefficient, and U and V represent the position of the DCT coefficient. When U = V = 0, CU = CV = 1 / √2, and in other cases, CU = CV = 1. further,
If the bit precision of the pixel data PXY is 8 bits, L
S = 128 and the bit precision of pixel data PXY is 1
In the case of 2 bits, LS = 2048.

【0012】二次元離散コサイン変換の結果、64個の
DCT係数SU Vが得られる。DCT係数S0 0はDC
係数と呼ばれ、残りの63個DCT係数はAC係数と呼
ばれる。
As a result of the two-dimensional discrete cosine transform, 64 DCT coefficients SUV are obtained. DCT coefficient S0 0 is DC
The remaining 63 DCT coefficients are called coefficients and are called AC coefficients.

【0013】DC係数は8×8画素データの平均値(直
流成分)を示している。数1に示されるように、各画素
データPX YよりLSを引くことにより、DC係数の期
待値を0にレベルシフトしている。
The DC coefficient indicates the average value (DC component) of 8 × 8 pixel data. As shown in Expression 1, the expected value of the DC coefficient is level-shifted to 0 by subtracting LS from each pixel data PXY .

【0014】図27に示すように、二次元離散コサイン
変換されたブロックの左上および右下がそれぞれDCT
係数S0 0,S7 7に対応している。二次元離散コサイ
ン変換されたブロックの左から右に進むにつれて高周波
の水平周波数成分を多く含み、上から下に進むにつれて
高周波の垂直周波数成分を多く含むことになる。
As shown in FIG. 27, the upper left and lower right of the block subjected to the two-dimensional discrete cosine transform are DCT, respectively.
It corresponds to the coefficients S0 0 and S7 7 . The two-dimensional discrete cosine transformed block contains many high frequency horizontal frequency components as it goes from left to right, and many high frequency vertical frequency components as it goes from top to bottom.

【0015】一方、数2に示す逆二次元離散コサイン変
換によりDCT係数SU Vから64個の画素データP
X Y(X,Y=0,…,7)を得ることができる。
On the other hand, 64 pixel data P from the DCT coefficient SUV by the inverse two-dimensional discrete cosine transform shown in Equation 2.
XY (X, Y = 0, ..., 7) can be obtained.

【0016】[0016]

【数2】[Equation 2]

【0017】数2に示されるように、各画素データにL
Sを加えることにより、レベルシフト分を元に戻してい
る。DCT係数SU Vは、係数位置ごとに異なる量子化
テーブルQU Vを用いて、数3により線型量子化され、
量子化DCT係数rU Vが得られる。
As shown in equation 2, each pixel data has L
By addingS , the level shift amount is restored. The DCT coefficient SUV is linearly quantized by Equation 3 using a quantization table QUV which is different for each coefficient position,
The quantized DCT coefficient rUV is obtained.

【0018】[0018]

【数3】rU V=round(SU V/QU V) roundは、最も近い整数への整数化を意味する。## EQU00003 ## rUV = round (SUV / QUV ) round means integerization to the nearest integer.

【0019】復号化側では、逆量子化が行われる。ハフ
マン復号化で得られた量子化DCT係数をrU Vとする
と、数4により逆量子化を行う。
On the decoding side, inverse quantization is performed. When the quantized DCT coefficient obtained by the Huffman decoding is rUV , inverse quantization is performed by the equation 4.

【0020】[0020]

【数4】SU V=rU V×QU V 量子化テーブルQU Vの値を変化させることにより画質
を制御することができる。量子化テーブルQU Vの値を
小さく設定すると、量子化DCT係数rU Vの値が大き
くなり、画質の良い画像を符号化することができる。逆
に、量子化テーブルQU Vの値を大きく設定すると、量
子化DCT係数rU Vの値が小さくなり、符号化情報量
は減少するが、画質は劣化する。
## EQU00004 ## The image quality can be controlled by changing the value of SUV = rUV × QUV quantization table QUV . When the value of the quantization table QUV is set to be small, the value of the quantized DCT coefficient rUV becomes large, and an image with good image quality can be encoded. On the contrary, when the value of the quantization table QUV is set to be large, the value of the quantized DCT coefficient rUV becomes small and the amount of encoded information decreases, but the image quality deteriorates.

【0021】このように、量子化テーブルQU Vの値を
変えることにより、画質および符号化情報を自由に制御
することができる。次に、特開平6−67699号公報
に開示された二次元離散コサイン変換を用いた音声デー
タの圧縮方法を図28を参照して説明する。
As described above, by changing the value of the quantization table QUV , the image quality and the coding information can be freely controlled. Next, a method of compressing audio data using the two-dimensional discrete cosine transform disclosed in JP-A-6-67699 will be described with reference to FIG.

【0022】図28の(a)に示すように、一連の音声
データをD1,D2,…,D64とする。音声データは
一次元性を有するので、そのままの形では二次元離散コ
サイン変換を行うことはできない。
As shown in FIG. 28 (a), a series of audio data is D1, D2, ..., D64. Since the voice data has one-dimensionality, the two-dimensional discrete cosine transform cannot be performed as it is.

【0023】そこで、図28の(b)に示すように、一
連の音声データD1,D2,…,D64を例えば8×8
のマトリクスに配列し、疑似的に二次元マトリクスを形
成する。ここで、マトリクスのX方向の座標およびY方
向の座標をそれじれX=0,1,…,7、Y=0,1,
…,7とする。
Therefore, as shown in FIG. 28B, a series of audio data D1, D2, ..., D64 is, for example, 8 × 8.
To form a pseudo two-dimensional matrix. Here, the coordinates in the X direction and the coordinates in the Y direction of the matrix are respectively changed to X = 0, 1, ..., 7, Y = 0, 1,
…, 7

【0024】まず、マトリクスのY=0の行に音声デー
タD1,D2,…,D8をX方向に順に配列し、Y=1
の行に音声データD9,D10,…,D15をX方向に
順に配列する。同様にして、Y=2,3,…,7の各行
に音声データD17,D18,…,D64をX方向に順
に配列する。このようにして、音声データD1,D2,
…,D64が二次元マトリクスに配列される。
First, audio data D1, D2, ..., D8 are arranged in order in the X direction on the row of Y = 0 in the matrix, and Y = 1.
, D15 are arranged in this order in the X direction. Similarly, audio data D17, D18, ..., D64 are sequentially arranged in the X direction in each row of Y = 2, 3 ,. In this way, the audio data D1, D2
..., D64 are arranged in a two-dimensional matrix.

【0025】このようにして配列された音声データD
1,D2,…,D64に上記の二次元離散コサイン変換
を行うことにより音声データを圧縮することができる。
The voice data D arranged in this way
Audio data can be compressed by performing the above-described two-dimensional discrete cosine transform on 1, D2, ..., D64.

【0026】[0026]

【発明が解決しようとする課題】しかしながら、図28
に示した従来の音声データ圧縮方法においては、X方向
に隣接する音声データどうしは相互に相関性を有する
が、Y方向に隣接する音声データどうしは相関性を有し
ない。すなわち、X方向には連続する音声データが順に
配列されているが、Y方向には全く関連のない音声デー
タが配列されることになる。したがって、このように配
列された音声データに二次元離散コサイン変換を行った
場合、圧縮比をあまり大きくすることができないという
問題がある。
However, as shown in FIG.
In the conventional audio data compression method shown in FIG. 3, audio data adjacent in the X direction have mutual correlation, but audio data adjacent in the Y direction do not have correlation. That is, although continuous audio data are arranged in order in the X direction, completely unrelated audio data is arranged in the Y direction. Therefore, when the two-dimensional discrete cosine transform is performed on the audio data arranged in this way, there is a problem that the compression ratio cannot be increased so much.

【0027】一方、音声データの聴覚重み付け符号化に
おいて、符号データのデータ長を一定の長さ以下に固定
化するように重み付けを行った場合、音声データの内容
によって良い音質および悪い音質が出現するという問題
がある。
On the other hand, in the perceptual weighting encoding of voice data, when weighting is performed so that the data length of the code data is fixed to a fixed length or less, good sound quality and bad sound quality appear depending on the content of the voice data. There is a problem.

【0028】さらに、図25に示した方式では、DCT
係数の量子化処理においてデータ量が削減されるが、そ
の量子化処理により量子化誤差が生じるという問題があ
る。それゆえに、本発明の目的は、高い音質を維持しつ
つ圧縮率が向上された音声データの圧縮装置を提供する
ことである。
Further, in the system shown in FIG. 25, the DCT
Although the amount of data is reduced in the coefficient quantization processing, there is a problem in that the quantization processing causes a quantization error. Therefore, an object of the present invention is to provide an audio data compression apparatus having an improved compression rate while maintaining high sound quality.

【0029】本発明の他の目的は、高い音質を維持しつ
つデータ長を一定の長さ以下に固定化しかつデータ長を
短縮することができる音声データの圧縮方法を提供する
ことである。
Another object of the present invention is to provide a method of compressing audio data, which can fix the data length to a fixed length or less and shorten the data length while maintaining high sound quality.

【0030】本発明のさらに他の目的は、量子化誤差が
低減された画像データおよび音声データの圧縮装置を提
供することである。
Still another object of the present invention is to provide a compression device for image data and audio data with reduced quantization error.

【0031】[0031]

【課題を解決するための手段】[Means for Solving the Problems]

(1)第1の発明 第1の発明に係るデータ圧縮装置は、配列手段および変
換手段を備える。配列手段は、一連の音声データを水平
方向および垂直方向に相関性を有するように二次元マト
リクスに配列する。変換手段は、配列手段により配列さ
れた二次元マトリクスの音声データに二次元離散コサイ
ン変換を行う。
(1) First Invention A data compression apparatus according to the first invention comprises an arranging means and a converting means. The arranging means arranges a series of audio data in a two-dimensional matrix so as to have correlation in the horizontal direction and the vertical direction. The converting means performs a two-dimensional discrete cosine transform on the sound data of the two-dimensional matrix arranged by the arranging means.

【0032】(2)第2の発明 第2の発明に係るデータ圧縮方法は、一連の音声データ
を複数の周波数帯域に分割し、その分割により得られた
各周波数帯域の音声データを二次元マトリクスに配列す
る。各周波数帯域ごとに二次元マトリクスの音声データ
に二次元離散コサイン変換を行い、二次元離散コサイン
変換により得られた各周波数帯域ごとのデータから主た
るデータを所定の選択条件で選択する。符号データの長
さが所定の長さ以下に固定化されるように選択条件を修
正しつつ選択された主たるデータを符号化する。
(2) Second Invention A data compression method according to the second invention divides a series of audio data into a plurality of frequency bands, and the audio data of each frequency band obtained by the division is a two-dimensional matrix. To array. The two-dimensional discrete cosine transform is performed on the sound data of the two-dimensional matrix for each frequency band, and the main data is selected from the data for each frequency band obtained by the two-dimensional discrete cosine transform under a predetermined selection condition. The selected main data is encoded while correcting the selection condition so that the length of the coded data is fixed to a predetermined length or less.

【0033】(3)第3の発明 第3の発明に係るデータ圧縮装置は、第1の変換手段、
分離手段、第2の変換手段、第1の符号化手段および第
2の符号化手段を備える。
(3) Third Invention A data compression apparatus according to a third invention is a first conversion means,
It comprises a separating means, a second converting means, a first encoding means and a second encoding means.

【0034】第1の変換手段は、mビットのデータに二
次元離散コサイン変換を行ってnビットのデータを得
る。分離手段は、第1の変換手段により得られたnビッ
トのデータを上位n−kビットのデータおよび下位kビ
ットのデータに分離する。第2の変換手段は、分離手段
により得られた下位kビットのデータに二次元離散コサ
イン変換を行う。第1の符号化手段は、第2の変換手段
により得られたデータを符号化する。第2の符号化手段
は、分離手段により得られた上位n−kビットのデータ
を符号化する。
The first converting means performs two-dimensional discrete cosine conversion on the m-bit data to obtain n-bit data. The separating means separates the n-bit data obtained by the first converting means into upper n−k bit data and lower k bit data. The second converting means performs a two-dimensional discrete cosine transform on the lower k-bit data obtained by the separating means. The first encoding means encodes the data obtained by the second converting means. The second encoding means encodes the upper nk-bit data obtained by the separating means.

【0035】第1の変換手段および第2の変換手段は1
つの変換手段で兼用してもよい。また、第1の符号化手
段および第2の符号化手段は1つの符号化手段で兼用し
てもよい。
The first converting means and the second converting means are 1
The two conversion means may be used in common. Further, the first encoding means and the second encoding means may be combined with one encoding means.

【0036】[0036]

【作用】[Action]

(1)第1の発明 第1の発明に係るデータ圧縮装置においては、一連の音
声データが水平方向および垂直方向に相関性を有するよ
うに配列が行われるので、二次元離散コサイン変換にお
いて高い圧縮率が得られる。したがって、音声データの
圧縮において、高い音質を維持しつつ圧縮率を向上させ
ることが可能となる。
(1) First invention In the data compression apparatus according to the first invention, since a series of audio data is arranged so as to have correlation in the horizontal direction and the vertical direction, high compression is achieved in the two-dimensional discrete cosine transform. The rate is obtained. Therefore, in compression of audio data, it is possible to improve the compression rate while maintaining high sound quality.

【0037】(2)第2の発明 第2の発明に係るデータ圧縮方法においては、一連の音
声データが複数の周波数帯域に分割され、各周波数帯域
ごとに二次元離散コサイン変換、主たるデータの選択お
よび符号化が行われる。その際、符号データのデータ長
が所定の長さ以下に固定化されるように、選択条件を修
正しつつ符号化が行われるので、高い音質を維持しつつ
データ長を一定の長さ以下に固定化しかつデータ長を短
縮することができる。
(2) Second Invention In the data compression method according to the second invention, a series of audio data is divided into a plurality of frequency bands, two-dimensional discrete cosine transform is performed for each frequency band, and main data is selected. And encoding is performed. At that time, since the encoding is performed while correcting the selection condition so that the data length of the coded data is fixed to a predetermined length or less, the data length is kept below a certain length while maintaining high sound quality. It can be fixed and the data length can be shortened.

【0038】(3)第3の発明 第3の発明に係るデータ圧縮装置においては、mビット
のデータに二次元離散コサイン変換が行われ、nビット
(n>m)のデータ(DCT係数)が得られる。nビッ
トのデータは、上位n−kビットのデータと下位kビッ
トのデータとに分離される。下位kビットのデータは再
び二次元離散コサイン変換された後、符号化される。上
位n−kビットのデータはそのまま符号化される。
(3) Third Invention In the data compression apparatus according to the third invention, two-dimensional discrete cosine transform is performed on m-bit data, and n-bit (n> m) data (DCT coefficient) is obtained. can get. The n-bit data is separated into upper n-k bit data and lower k-bit data. The data of the lower k bits is coded after being subjected to the two-dimensional discrete cosine transform again. The upper nk-bit data is encoded as it is.

【0039】二次元離散コサイン変換により得られたn
ビットのデータを量子化因子で量子化した場合、下位k
ビットのデータは量子化誤差となる。第3の発明に係る
データ圧縮装置においては、量子化誤差となる下位kビ
ットのデータに二次元離散コサイン変換を再び行うの
で、量子化誤差の発生がなくなり、データ圧縮による誤
差は二次元離散コサイン変換による誤差のみとなる。し
たがって、データ圧縮において、量子化誤差を低減する
ことができる。
N obtained by the two-dimensional discrete cosine transform
When bit data is quantized by a quantization factor, lower k
Bit data becomes a quantization error. In the data compressing device according to the third aspect of the present invention, since the two-dimensional discrete cosine transform is performed again on the data of the lower k bits which is the quantizing error, the quantizing error does not occur, and the error due to the data compression is the two-dimensional discrete cosine. Only the error due to the conversion. Therefore, quantization error can be reduced in data compression.

【0040】[0040]

【実施例】【Example】

(1)第1の実施例 図1は第1の実施例によるDCT装置の構成を示すブロ
ック図である。図1において、DCT装置1は、A/D
変換器2、レジスタ3、マトリクス用メモリ4、アドレ
スセレクタ5および二次元DCT部6を含む。
(1) First Embodiment FIG. 1 is a block diagram showing the configuration of a DCT device according to the first embodiment. In FIG. 1, the DCT device 1 is an A / D
It includes a converter 2, a register 3, a matrix memory 4, an address selector 5, and a two-dimensional DCT unit 6.

【0041】A/D変換器2は、アナログ音声信号を一
連のディジタル音声データに変換してレジスタ3に与え
る。レジスタ3はその音声データを一時的に保持する。
マトリクス用メモリ4はN×N(Nは正の整数)の記憶
領域を有する。ここでは、マトリクス用メモリ4が8×
8の記憶領域を有するものとする。アドレスセレクタ5
はマトリクス用メモリ4のアドレス指定を行う。
The A / D converter 2 converts the analog voice signal into a series of digital voice data and gives it to the register 3. The register 3 temporarily holds the audio data.
The matrix memory 4 has N × N (N is a positive integer) storage area. Here, the matrix memory 4 is 8 ×
Assume that it has 8 storage areas. Address selector 5
Addresses the matrix memory 4.

【0042】レジスタ3に保持された音声データは、ア
ドレスセレクタ5のアドレス指定によりマトリクス用メ
モリ4内に順次書き込まれて配列される。また、アドレ
スセレクタ5のアドレス指定により順次音声データが読
み出され、二次元DCT部6に与えられる。二次元DC
T部6は、8×8の音声データに二次元離散コサイン変
換を行い、8×8のDCT係数を出力する。
The audio data held in the register 3 is sequentially written and arranged in the matrix memory 4 by the address designation of the address selector 5. Also, the audio data is sequentially read by the address designation of the address selector 5 and given to the two-dimensional DCT unit 6. Two-dimensional DC
The T unit 6 performs a two-dimensional discrete cosine transform on the 8 × 8 audio data and outputs an 8 × 8 DCT coefficient.

【0043】次に、マトリクス用メモリ4における音声
データの配列方法を説明する。図2は音声データの第1
の配列方法を示す図である。図2において、マトリクス
用メモリ4のX方向のアドレスをX=0,1,…,7と
し、Y方向のアドレスをY=0,1,…,7とする。ま
た、一連の音声データをD0,D1,D2,…とする。
Next, a method of arranging audio data in the matrix memory 4 will be described. FIG. 2 shows the first voice data.
It is a figure which shows the arrangement method of. 2, the addresses in the X direction of the matrix memory 4 are X = 0, 1, ..., 7 and the addresses in the Y direction are Y = 0, 1 ,. Further, a series of audio data is D0, D1, D2, ....

【0044】第1の配列方法では、Y=0の行に音声デ
ータD0,D1,…,D7をX方向に順に配列し、Y=
1の行に音声データD1,D2,…,D8をX方向に順
に配列し、Y=2の行に音声データD2,D3,…,D
9をX方向に順に配列する。同様にして、Y=3,4,
…,7の各行に先頭の音声データを1つずつシフトしな
がら連続する8個の音声データをX方向に順に配列す
る。
In the first arrangement method, the audio data D0, D1, ..., D7 are arranged in order in the X direction in the row of Y = 0, and Y =
Audio data D1, D2, ..., D8 are sequentially arranged in the row 1 in the X direction, and audio data D2, D3 ,.
9 are arranged in order in the X direction. Similarly, Y = 3,4
, 8 consecutive voice data are arranged in order in the X direction while shifting the voice data at the beginning one by one in each row.

【0045】その結果、15個の音声データD0,D
1,…,D14がX方向およびY方向に相関性を有する
ように二次元に配列される。例えば、Y=0の行には連
続する音声データD0,D1,…,D7が配列され、X
=0の列にも連続する音声データD0,D1,…,D7
が配列される。この音声データの配列は、図1のアドレ
スセレクタ5によるアドレス指定により行われる。
As a result, 15 pieces of voice data D0, D
, ..., D14 are arranged two-dimensionally so as to have a correlation in the X direction and the Y direction. For example, continuous audio data D0, D1, ..., D7 are arranged in a row of Y = 0, and X
= 0, continuous audio data D0, D1, ..., D7
Are arranged. The arrangement of the audio data is performed by the address designation by the address selector 5 in FIG.

【0046】このように、一連の音声データがX方向お
よびY方向に相関性を有するように配列されているの
で、これらの音声データを図1の二次元DCT部6によ
り二次元離散コサイン変換した場合、圧縮率が高くな
る。
As described above, since a series of audio data are arranged so as to have correlation in the X and Y directions, these audio data are two-dimensional discrete cosine transformed by the two-dimensional DCT unit 6 in FIG. In this case, the compression rate becomes high.

【0047】二次元DCT部6により得られたDCT係
数は、必要に応じて図26に示した量子化器200によ
り量子化された後、エントロピー符号化器300により
ハフマン符号化される。それにより、ハフマン符号が得
られる。なお、量子化器200による量子化を行わなく
てもよい。
The DCT coefficient obtained by the two-dimensional DCT unit 6 is quantized by the quantizer 200 shown in FIG. 26, if necessary, and then Huffman coded by the entropy coder 300. Thereby, a Huffman code is obtained. The quantizer 200 may not perform the quantization.

【0048】図3は音声データの第2の配列方法を示す
図である。第2の配列方法では、Y=0の行に音声デー
タD0,D1,…,D7をX方向に順に配列し、Y=1
の行に音声データD2,D3,…D9をX方向に順に配
列し、Y=2の行に音声データD4,D5,…,D11
をX方向に順に配列する。同様にして、先頭の音声デー
タを2つずつシフトしながらY=3,4,…,7の各行
に連続する8個の音声データをX方向に順に配列する。
FIG. 3 is a diagram showing a second arrangement method of voice data. In the second arrangement method, the audio data D0, D1, ..., D7 are arranged in order in the X direction in the row of Y = 0, and Y = 1.
, D9 are sequentially arranged in the X direction, and voice data D4, D5, ..., D11 are arranged in the Y = 2 line.
Are sequentially arranged in the X direction. Similarly, eight audio data consecutive in each row of Y = 3, 4, ..., 7 are arranged in the X direction while shifting the audio data at the beginning by two.

【0049】その結果、X方向に連続する音声データが
順に配列され、Y方向に1つおきの音声データが順に配
列される。このようにして、22個の音声データD0,
D1,…,D21がX方向およびY方向に相関性を有す
るように二次元マトリクスに配列される。
As a result, audio data consecutive in the X direction are arranged in order, and every other audio data is arranged in order in the Y direction. In this way, 22 pieces of audio data D0,
, D21 are arranged in a two-dimensional matrix so as to have correlation in the X direction and the Y direction.

【0050】第2の配列方法では、第1の配列方法に比
べてY方向の音声データの相関性が若干低くなるが、1
つのマトリクスに配列される音声データの数が増加す
る。図4は音声データの第3の配列方法を示す図であ
る。図4において、“+”は2つの音声データの平均を
表わしている。
In the second arrangement method, the correlation of the audio data in the Y direction is slightly lower than that in the first arrangement method.
The number of audio data arranged in one matrix increases. FIG. 4 is a diagram showing a third arrangement method of voice data. In FIG. 4, "+" represents the average of two audio data.

【0051】第3の配列方法では、Y=0の行に音声デ
ータD0,D1の平均値,音声データD2,D3の平均
値,…,音声データD14,D15の平均値をX方向に
順に配列する。次に、Y=1の行に音声データD2,D
3の平均値,音声データD4,D5の平均値,…,音声
データD16,D17の平均値をX方向に順に配列す
る。さらに、Y=2の行に音声データD4,D5の平均
値,音声データD6,D7の平均値,…,音声データD
18,D19の平均値を順に配列する。同様にして、Y
=3,4,…,7の各行に連続する2つの音声データの
平均値を順に配列する。
In the third arrangement method, the average value of the audio data D0 and D1, the average value of the audio data D2 and D3, ..., The average value of the audio data D14 and D15 are arranged in the X direction in order in the row of Y = 0. To do. Next, in the row of Y = 1, the voice data D2, D
3, the average value of the voice data D4, D5, ..., And the average value of the voice data D16, D17 are sequentially arranged in the X direction. Further, in the row of Y = 2, the average value of the voice data D4, D5, the average value of the voice data D6, D7, ..., The voice data D
The average values of 18 and D19 are arranged in order. Similarly, Y
= 3, 4, ..., 7 average values of two consecutive audio data are arranged in order.

【0052】このようにして、音声データD0,D1,
…,D29において各連続する2つの音声データの平均
値がX方向およびY方向に相関性を有するように配列さ
れる。第3の配列方法によれば、1つのマトリクスに配
列される音声データの数が30個となる。
In this way, the voice data D0, D1,
.., D29 are arranged so that the average values of the two consecutive audio data are correlated in the X and Y directions. According to the third arrangement method, the number of audio data arranged in one matrix is 30.

【0053】図5、図6、図7、図8および図9はそれ
ぞれ1kHz、2.5kHz、5kHz、9kHzおよ
び17kHzの正弦波を40kHzでサンプリングして
図1のDCT装置1により二次元離散コサイン変換した
結果を示す。
5, FIG. 6, FIG. 7, FIG. 8 and FIG. 9 are two-dimensional discrete cosine by the DCT apparatus 1 of FIG. 1 by sampling sine waves of 1 kHz, 2.5 kHz, 5 kHz, 9 kHz and 17 kHz at 40 kHz. The result of conversion is shown.

【0054】図5に示すように、1kHzの正弦波のD
CT係数は低域に集中している。また、図6に示すよう
に、2.5kHzの正弦波のDCT係数は低域から中域
に分布しており、図7に示すように、5kHzの正弦波
のDCT係数は主として中域に分布しており、図8に示
すように、9kHzの正弦波のDCT係数は中域から高
域に分布している。さらに、図9に示すように、17k
Hzの正弦波のDCT係数は主として高域に分布してい
る。
As shown in FIG. 5, a 1 kHz sine wave D
The CT coefficient is concentrated in the low range. Further, as shown in FIG. 6, the DCT coefficient of the sine wave of 2.5 kHz is distributed from the low range to the middle range, and as shown in FIG. 7, the DCT coefficient of the sine wave of 5 kHz is mainly distributed in the middle range. Therefore, as shown in FIG. 8, the DCT coefficients of the 9 kHz sine wave are distributed from the middle range to the high range. Furthermore, as shown in FIG.
The DCT coefficient of the sine wave of Hz is mainly distributed in the high range.

【0055】このように、図1のDCT装置1によれ
ば、音声信号の周波数に応じてDCT係数がある周波数
領域に偏って現れるので、データの圧縮率が高くなる。
従来のADPCMによれば、音声データの圧縮比は1/
2となるが、第1の実施例によれば、音声データの圧縮
比は1/6となった。また、第1の実施例によれば、A
DPCMとほぼ同等のS/Nが得られ、音質はADPC
Mと同程度となった。
As described above, according to the DCT device 1 of FIG. 1, the DCT coefficient appears in a certain frequency region in a biased manner in accordance with the frequency of the audio signal, resulting in a high data compression rate.
According to the conventional ADPCM, the compression ratio of audio data is 1 /
However, according to the first embodiment, the compression ratio of the audio data is 1/6. Further, according to the first embodiment, A
S / N almost equal to DPCM is obtained, and sound quality is ADPC
It was about the same as M.

【0056】(2)第2の実施例 図10は本発明の第2の実施例によるデータ圧縮方法を
示す図である。まず、図10の(a)に示すように、Q
MF(Quartz Mirror Filter) 等を用いて音声データを
複数の帯域に分割する。ここでは、音声データの全帯域
を0〜20kHzとする。0〜20kHzの帯域を0〜
10kHzの帯域と10〜20kHzの帯域とに分割す
る。さらに、0〜10kHzの帯域を0〜5kHzの帯
域と5〜10kHzの帯域とに分割し、10〜20kH
zの帯域を10〜15kHzの帯域と15〜20kHz
の帯域とに分割する。このようにして、音声データを4
つの帯域に分割する。
(2) Second Embodiment FIG. 10 is a diagram showing a data compression method according to a second embodiment of the present invention. First, as shown in FIG.
Audio data is divided into a plurality of bands using MF (Quartz Mirror Filter) or the like. Here, the entire band of the audio data is 0 to 20 kHz. 0 to 20 kHz band
It is divided into a band of 10 kHz and a band of 10 to 20 kHz. Furthermore, the band of 0 to 10 kHz is divided into a band of 0 to 5 kHz and a band of 5 to 10 kHz, and 10 to 20 kHz
Band of z is 10 to 15 kHz and 15 to 20 kHz
And the band of. In this way, the voice data
Divide into two bands.

【0057】次に、図10の(b)に示すように、分割
された帯域ごとに音声データを二次元マトリクスに配列
し、二次元離散コサイン変換を行ってDCT係数を得
る。二次元マトリクスへの配列方法は、第1の実施例に
おける配列方法を用いる。
Next, as shown in FIG. 10B, the voice data is arranged in a two-dimensional matrix for each divided band, and two-dimensional discrete cosine transform is performed to obtain DCT coefficients. The arrangement method in the two-dimensional matrix uses the arrangement method in the first embodiment.

【0058】さらに、図10の(c)に示すように、二
次元離散コサイン変換により得られた各帯域のDCT係
数から主たるDCT係数を、次の(A)〜(C)のいず
れかの方法を用いてあるいはそれらの方法を組み合わせ
て選択する。
Further, as shown in (c) of FIG. 10, the main DCT coefficient from the DCT coefficients of each band obtained by the two-dimensional discrete cosine transform is calculated by any of the following methods (A) to (C). Or using a combination of these methods.

【0059】(A)あるしきい値以上のDCT係数のみ
を選択する。 (B)DCT係数の二次元マトリクスを低域から高域に
かけて複数の領域に分割し、各領域内で代表的なDCT
係数を選択する。
(A) Select only DCT coefficients above a certain threshold. (B) A two-dimensional matrix of DCT coefficients is divided into a plurality of regions from a low band to a high band, and a typical DCT in each region.
Select a coefficient.

【0060】(C)ある値以上の高周波数成分またはあ
る値以下の低周波成分を一律にカットして残りのDCT
係数を選択する。 各帯域ごとに上記の(A),(B),(C)のいずれか
または2つ以上を組み合わせてDCT係数の選択を行
う。
(C) A high frequency component above a certain value or a low frequency component below a certain value is uniformly cut and the remaining DCT
Select a coefficient. For each band, any one of the above (A), (B), (C) or a combination of two or more is selected to select the DCT coefficient.

【0061】次に、ある帯域において選択されたDCT
係数を仮にハフマン符号化し、得られた符号データのデ
ータ長からすべての帯域の符号データのデータ長を推測
する。そして、図10の(d),(e)に示すように、
DCT係数の選択条件を修正することにより符号データ
のデータ長が所定の長さ以下になるようにデータ長を固
定化する。すなわち、方法(A)ではしきい値を変更
し、方法(B)では領域の分割方法を変更し、方法
(C)では高周波成分または低周波成分をカットする周
波数の値を変更する。修正された選択条件で、図10の
(c)示すDCT係数の選択を行う。
Next, the DCT selected in a band
The coefficients are provisionally Huffman-encoded, and the data lengths of the code data in all bands are estimated from the obtained data lengths of the code data. Then, as shown in (d) and (e) of FIG.
By correcting the selection condition of the DCT coefficient, the data length of the coded data is fixed so that the data length becomes equal to or shorter than a predetermined length. That is, the method (A) changes the threshold value, the method (B) changes the area dividing method, and the method (C) changes the frequency value for cutting the high frequency component or the low frequency component. The DCT coefficient shown in FIG. 10C is selected under the modified selection condition.

【0062】その後、図10の(d)に示すように、各
帯域において選択されたDCT係数をハフマン符号化
し、符号データを得る。このようにして、所定の長さ以
下のデータ長に固定化された符号データが得られる。
Thereafter, as shown in FIG. 10D, the DCT coefficient selected in each band is Huffman-coded to obtain coded data. In this way, code data fixed to a data length equal to or shorter than the predetermined length is obtained.

【0063】例えば、1kHzの正弦波をデータ圧縮す
る例を説明する。図11は1kHzの音声データを第1
の実施例の図2に示す方法で二次元マトリクスに配列し
た状態を示す。図11に示すように配列された音声デー
タに二次元離散コサイン変換を行うと、図12に示すよ
うなDCT係数が得られる。
For example, an example of data compression of a 1 kHz sine wave will be described. FIG. 11 shows the first 1 kHz audio data.
2 shows a state of being arranged in a two-dimensional matrix by the method shown in FIG. When the two-dimensional discrete cosine transform is performed on the audio data arranged as shown in FIG. 11, DCT coefficients as shown in FIG. 12 are obtained.

【0064】図12に示すDCT係数は、主として低域
L1に集中している。したがって、上記の方法(C)を
用いて高域H1の高周波成分を一律にカットし、低域L
1の“1589”,“−299”,“−299”を選択
する。それにより、図13に示すようなDCT係数が得
られる。
The DCT coefficients shown in FIG. 12 are mainly concentrated in the low range L1. Therefore, by using the above method (C), the high frequency component of the high frequency range H1 is uniformly cut to obtain the low frequency range L1.
1 “1589”, “−299”, and “−299” are selected. Thereby, the DCT coefficient as shown in FIG. 13 is obtained.

【0065】図13のDCT係数を二次元逆離散コサイ
ン変換により復号化すると、図14に示すような音声デ
ータが得られる。図14に示す復号化後の音声データ
は、図11に示す二次元離散コサイン変換前の音声デー
タとほぼ一致していることがわかる。
When the DCT coefficient of FIG. 13 is decoded by the two-dimensional inverse discrete cosine transform, the voice data as shown in FIG. 14 is obtained. It can be seen that the decoded voice data shown in FIG. 14 substantially matches the voice data before the two-dimensional discrete cosine transform shown in FIG.

【0066】図15は2.5kHzの音声データのDC
T係数に上記の方法(B)を適用した状態を示す図であ
る。図15に示すように、DCT係数のマトリクスを低
域L2、中域M2および高域H2に分割し、低域L2の
代表値“320”および中域M2の代表値“−389”
を選択する。それにより、図16に示すようなDCT係
数が得られる。
FIG. 15 shows DC of 2.5 kHz audio data.
It is a figure which shows the state which applied the said method (B) to T coefficient. As shown in FIG. 15, the matrix of DCT coefficients is divided into a low range L2, a middle range M2, and a high range H2, and a representative value “320” of the low range L2 and a representative value “−389” of the middle range M2.
Select Thereby, the DCT coefficient as shown in FIG. 16 is obtained.

【0067】図17は5kHzの音声信号のDCT係数
に上記の(B)を適用した状態を示す図である。図17
に示すように、DCT係数のマトリクスを低域L3、中
域M3および高域H3に分割し、中域M3の代表値“8
60”および“−670”を選択する。それにより、図
18に示すDCT係数が得られる。
FIG. 17 is a diagram showing a state in which the above (B) is applied to the DCT coefficient of a 5 kHz audio signal. FIG. 17
As shown in, the matrix of DCT coefficients is divided into a low range L3, a middle range M3, and a high range H3, and the representative value "8" of the middle range M3
60 "and" -670 "are selected to obtain the DCT coefficient shown in FIG.

【0068】図19は9kHzの音声信号のDCT係数
に上記の方法(B)を適用した状態を示す図である。図
19に示すように、DCT係数のマトリクスを低域L
4、中域M4および高域H4に分割し、中域M4の代表
値“904”および高域H4の代表値“−723”を選
択する。それにより、図20に示すDCT係数が得られ
る。
FIG. 19 is a diagram showing a state in which the above method (B) is applied to the DCT coefficient of a 9 kHz audio signal. As shown in FIG. 19, the DCT coefficient matrix is set to the low range L.
4, the middle range M4 and the high range H4 are divided, and the representative value "904" of the middle range M4 and the representative value "-723" of the high range H4 are selected. Thereby, the DCT coefficient shown in FIG. 20 is obtained.

【0069】図21は17kHzの音声データのDCT
係数に上記の方法(C)を適用した状態を示す図であ
る。図21に示すように、DCT係数のマトリクスにお
いて低域L5の周波数成分を一律にカットし、高域H5
の“707”,“708”,“−477”を選択する。
それにより、図22に示すDCT係数が得られる。
FIG. 21 shows a DCT of 17 kHz audio data.
It is a figure which shows the state which applied the said method (C) to a coefficient. As shown in FIG. 21, in the matrix of DCT coefficients, the frequency components in the low frequency band L5 are uniformly cut, and the high frequency band H5 is cut.
“707”, “708”, and “−477” are selected.
As a result, the DCT coefficient shown in FIG. 22 is obtained.

【0070】(3)第3の実施例 図23は第3の実施例によるデータ圧縮装置の構成の一
例を示すブロック図である。図23に示すように、デー
タ圧縮装置20は、二次元DCT部21,23、分離部
22およびハフマン符号化部24,25を含む。
(3) Third Embodiment FIG. 23 is a block diagram showing an example of the arrangement of a data compression apparatus according to the third embodiment. As shown in FIG. 23, the data compression device 20 includes two-dimensional DCT units 21 and 23, a separation unit 22, and Huffman coding units 24 and 25.

【0071】まず、データ圧縮装置20による8ビット
の画像データのデータ圧縮を説明する。二次元DCT部
21は、8ビットの入力データに二次元離散コサイン変
換を行い、11ビットのデータ(DCT係数)を出力す
る。分離部22は、二次元DCT部21から出力された
11ビットのデータを量子化因子“128”で割ること
により、11ビットのデータを上位7ビットのデータお
よび下位4ビットのデータに分離する。下位4ビットの
データが量子化誤差となる。
First, the data compression of 8-bit image data by the data compression device 20 will be described. The two-dimensional DCT unit 21 performs two-dimensional discrete cosine transform on the 8-bit input data and outputs 11-bit data (DCT coefficient). The separation unit 22 divides the 11-bit data output from the two-dimensional DCT unit 21 by the quantization factor “128” to separate the 11-bit data into upper 7-bit data and lower 4-bit data. The lower 4-bit data becomes the quantization error.

【0072】二次元DCT部23は、分離部22により
得られた下位4ビットのデータに二次元離散コサイン変
換を行い、7ビットのデータ(DCT係数)を得る。ハ
フマン符号化部24は、二次元DCT部23により得ら
れた7ビットのデータにハフマン符号化を行い、下位側
の符号データDDを得る。
The two-dimensional DCT section 23 performs a two-dimensional discrete cosine transform on the lower 4-bit data obtained by the separating section 22 to obtain 7-bit data (DCT coefficient). The Huffman coding unit 24 performs Huffman coding on the 7-bit data obtained by the two-dimensional DCT unit 23 to obtain lower-order code data DD.

【0073】一方、ハフマン符号化部25は、分離部2
2により得られた上位7ビットのデータにハフマン符号
化を行い、上位側の符号データUDを得る。セレクタ2
6は、ハフマン符号化部25から得られた上位側の符号
データUDとハフマン符号化部24により得られた下位
側の符号データDDとを8×8のブロックごとに交互に
選択して伝送する。
On the other hand, the Huffman coding unit 25 has the separating unit 2
Huffman coding is performed on the higher-order 7-bit data obtained in step 2 to obtain higher-order code data UD. Selector 2
6 alternately selects the higher-order code data UD obtained from the Huffman coding unit 25 and the lower-order code data DD obtained by the Huffman coding unit 24 for each 8 × 8 block, and transmits the block. .

【0074】図23において、括弧内のビット数は音声
データ(オーディオデータ)のビット数を示す。次に、
データ圧縮装置20による16ビットの音声データのデ
ータ圧縮を説明する。
In FIG. 23, the number of bits in parentheses indicates the number of bits of audio data (audio data). next,
Data compression of 16-bit audio data by the data compression device 20 will be described.

【0075】二次元DCT部21は、16ビットの音声
データに二次元離散コサイン変換を行い、19ビットの
データ(DCT係数)を出力する。分離部22は、二次
元DCT部21から出力された19ビットのデータを上
位11ビットのデータと下位8ビットのデータとに分離
する。二次元DCT部23は、分離部22により得られ
た下位8ビットのデータに二次元離散コサイン変換を行
い、11ビットのデータ(DCT係数)を得る。ハフマ
ン符号化部24は、二次元DCT部23により得られた
11ビットのデータにハフマン符号化を行い、下位側の
符号データDDを出力する。
The two-dimensional DCT section 21 performs two-dimensional discrete cosine transform on 16-bit voice data and outputs 19-bit data (DCT coefficient). The separation unit 22 separates the 19-bit data output from the two-dimensional DCT unit 21 into upper 11-bit data and lower 8-bit data. The two-dimensional DCT unit 23 performs two-dimensional discrete cosine transform on the lower 8-bit data obtained by the separating unit 22 to obtain 11-bit data (DCT coefficient). The Huffman coding unit 24 performs Huffman coding on the 11-bit data obtained by the two-dimensional DCT unit 23, and outputs the lower code data DD.

【0076】一方、ハフマン符号化部25は、分離部2
2により得られた上位11ビットのデータにハフマン符
号化を行い、上位側の符号データをUDを出力する。セ
レクタ26は、ハフマン符号化部25により得られた上
位側の符号データUDとハフマン符号化部24により得
られた下位側の符号データDDとを8×8のブロックご
とに交互に選択して伝送する。
On the other hand, the Huffman coding unit 25 has the separating unit 2
Huffman coding is performed on the upper 11-bit data obtained by 2, and UD is output as the upper-side code data. The selector 26 alternately selects the higher-order code data UD obtained by the Huffman coding unit 25 and the lower-order code data DD obtained by the Huffman coding unit 24 for each 8 × 8 block and transmits it. To do.

【0077】このように、本実施例のデータ圧縮装置2
0では、従来の量子化において量子化誤差となる下位4
ビットのデータまたは下位8ビットのデータに再び二次
元離散コサイン変換を行った後、ハフマン符号化してい
るので、データ圧縮における誤差が二次元離散コサイン
変換による誤差のみとなる。したがって、高品質な画像
データまたは音声データが得られる。
In this way, the data compression device 2 of this embodiment is
At 0, the lower 4 which is a quantization error in the conventional quantization.
Since the Huffman coding is performed again after the two-dimensional discrete cosine transform is performed on the bit data or the lower 8-bit data, the error in the data compression is only the error due to the two-dimensional discrete cosine transform. Therefore, high quality image data or audio data can be obtained.

【0078】図24は本発明の第3の実施例によるデー
タ圧縮装置の構成の他の例を示すブロック図である。図
24において、データ圧縮装置30は、セレクタ31,
34、二次元DCT部32、分離部33およびハフマン
符号化部35を含む。
FIG. 24 is a block diagram showing another example of the structure of the data compression apparatus according to the third embodiment of the present invention. In FIG. 24, the data compression device 30 includes a selector 31,
34, a two-dimensional DCT unit 32, a separation unit 33, and a Huffman coding unit 35.

【0079】ここでは、入力データが8ビットの画像デ
ータの場合を説明する。まず、セレクタ31が、その8
ビットの入力データを選択して出力する。二次元DCT
部32は、セレクタ31から出力される8ビットの入力
データに二次元離散コサイン変換を行い、11ビットの
データ(DCT係数)を出力する。分離部33は、二次
元DCT部32から出力された11ビットのデータを上
位7ビットのデータと下位4ビットのデータとに分離
し、下位4ビットのデータをセレクタ31に戻し、上位
7ビットのデータをセレクタ34に与える。
Here, the case where the input data is 8-bit image data will be described. First, the selector 31
Selects and outputs bit input data. Two-dimensional DCT
The unit 32 performs a two-dimensional discrete cosine transform on the 8-bit input data output from the selector 31 and outputs 11-bit data (DCT coefficient). The separating unit 33 separates the 11-bit data output from the two-dimensional DCT unit 32 into upper 7-bit data and lower 4-bit data, returns the lower 4-bit data to the selector 31, and returns the upper 7-bit data. The data is given to the selector 34.

【0080】セレクタ34は、まず、分離部33から出
力された上位7ビットのデータを選択して出力する。ハ
フマン符号化部35は、セレクタ34から出力された上
位7ビットのデータにハフマン符号化を行い、符号デー
タを出力する。
The selector 34 first selects and outputs the upper 7-bit data output from the separating unit 33. The Huffman coding unit 35 performs Huffman coding on the upper 7-bit data output from the selector 34, and outputs the coded data.

【0081】一方、セレクタ31は、分離部33により
得られた下位4ビットのデータを選択して出力する。二
次元DCT部32は、セレクタ31から出力された下位
4ビットのデータに二次元離散コサイン変換を行い、7
ビットのデータ(DCT係数)を出力し、セレクタ34
に与える。セレクタ34は、二次元DCT部32から出
力された7ビットのデータを選択して出力する。ハフマ
ン符号化部35は、セレクタ34から出力された7ビッ
トのデータにハフマン符号化を行い、符号データを出力
する。
On the other hand, the selector 31 selects and outputs the lower 4-bit data obtained by the separating unit 33. The two-dimensional DCT unit 32 performs a two-dimensional discrete cosine transform on the lower 4-bit data output from the selector 31,
The bit data (DCT coefficient) is output, and the selector 34
Give to. The selector 34 selects and outputs the 7-bit data output from the two-dimensional DCT unit 32. The Huffman coding unit 35 performs Huffman coding on the 7-bit data output from the selector 34, and outputs the coded data.

【0082】このように、図24のデータ圧縮装置30
においては、セレクタ31,34を用いることにより二
次元DCT部32が図23のデータ圧縮装置20におけ
る2つの二次元DCT部21,23の働きを行い、ハフ
マン符号化部35が2つのハフマン符号化部24,25
の働きを行う。
As described above, the data compression device 30 of FIG.
23, the two-dimensional DCT unit 32 functions as the two two-dimensional DCT units 21 and 23 in the data compression device 20 of FIG. 23 by using the selectors 31 and 34, and the Huffman coding unit 35 performs two Huffman coding. Parts 24 and 25
Perform the work of.

【0083】なお、図24においても、括弧内は音声デ
ータのビット数を示す。入力データが16ビットの音声
データの場合にも、同様にしてデータ圧縮が行われる。
In FIG. 24, the number of bits of audio data is shown in parentheses. Even when the input data is 16-bit audio data, the data compression is performed similarly.

【0084】[0084]

【発明の効果】第1の発明によれば、一連の音声データ
が水平方向および垂直方向に相関性を有するように二次
元マトリクスに配列され、二次元離散コサイン変換が行
われるので、データの圧縮率が高くなる。したがって、
高い音質を維持しつつビットレートを改善することがで
きる。
According to the first aspect of the present invention, a series of audio data are arranged in a two-dimensional matrix so as to have correlation in the horizontal and vertical directions, and the two-dimensional discrete cosine transform is performed. Therefore, data compression is performed. The rate is high. Therefore,
It is possible to improve the bit rate while maintaining high sound quality.

【0085】第2の発明によれば、一連の音声データが
複数の周波数帯域に分割され、各周波数帯域ごとに二次
元離散コサイン変換および主たるデータの選択が行わ
れ、かつ符号データのデータ長が所定の長さ以下になる
ように選択条件を修正しつつ符号化が行われるので、低
ビットレートで良好な音質が得られるとともに、符号デ
ータのデータ長が一定の長さ以下に固定化され、かつデ
ータ長が短縮される。
According to the second invention, a series of voice data is divided into a plurality of frequency bands, two-dimensional discrete cosine transform and main data selection are performed for each frequency band, and the data length of code data is Since encoding is performed while correcting the selection condition so that the length is equal to or less than a predetermined length, good sound quality is obtained at a low bit rate, and the data length of the code data is fixed to a certain length or less, And the data length is shortened.

【0086】第3の発明によれば、二次元離散コサイン
変換により得られたデータのうち量子化誤差となるデー
タにさらに二次元離散コサイン変換が行われた後、符号
化が行われるので、データ圧縮の誤差が二次元離散コサ
イン変換による誤差のみとなる。したがって、高品質な
データ圧縮が可能となる。
According to the third aspect of the invention, of the data obtained by the two-dimensional discrete cosine transform, the data that is the quantization error is further subjected to the two-dimensional discrete cosine transform and then encoded, so that the data is The compression error is only the error due to the two-dimensional discrete cosine transform. Therefore, high quality data compression becomes possible.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の第1の実施例によるDCT装置の構成
を示すブロック図である。
FIG. 1 is a block diagram showing the configuration of a DCT device according to a first embodiment of the present invention.

【図2】第1の実施例における音声データの第1の配列
方法を示す図である。
FIG. 2 is a diagram showing a first arrangement method of audio data in the first embodiment.

【図3】第1の実施例における音声データの第2の配列
方法を示す図である。
FIG. 3 is a diagram showing a second arrangement method of audio data according to the first embodiment.

【図4】第1の実施例における音声データの第3の配列
方法を示す図である。
FIG. 4 is a diagram showing a third arrangement method of audio data according to the first embodiment.

【図5】1kHzの正弦波を二次元離散コサイン変換す
ることにより得られたDCT係数の一例を示す図であ
る。
FIG. 5 is a diagram showing an example of DCT coefficients obtained by two-dimensional discrete cosine transform of a 1 kHz sine wave.

【図6】2.5kHzの正弦波を二次元離散コサイン変
換することにより得られたDCT係数の一例を示す図で
ある。
FIG. 6 is a diagram showing an example of DCT coefficients obtained by subjecting a 2.5 kHz sine wave to two-dimensional discrete cosine transform.

【図7】5kHzの正弦波を二次元離散コサイン変換す
ることにより得られたDCT係数の一例を示す図であ
る。
FIG. 7 is a diagram showing an example of DCT coefficients obtained by subjecting a 5 kHz sine wave to two-dimensional discrete cosine transform.

【図8】9kHzの正弦波を二次元離散コサイン変換す
ることにより得られたDCT係数の一例を示す図であ
る。
FIG. 8 is a diagram showing an example of DCT coefficients obtained by performing a two-dimensional discrete cosine transform on a 9 kHz sine wave.

【図9】17kHzの正弦波を二次元離散コサイン変換
することにより得られたDCT係数の一例を示す図であ
る。
FIG. 9 is a diagram showing an example of DCT coefficients obtained by subjecting a 17 kHz sine wave to two-dimensional discrete cosine transform.

【図10】本発明の第2の実施例によるデータ圧縮方法
を示す図である。
FIG. 10 is a diagram showing a data compression method according to a second embodiment of the present invention.

【図11】1kHzの音声データを第1の実施例におけ
る第1の配列方法により配列した状態を示す図である。
FIG. 11 is a diagram showing a state in which 1 kHz audio data is arranged by the first arrangement method in the first embodiment.

【図12】図11の音声データを二次元離散コサイン変
換することにより得られたDCT係数を示す図である。
12 is a diagram showing DCT coefficients obtained by performing two-dimensional discrete cosine transform on the audio data of FIG.

【図13】図12のDCT係数から主たるDCT係数を
第2の実施例における選択方法により選択した状態を示
す図である。
FIG. 13 is a diagram showing a state in which a main DCT coefficient is selected from the DCT coefficients shown in FIG. 12 by the selection method according to the second embodiment.

【図14】図13のDCT係数のハフマン符号化により
得られた符号データを二次元逆離散コサイン変換するこ
とにより復号された音声データを示す図である。
14 is a diagram showing speech data decoded by performing two-dimensional inverse discrete cosine transform on the code data obtained by the Huffman coding of the DCT coefficient shown in FIG.

【図15】2.5kHzの音声データを二次元離散コサ
イン変換することにより得られたDCT係数を示す図で
ある。
FIG. 15 is a diagram showing DCT coefficients obtained by two-dimensional discrete cosine transform of 2.5 kHz voice data.

【図16】図15に示すDCT係数から主たるDCT係
数を第2の実施例における選択方法により選択した状態
を示す図である。
16 is a diagram showing a state in which a main DCT coefficient is selected from the DCT coefficients shown in FIG. 15 by the selection method in the second embodiment.

【図17】5kHzの音声データを二次元離散コサイン
変換することにより得られたDCT係数を示す図であ
る。
FIG. 17 is a diagram showing DCT coefficients obtained by two-dimensional discrete cosine transform of 5 kHz voice data.

【図18】図17のDCT係数から主たるDCT係数を
第2の実施例における選択方法により選択した状態を示
す図である。
FIG. 18 is a diagram showing a state in which a main DCT coefficient is selected from the DCT coefficients of FIG. 17 by the selection method according to the second embodiment.

【図19】9kHzの音声データを二次元離散コサイン
変換することにより得られたDCT係数を示す図であ
る。
FIG. 19 is a diagram showing DCT coefficients obtained by two-dimensional discrete cosine transform of 9 kHz voice data.

【図20】図19のDCT係数から主たるDCT係数を
第2の実施例における選択方法により選択した状態を示
す図である。
20 is a diagram showing a state in which a main DCT coefficient is selected from the DCT coefficients of FIG. 19 by the selection method in the second embodiment.

【図21】17kHzの音声データを二次元離散コサイ
ン変換することにより得られたDCT係数を示す図であ
る。
FIG. 21 is a diagram showing DCT coefficients obtained by two-dimensional discrete cosine transform of 17 kHz audio data.

【図22】図21のDCT係数から主たるDCT係数を
第2の実施例における選択方法により選択した状態を示
す図である。
FIG. 22 is a diagram showing a state in which a main DCT coefficient is selected from the DCT coefficients of FIG. 21 by the selection method in the second embodiment.

【図23】本発明の第3の実施例によるデータ圧縮装置
の構成の一例を示すブロック図である。
FIG. 23 is a block diagram showing an example of a configuration of a data compression device according to a third embodiment of the present invention.

【図24】本発明の第3の実施例によるデータ圧縮装置
の構成の他の例を示すブロック図である。
FIG. 24 is a block diagram showing another example of the configuration of the data compression apparatus according to the third embodiment of the present invention.

【図25】DCT方式の画像データ圧縮システムの基本
構成を示すブロック図である。
FIG. 25 is a block diagram showing the basic configuration of a DCT image data compression system.

【図26】画像データのブロック化を示す図である。FIG. 26 is a diagram showing how image data is divided into blocks.

【図27】8×8画素ブロックおよび二次元離散コサイ
ン変換されたブロックを示す図である。
FIG. 27 is a diagram showing an 8 × 8 pixel block and a block subjected to a two-dimensional discrete cosine transform.

【図28】二次元離散コサイン変換を用いた従来の音声
データの圧縮方法を示す図である。
FIG. 28 is a diagram showing a conventional audio data compression method using a two-dimensional discrete cosine transform.

【符号の説明】[Explanation of symbols]

1 DCT装置 2 A/D変換器 3 レジスタ 4 マトリクス用メモリ 5 アドレスセレクタ 6 二次元DCT部 20,30 データ圧縮装置 21,23,32 二次元DCT部 22,33 分離部 24,25,35 ハフマン符号化部 26,31,34 セレクタ なお、各図中同一符号は同一または相当部分を示す。 1 DCT device 2 A / D converter 3 Register 4 Memory for matrix 5 Address selector 6 Two-dimensional DCT unit 20,30 Data compression device 21,23,32 Two-dimensional DCT unit 22,33 Separation unit 24,25,35 Huffman code Converting unit 26, 31, 34 Selector In the drawings, the same reference numerals indicate the same or corresponding parts.

Claims (3)

Translated fromJapanese
【特許請求の範囲】[Claims]【請求項1】 一連の音声データを水平方向および垂直
方向に相関性を有するように二次元マトリクスに配列す
る配列手段と、 前記配列手段により配列された二次元マトリクスの音声
データに二次元離散コサイン変換を行う変換手段とを備
えたデータ圧縮装置。
1. Arrangement means for arranging a series of audio data in a two-dimensional matrix so as to have correlation in the horizontal and vertical directions, and two-dimensional discrete cosine to the audio data of the two-dimensional matrix arranged by the arrangement means. A data compression device comprising a conversion means for performing conversion.
【請求項2】 一連の音声データを複数の周波数帯域に
分割し、前記分割により得られた各周波数帯域の音声デ
ータを二次元マトリクスに配列し、各周波数帯域ごとに
二次元マトリクスの音声データに二次元離散コサイン変
換を行い、前記二次元離散コサイン変換により得られた
各周波数帯域ごとのデータから主たるデータを所定の選
択条件に基づいて選択し、符号データの長さが所定の長
さ以下になるように前記選択条件を修正しつつ選択され
た主たるデータを符号化することを特徴とするデータ圧
縮方法。
2. A series of audio data is divided into a plurality of frequency bands, the audio data of each frequency band obtained by the division is arranged in a two-dimensional matrix, and each frequency band is converted into a two-dimensional matrix of audio data. Performing a two-dimensional discrete cosine transform, select the main data from the data for each frequency band obtained by the two-dimensional discrete cosine transform based on a predetermined selection condition, the length of the code data is less than a predetermined length A data compression method, characterized in that the selected main data is encoded while the selection condition is corrected so that
【請求項3】 mビットのデータに二次元離散コサイン
変換を行ってnビットのデータを得る第1の変換手段
と、 前記第1の変換手段により得られたデータを上位n−k
ビットのデータおよび下位kビットのデータに分離する
分離手段と、 前記分離手段により得られた前記下位kビットのデータ
に二次元離散コサイン変換を行う第2の変換手段と、 前記第2の変換手段により得られたデータを符号化する
第1の符号化手段と、 前記分離手段により得られた前記上位n−kビットのデ
ータを符号化する第2の符号化手段とを備えたデータ圧
縮装置。
3. A first conversion unit for performing two-dimensional discrete cosine transformation on m-bit data to obtain n-bit data, and the data obtained by the first conversion unit is higher-order nk.
Separation means for separating the low-order k-bit data and the low-order k-bit data, a second conversion means for performing a two-dimensional discrete cosine transform on the low-order k-bit data obtained by the separation means, and the second conversion means. A data compression apparatus comprising: a first encoding unit that encodes the data obtained by the above; and a second encoding unit that encodes the data of the higher order nk bits obtained by the separating unit.
JP6152006A1994-07-041994-07-04 Data compression deviceExpired - Fee RelatedJP2969047B2 (en)

Priority Applications (1)

Application NumberPriority DateFiling DateTitle
JP6152006AJP2969047B2 (en)1994-07-041994-07-04 Data compression device

Applications Claiming Priority (1)

Application NumberPriority DateFiling DateTitle
JP6152006AJP2969047B2 (en)1994-07-041994-07-04 Data compression device

Publications (2)

Publication NumberPublication Date
JPH0816192Atrue JPH0816192A (en)1996-01-19
JP2969047B2 JP2969047B2 (en)1999-11-02

Family

ID=15531011

Family Applications (1)

Application NumberTitlePriority DateFiling Date
JP6152006AExpired - Fee RelatedJP2969047B2 (en)1994-07-041994-07-04 Data compression device

Country Status (1)

CountryLink
JP (1)JP2969047B2 (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication numberPriority datePublication dateAssigneeTitle
US6253303B1 (en)1996-08-092001-06-26Nec CorporationAudio signal processing circuit
JP2005326862A (en)*2004-05-132005-11-24Samsung Electronics Co Ltd Audio signal compression apparatus and method, audio signal restoration apparatus and method, and computer-readable recording medium
CN114299983A (en)*2021-11-032022-04-08河北农业大学Technical method for mutual conversion of image and voice
US11308045B2 (en)2017-07-042022-04-19Nec CorporationInformation processing apparatus, control method, and program

Cited By (5)

* Cited by examiner, † Cited by third party
Publication numberPriority datePublication dateAssigneeTitle
US6253303B1 (en)1996-08-092001-06-26Nec CorporationAudio signal processing circuit
JP2005326862A (en)*2004-05-132005-11-24Samsung Electronics Co Ltd Audio signal compression apparatus and method, audio signal restoration apparatus and method, and computer-readable recording medium
US8019600B2 (en)2004-05-132011-09-13Samsung Electronics Co., Ltd.Speech signal compression and/or decompression method, medium, and apparatus
US11308045B2 (en)2017-07-042022-04-19Nec CorporationInformation processing apparatus, control method, and program
CN114299983A (en)*2021-11-032022-04-08河北农业大学Technical method for mutual conversion of image and voice

Also Published As

Publication numberPublication date
JP2969047B2 (en)1999-11-02

Similar Documents

PublicationPublication DateTitle
JP4037271B2 (en) Signal compression apparatus and method
US8135226B2 (en)Image encoder, image encoding method, image decoder, and image decoding method
US5550542A (en)Variable length code look-up table having separate code length determination
JPH0746142A (en)Data compression system
JPH05206867A (en)Apparatus and method for compression of data and data arrangement device used for them
JP2001513608A (en) Signal encoding and decoding
JP3466080B2 (en) Digital data encoding / decoding method and apparatus
JP4768728B2 (en) Method and apparatus for encoding a block of values
KR20050012733A (en)Adaptive method and system for mapping parameter values to codeword indexes
JP3255022B2 (en) Adaptive transform coding and adaptive transform decoding
JP2878796B2 (en) Speech coder
JP2969047B2 (en) Data compression device
JPH0969781A (en) Audio data encoder
JP2001045484A (en) Image encoding device, image decoding device, image encoding method, and image decoding method
JP3191257B2 (en) Acoustic signal encoding method, acoustic signal decoding method, acoustic signal encoding device, acoustic signal decoding device
JP2552102B2 (en) Digital data for-matching / defo-matching circuit
JPH01171324A (en) High efficiency encoding device
JPH0537395A (en)Band-division encoding method
JP3471366B2 (en) Image compression / expansion method and image compression / expansion device
JP2856439B2 (en) Image signal encoding / decoding method
JP2543345B2 (en) Speech coding system
KR100303744B1 (en)Method and device for compressing and expanding image
JPH08275153A (en) Image compression device and image decompression device
JP2521052B2 (en) Speech coding system
JP2521050B2 (en) Speech coding system

Legal Events

DateCodeTitleDescription
LAPSCancellation because of no payment of annual fees

[8]ページ先頭

©2009-2025 Movatter.jp