Movatterモバイル変換


[0]ホーム

URL:


JPS59107397A - Voice recognition equipment - Google Patents

Voice recognition equipment

Info

Publication number
JPS59107397A
JPS59107397AJP57217296AJP21729682AJPS59107397AJP S59107397 AJPS59107397 AJP S59107397AJP 57217296 AJP57217296 AJP 57217296AJP 21729682 AJP21729682 AJP 21729682AJP S59107397 AJPS59107397 AJP S59107397A
Authority
JP
Japan
Prior art keywords
pattern
standard
standard pattern
counter
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP57217296A
Other languages
Japanese (ja)
Other versions
JPH0555880B2 (en
Inventor
充宏 斗谷
外川 文雄
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Computer Basic Technology Research Association Corp
Original Assignee
Computer Basic Technology Research Association Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Computer Basic Technology Research Association CorpfiledCriticalComputer Basic Technology Research Association Corp
Priority to JP57217296ApriorityCriticalpatent/JPS59107397A/en
Publication of JPS59107397ApublicationCriticalpatent/JPS59107397A/en
Publication of JPH0555880B2publicationCriticalpatent/JPH0555880B2/ja
Grantedlegal-statusCriticalCurrent

Links

Abstract

Translated fromJapanese

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
(57) [Summary] This bulletin contains application data before electronic filing, so abstract data is not recorded.

Description

Translated fromJapanese

【発明の詳細な説明】く技術分野〉本発明は認識すべき音声の特徴パターンと、予め登録さ
れた複数種類の音声の特徴標準パターンとの類似度計算
を行なって認識判定を行なう音声認識装置の改良に関し
、更に詳細には予め登録されている音声の特徴標準パタ
ーンの良否を知る手段を与えるようにした音声認識装置
に関するものである。
[Detailed Description of the Invention] Technical Field> The present invention provides a speech recognition device that performs recognition determination by calculating the similarity between a feature pattern of speech to be recognized and a plurality of pre-registered standard feature patterns of speech. More particularly, the present invention relates to a speech recognition device that provides means for determining the quality of pre-registered speech feature standard patterns.

〈従来技術〉従来より複数の特徴標準パターンを登録しておいて、そ
の標準パターンと入力特徴パターンとのマンチングによ
って音声認識を行う装置が実用化されているが、このよ
うな音声認識装置において特徴標準パターンを一度登録
すると、この登録されている特徴標準パターンの良否を
定量的に知ることが出来ず、認識結果から経験的に特徴
標準パターン(音声パターン)の良否を判断する必要が
あった。
<Prior art> Devices have been put into practical use that register multiple feature standard patterns and perform speech recognition by munching the standard patterns and input feature patterns. Once a standard pattern is registered, it is not possible to quantitatively know whether the registered characteristic standard pattern is good or bad, and it is necessary to judge the quality of the characteristic standard pattern (voice pattern) empirically from the recognition results.

く目的〉本発明は上記の点に鑑みて成されたものであり、の良否
に応じて、選択して登録パターンの入れ換えを行うこと
ができるようにした音声認識装置を提供することを目的
としている。
Purpose of the present invention The present invention has been made in view of the above points, and an object of the present invention is to provide a speech recognition device that can selectively replace registered patterns depending on the quality of the registered patterns. There is.

〈実施例〉以下、本発明を一実施例を挙げて詳細に説明する。<Example>Hereinafter, the present invention will be explained in detail by giving an example.

第1図は本発明の一実施例装置の構成を示すブロック図
であり、単語単位に発声された音声を単音節単位に認識
し、複数の単語候補に対して辞書照合を行い、認識結果
を出力する音声認識装置を例にして示している。
FIG. 1 is a block diagram showing the configuration of an apparatus according to an embodiment of the present invention, which recognizes speech uttered word by word in monosyllable units, performs dictionary checking on multiple word candidates, and displays the recognition results. An example of a speech recognition device for output is shown.

第1図において1は音声入力をピックアンプするマイク
ロホン、2は単語単位に発声され上記マイクロホンlを
介して入力された音声を単音節毎に分析して入カバター
ンとし、標準パターンメモリ3に記憶された標準パター
ンと入カバターンとのマツチングを行ない認識結果を出
力する単音節認識部、3は登録された標準(特徴)パタ
ーンを保持する標準パターンメモリ、4は上記標準パタ
ーンメモリ3に記憶された各標準パターンに対応して所
定のカウント値を記憶するカウンタメモリ手段、5は辞
書照合時に必要な単語を記憶している単語辞書メモリ、
6は標準パターンのテスト用の単語が複数個記憶されて
いる標準パターンテスト用単語メモリ、7はキーボード
入力装置であり、例えば第2図に示すよう(;かなキー
7a、単語入力の終了波ひ次候補を呼び出すためのmi
1キー7b、認識結果の確定を指示する謳ロキー7c、
認識結果の修正を指示する2キー7d等が備えられてい
る。また8は認識結果等を表示する表示装置、9は標準
パターン等の退避に用いられるフロンピーディスク装置
、10は上記各装置2〜9を制御するコントローラ(C
PU)である。
In FIG. 1, reference numeral 1 indicates a microphone for pick-amplifying voice input, and reference numeral 2 indicates a microphone that pick-amples the voice input, and 2, the voice that is uttered word by word and inputted through the microphone 1 is analyzed for each monosyllable and converted into an input cover pattern, which is stored in the standard pattern memory 3. 3 is a standard pattern memory that holds registered standard (feature) patterns; 4 is each memory stored in the standard pattern memory 3; Counter memory means for storing a predetermined count value corresponding to a standard pattern; 5 a word dictionary memory for storing words necessary for dictionary comparison;
6 is a standard pattern test word memory in which a plurality of standard pattern test words are stored; 7 is a keyboard input device; for example, as shown in FIG. mi to call the next candidate
1 key 7b, a singing key 7c for instructing confirmation of the recognition result,
A 2-key 7d and the like for instructing correction of recognition results are provided. Further, 8 is a display device for displaying recognition results, 9 is a floppy disk device used for saving standard patterns, etc., and 10 is a controller (C) for controlling each of the above devices 2 to 9.
PU).

上記標準パターンメモリ3には「あ」〜「ん」までの単
音節の特徴パターンがそれぞれ5個(A〜E)ずつ記憶
されている。また上記の各標準パターンに対応するカウ
ンタメモリ手段4にはそれぞれ第3図に示すように例え
ば初期fit r 80 Jが設定記憶される。
The standard pattern memory 3 stores five monosyllable characteristic patterns (A to E) for each of the characters "A" to "N". Further, in the counter memory means 4 corresponding to each of the above-mentioned standard patterns, an initial value, for example, fit r 80 J, is set and stored, as shown in FIG. 3, respectively.

上記標準パターンメモリ3及びカウンタメモリ手段4へ
の情報の初期登録動作は第4図に示す初期登録フローに
従って行われる。
The initial registration operation of information in the standard pattern memory 3 and counter memory means 4 is performed according to the initial registration flow shown in FIG.

即ちキー人力装置7の所定キーを操作して装置を切期登
録動作モードに設定すると、CPUl0の制御の下に表
示装置8に発声すべき単音節、例えば「あ」が表示され
る(ステップn I 、 n2)。
That is, when a predetermined key of the key-powered device 7 is operated to set the device to the expiration registration operation mode, a monosyllable to be uttered, for example, "a" is displayed on the display device 8 under the control of the CPU10 (step n I, n2).

オペレータは表示装置8に表示された単音節を確認して
音節を発声すると、この発声された音節かマイク1を介
して入力され(n3)、単音節認識部2で分析されて入
力音声(単音節)に対する特徴パターンが作成され、こ
の分析された入力、6ターン(特徴パターン)がCPU
 I Oにより標準ノ々ターンメモリ3の所定位置(例
えばあえに対応した位置)に記憶されると共に(n4)
、この登録された標準パターン(あA)に対応したカウ
ンタメモリ手段4の所定位置に初期値「80」がセット
される(n5)。このような一連の動作が標準パターン
の全てに対して行なわれ、この結果カウンタメモリ手段
4の各標準メモリに対するカウンタ値が第3図に示すよ
うにそれぞれ初期値「80」に設定される。
When the operator confirms the monosyllables displayed on the display device 8 and utters the syllables, the uttered syllables are inputted via the microphone 1 (n3), analyzed by the monosyllable recognition unit 2, and converted into input speech (single syllables). A feature pattern for the syllable is created, and this analyzed input, 6 turns (feature pattern), is sent to the CPU.
It is stored in a predetermined position (for example, a position corresponding to Ae) in the standard number turn memory 3 by IO (n4)
, an initial value "80" is set in a predetermined position of the counter memory means 4 corresponding to this registered standard pattern (A) (n5). Such a series of operations is performed for all standard patterns, and as a result, the counter values for each standard memory of the counter memory means 4 are set to the initial value "80" as shown in FIG.

次に上記のようにしである値(例えばr80J)に設定
されたカウンタメモリ手段4の値が認識動作等に応じて
増減する動作について説明する。
Next, a description will be given of an operation in which the value of the counter memory means 4, which is set to a certain value (for example, r80J) as described above, increases or decreases in accordance with a recognition operation or the like.

(1)認識時のカウンタ値の増減認識時の処理フローが第5図に示されており、人力音声
「あかい」を認識する場合を例にして説明する。
(1) A processing flow when recognizing an increase/decrease in the counter value during recognition is shown in FIG. 5, and will be explained using an example in which the human voice "Akai" is recognized.

今装置を認識動作モードにして認識すべき音声、例えば
「/あ//か//い/」(赤い)を発声すると、この音
声がマイク1を介して入力され(n11、n12)、単
音節認識部2において入力音声が単音節ことに順次認識
され、「あ」を認識した結果として「あ8」、「は。」
、「あ。」。
Now, when you put the device in recognition operation mode and utter the voice to be recognized, for example "/a//ka//i/" (red), this voice is input through microphone 1 (n11, n12) and is monosyllable. The recognition unit 2 sequentially recognizes the input speech as monosyllables, and recognizes "a" as "a8" and "ha.".
,"a.".

「ばA」という順序で標準パターンに近かったことを示
す認識単音節候補が得られる。次に「か」が認識され、
同様に「い」が認識され、その結果第1表の如き各音節
の認識結果が得られる(n18′)。
Recognized monosyllable candidates indicating that the order of "BaA" is close to the standard pattern are obtained. Next, “ka” is recognized,
Similarly, "i" is recognized, and as a result, the recognition results for each syllable as shown in Table 1 are obtained (n18').

ここで、単語音声入力の終了であることをキー人力装置
7の[IE]キー7bで指示入力すると(n14)、C
PUl0の制御の下に第2表に示す如き音節ラティスが
作成される。
Here, when inputting an instruction to end the word voice input using the [IE] key 7b of the human-powered device 7 (n14), C
A syllable lattice as shown in Table 2 is created under the control of PU10.

次にこの音節ラティスから単語としての候補列が、その
確からしさの順で第3表の如く作成される。
Next, word candidate sequences are created from this syllable lattice in order of likelihood as shown in Table 3.

第3表その後、作成された一つ一つの候補列と単語辞書メモリ
5に記憶された単語情報との照合が行なわれ、一致した
第4表の如き候補列がCPUl0内の辞書照合結果バッ
ファに記憶され(n15)、照合結果の第1候補が表示
装置8に表示される。
Table 3 After that, each created candidate string is compared with the word information stored in the word dictionary memory 5, and the matched candidate strings as shown in Table 4 are stored in the dictionary matching result buffer in CPU10. It is stored (n15), and the first candidate of the matching result is displayed on the display device 8.

オペレータは表示を確認し、入力しようとしていた単語
であれは「確定」をキー人力装置7のキー人力装置7の
キー7bを操茫次の認識結果を表示装置8に表示させる
。また入力しようとした単語が候補になかった場合は「
修正」キー7dとかなキー7aにより修正した後に「確
定」キー7cを入力することになる(n17〜n 22
 )。
The operator checks the display and presses the key 7b of the human-powered device 7 to confirm the word he was trying to input.The operator then displays the recognition result on the display device 8. Also, if the word you tried to enter is not in the candidates, click
After making corrections using the "Modify" key 7d or the Kana key 7a, the "Confirm" key 7c is input (n17 to n22
).

この例の場合には入力通りに「あかい」が第1候補にな
っているため、すぐに「確定」キー7cを操作すること
になる(n17.n18)。この操作によりステップn
23.n24に移行し、まず第1音節(n=1 )の認
識結果を調べる。ステップn25において第1位の標準
パターンが正解であるか否かが判断され、今「あJに対
する認識結果は上記第1表に示すように第1位が「あ、
」の標準パターンであり、正解と判断されステップn2
6に移行してカウンタメモリ手段4の「あ8」の標準パ
ターンに対応した位置の内容が「+2」される。次にス
テップn281こ移行して第2位の標準パターンが正解
であるか否かが判断され、令弟1表に示すように「あ」
に対する第2位が「はD」であるため、ステップn30
に移行してカウンタメモリ手段4の「はD」の標準パタ
ーンに対応した位置の記憶内容が「−1」され、次にス
テップ1131に移行してn = 2にカウントアツプ
され、n32を通ってl】24に戻り、第2音節の認識
結果を調べる動作に移行し、以下同様の動作が繰返され
る。
In this example, since "Red" is the first candidate as input, the user immediately operates the "Confirm" key 7c (n17, n18). With this operation, step n
23. Moving on to n24, first, the recognition result of the first syllable (n=1) is examined. In step n25, it is determined whether the first standard pattern is correct or not, and the recognition result for "AJ" is as shown in Table 1 above.
” is the standard pattern, and it is judged to be correct and step n2
6, the contents of the counter memory means 4 at the position corresponding to the standard pattern "A8" are incremented by "+2". Next, in step n281, it is determined whether the second standard pattern is the correct answer, and as shown in Table 1, the answer is "A".
Since the second place for is "D", step n30
Then, the stored contents of the counter memory means 4 at the position corresponding to the standard pattern of "D" are incremented by "-1", and then the process goes to step 1131, where the count is increased to n=2, and the count is increased through n32. 1) Returning to step 24, the process shifts to checking the recognition result of the second syllable, and the same process is repeated thereafter.

令弟2番目の音節「か」に対する認識結果は第1位が1
か。」であるため正解と判断されてカウンタメモリ手段
4の1かC」に対する値が1+2」され、第2位は「あ
。」であるので不正解と判断されてカウンタメモリ手段
4の「あい」に対する値が「−1」される。また第3番
目の音節「い」に対する認識結果は第1位がしひ。」で
あるため不正解と判断されて、カウンタメモリ手段4の
しひ。」に対する値が「−2」され、第2位が「い8」
であるため正解と判断されて、カウンタメモリ手段4の
「い8」に対する値が「+1」される。
The recognition result for the second syllable "ka" is 1.
mosquito. '', the answer is determined to be correct, and the value for ``1 or C'' in the counter memory means 4 is increased to 1+2'', and the second place is ``A'', so it is determined to be an incorrect answer, and the value for ``1 or C'' in the counter memory means 4 is changed to ``A''. The value for is set to "-1". Also, the recognition result for the third syllable ``i'' ranked first. ”, it is determined that the answer is incorrect, and the counter memory means 4 is closed. ” value is “-2” and the second place is “i8”
Therefore, it is determined that the answer is correct, and the value for "i8" in the counter memory means 4 is incremented by "+1".

以上のような動作により、標準パターンのカウントメモ
リ手段4の内容は第6図のように変化する。
Through the above operations, the contents of the standard pattern count memory means 4 change as shown in FIG.

(11)テストモードにおけるカウンタ値の増減テスト
モードの処理フローが第7図に示されており、音声認識
装置において、テストモードの動作がスタートすると(
ステップn4+)、標桑パターンテスト用単語メモリ6
に記憶された単語(発声すべき単語)が順次読み出され
て表示装置8に表示されることになる(n42)。
(11) Increase/Decrease of Counter Value in Test Mode The processing flow of the test mode is shown in FIG.
Step n4+), word memory for marker mulberry pattern test 6
The words (words to be uttered) stored in are sequentially read out and displayed on the display device 8 (n42).

今「あかい」という発声の指示が表示装置8上に成され
た場合(n42)、オペレータはその表示装置8に表示
された単語を発声して音声を入力する( n 43 )
。この入力音声「/あ//か7//い/」は単音節認識
部2において単音節ことに順次認識され、上記した認識
モードの時と同様に各音節ごとに認識結果が例えば上記
した第1表に示すように得られる。
If the instruction to say "Akai" is now given on the display device 8 (n42), the operator speaks the word displayed on the display device 8 and inputs the voice (n43).
. This input voice "/a//ka7//i/" is sequentially recognized as monosyllables in the monosyllable recognition unit 2, and the recognition result for each syllable is changed to the above-mentioned The results are obtained as shown in Table 1.

テストモードの時には、発声された単語が確定している
ため、以降は認識モードにおける「確定」キーの操作以
後(n23)の処理と同じ動作(ステップ14.6〜n
57)が行なわれる。
In the test mode, since the uttered word has been confirmed, the following operations are the same as those after the operation of the "Confirm" key in the recognition mode (n23) (steps 14.6 to n23).
57) is performed.

またこれらの一連の動作は標準パターンテスト用単語メ
モリ6から順次単語を読み出しては表示して、同様の処
理が実行される。
Further, in this series of operations, words are sequentially read out from the standard pattern test word memory 6 and displayed, and similar processing is executed.

なお標準パターンテスト用単語メモリ6には各音節が均
等に出現するように単語を選定して入れてお(ことによ
り、全ての標準パターンについてテストを行なうことが
出来る。
Note that words are selected and stored in the standard pattern test word memory 6 so that each syllable appears evenly (this makes it possible to perform tests on all standard patterns.

(iii )  標桑パターン間の認識処理におけるカ
ウンタ値の増減標準パターン間の認識の処理フローが第8図に示されて
おり、音声認識装置において標準パターン間の認識処理
の動作がスタートすると(ステップn61)、CPU 
I Oは標準パターンメモリ3に記憶された標準パター
ンの一つを選び出しC1単音節認識部2に入カバターン
として与える(n62)。この入カバターンに対して、
単音節認識部2においてメモリ3に記憶されている各標
準パターンとのマツチングを行ない、その認識結果をC
PUl0に与える(n63)。
(iii) The processing flow of increasing/decreasing the counter value in the recognition process between the standard patterns is shown in FIG. n61), CPU
The IO selects one of the standard patterns stored in the standard pattern memory 3 and supplies it to the C1 monosyllable recognition unit 2 as an introductory pattern (n62). For this input cover turn,
The monosyllable recognition unit 2 performs matching with each standard pattern stored in the memory 3, and uses the recognition results as C.
Give to PU10 (n63).

CPU ] Oは与えられた1位の認識結果が入カバタ
ーンと一致しているか否かを判断して(n64)、一致
していない場合には、何らかのハードエラーが生じたも
のと判断して、そのエラー表示を表示装置8にて行ない
、以後の動作を中止する(n65゜n66)。
CPU] O determines whether the given first recognition result matches the input cover pattern (n64), and if they do not match, it is determined that some kind of hard error has occurred, and The error is displayed on the display device 8, and subsequent operations are canceled (n65, n66).

また1位の認識結果と入カバターンが一致している場合
にはステップn67に移行して2位〜6位の認識結果を
チェックすることになる。
If the recognition result of the first place and the input cover pattern match, the process moves to step n67 and the recognition results of the second to sixth places are checked.

今、例えば第5表に示すように「あA」を入力パターン
として認識処理を行った結果、1位が「あAJであり、
2位以下6位までがそれぞれ「あ。J、rはAJ、rあ
EJ、rか8」、「あ、」であった場合、入カバターン
と同−力チコリ−のものが「あC」、「あE」、「あ。
Now, for example, as shown in Table 5, as a result of recognition processing using "A A" as an input pattern, the first place is "A AJ,
If the 2nd place and the 6th place are "A. , “A E”, “A.

」の3個であると判断され(n68)、入カバターンの
評価値きして「3」を24音したr6Jが算出され(n
69J、この値が[あAJの標準パターンに対応したカ
ウンタメモリ位置の値に加算され(n7+)、次にステ
ップn72をJfllつてn73に移行して次の標準パ
ターンが選択されてステップn62に戻り同様の動作が
行なわれる。
'' (n68), and r6J, which is 24 sounds of ``3'', is calculated based on the evaluation value of the input pattern (n68).
69J, this value is added to the value in the counter memory location corresponding to the standard pattern of AJ (n7+), then step n72 is passed to Jflll, the process moves to n73, the next standard pattern is selected, and the process returns to step n62. A similar operation is performed.

第5表上記第5表に示すように「あり」を入力パターンとした
場合には、2位〜6位の間に同一カテゴリーのものか−
っしかないため、評価値は2となる。また「はA」の場
合には、2位〜6位の間に同一カテゴリーのものがない
ため、評価点はrOJとなるが、非常に同−力チコリ−
のものから遠いことを強調する意味でステップn68か
らn70に移行して「−4」の評価点が与えられる。
Table 5 As shown in Table 5 above, when the input pattern is "Yes", whether the items in the same category are between 2nd and 6th place -
Since there are only 1, the evaluation value is 2. In addition, in the case of "A", there are no items in the same category between 2nd and 6th place, so the evaluation score is rOJ, but it is very similar to Chicory.
In order to emphasize that it is far from the original, the process moves from step n68 to step n70, and an evaluation point of "-4" is given.

このような動作を全標準パターンに関して行うことによ
り、各標準パターンの良否がカウンタメモリ手段4に記
憶された値により、定量的に知ることが可能となる。
By performing such an operation for all standard patterns, it becomes possible to quantitatively know whether each standard pattern is good or bad based on the value stored in the counter memory means 4.

なお、上記の説明において用いた評価値は、−例に過き
す、認識結果の順位による重み付け、6位以下の結果も
用いる等の種々の変形が可能である。
Note that the evaluation values used in the above description can be modified in various ways, such as by using a pass mark, weighting based on the ranking of recognition results, and also using results of 6th place or lower.

上記のようにして増減されたカウンタメモリ手段4の値
を用いて特徴標準パターンの更新を制御する方法につい
て説明する。
A method of controlling the update of the feature standard pattern using the value of the counter memory means 4 which has been increased or decreased as described above will be explained.

初期の音声標準パターンの登録時にはカウンタメモリ手
段4の各記憶位置には「80」がセントされ、その後の
認識処理動作によってカウンタメモリ手段4の内容が変
化し、例えば第9図に示すように変化したものとする。
At the time of initial registration of the voice standard pattern, "80" is placed in each storage location of the counter memory means 4, and the contents of the counter memory means 4 change depending on the subsequent recognition processing operation, for example, as shown in FIG. It shall be assumed that

このような状態において、不良の音声標準パターンを入
れ換える更新登録モードにおいて、上記のカウンタメモ
リ手段4の記憶内容が参照されることになる。
In such a state, the contents stored in the counter memory means 4 are referred to in the update registration mode for replacing the defective standard voice pattern.

第10図に更新登録動作のフローが示されており、音声
認識装置において、更新登録モードの動作がスタートす
ると(n8])、CPUl0は最初に、発声すべき単音
節を表示装置8に表示する(n82)。今「あ」が表示
されたとすると、オペレータはその表示された単音節を
発声して音声入力しくn83)、この音声入力された単
音節(「あ」)が単音節認識部2により分析されて入カ
バターンが作成され、その作成された入カフ N6クー
ンが「あ」のカテゴリー内で最もカウンタ値の小さい標
準パターン(第9図に示した例では標準パターン[あり
J)の位置に入れられ(n84)、そのカウンタの値が
「80」にセットし画される(n85)。
The flow of the update registration operation is shown in FIG. 10. When the operation in the update registration mode starts in the speech recognition device (n8]), the CPU 10 first displays the monosyllable to be uttered on the display device 8. (n82). If "a" is displayed now, the operator should utter the displayed monosyllable and input it by voice (n83), and the monosyllable input by voice ("a") will be analyzed by the monosyllable recognition unit 2. The input cuff turn is created, and the created input cuff N6 Kuhn is placed in the position of the standard pattern with the smallest counter value in the "A" category (in the example shown in Figure 9, the standard pattern [with J]). n84), and the value of the counter is set to "80" (n85).

□ 続いて「い」が表示され、音声入力した「い」の分
析結果である入カバターンが「いA」の位置に入れられ
、その標準パターン[い□〕に対応したカウンタメモリ
手段4の位置が「80」にセットされる。
□ Subsequently, "I" is displayed, and the input pattern that is the analysis result of the voice input "I" is placed in the position of "I A", and the position of the counter memory means 4 corresponding to that standard pattern [I□] is is set to "80".

以上のような動作を繰返して各音節毎に標準/ s6タ
ーンを最も悪いものから入れ換えられる。
By repeating the above steps, you can replace the standard/s6 turns for each syllable, starting with the worst one.

以上のようにして悪い標準パターンの更新が行なわれる
が、カウンタメモリ手段4の値がある程度以下になった
時に、その標準パターンが非常に悪いことをオペレータ
に知らせ、そのパターンの更新を行なわせるようにして
もよい。
The bad standard pattern is updated as described above, but when the value of the counter memory means 4 falls below a certain level, the operator is informed that the standard pattern is very bad and the operator is prompted to update the pattern. You can also do this.

また、標準パターンチェックモードを設け、カウンタメ
モリ手段4の値がある程度以下の標準パターンあるいは
標準パターンに対する単音節を表示に出し、それらのみ
の標準パターンを更新するように成してもよい。
Further, a standard pattern check mode may be provided, and standard patterns whose values in the counter memory means 4 are below a certain level or monosyllables corresponding to the standard patterns may be displayed, and only those standard patterns may be updated.

なお上記の例では単語単位に発声された音声を単音節単
位で処理を行う場合を示したが、本発明はこれに限定さ
れるものではなく、例えば文節単位に発声された音声で
あってもよい。
Note that although the above example shows a case where speech uttered word by word is processed in monosyllable units, the present invention is not limited to this, and for example, even if speech uttered word by phrase is processed. good.

またカウンタメモリ手段4の初期設定値を「8o」とし
たが、この値に限定されるものではない。
Further, although the initial setting value of the counter memory means 4 is set to "8o", it is not limited to this value.

更に、第1図に示した構成例においてメモリ3及び4を
ノ!ツタアップしていない場合等においては、上記した
カウンタ値の増減あるいは標準パターンの登録・更新を
行なった場合には、標準パターンメモリとカウンタメモ
リ手段の内容をフロッピー・ディスク9に落としてから
電源の断あるいはオペレータの交替を行ない、再使用の
時にはフロンピーディスク9からその退避した内容を標
準パターンメモリ及びカウンタメモリ手段にロードする
必要があることは言うまでもない。
Furthermore, in the configuration example shown in FIG. 1, the memories 3 and 4 are no. If the counter value is not up or down, or the standard pattern is registered or updated as described above, dump the contents of the standard pattern memory and counter memory means to the floppy disk 9, and then turn off the power. Alternatively, it goes without saying that it is necessary to replace the operator and load the saved contents from the floppy disk 9 into the standard pattern memory and counter memory means when reusing the system.

〈効果〉以上述べたように本発明によれば、認識すべき音声の特
徴パターンと、予め登録された複数種類の、音声の特徴
標準パターンとの類似度計算を行なって、認識判定を行
なう認識装置において、複数種類の特徴標準パターン毎
にカウンタ手段を備え、このカウンタ手段の値によって
予め登録されている特徴標準パターンの良否を定量的に
知ることが可能となり、この特徴標準パターンの良否に
応じて選択して登録パターン・を入れ換えることが出来
、結果として認識率を高めることが可能となる。
<Effects> As described above, according to the present invention, recognition is performed by calculating the similarity between the speech feature pattern to be recognized and a plurality of pre-registered speech feature standard patterns. The device is equipped with a counter means for each of the plurality of types of feature standard patterns, and the value of this counter means makes it possible to quantitatively know the quality of the feature standard pattern registered in advance. It is possible to select and replace the registered patterns, and as a result, it is possible to increase the recognition rate.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図は本発明の一実施例装置の構成を示すブロック図
、第2図はキー人力装置の一例を示す斗・面図、第3図
はカウンタメモリ手段の初期記憶内容を示す図、第4図
は初期登録動作を示すフロー図、第5図は認識時の処理
動作を示すフロー図、第6図はカウンタメモリ手段のカ
ウンタ値の増減例を示す図、第7図はテストモードの処
理動作を示すフロー図、第8図は標準パターン間の認識
の処理フローを示す図、第9図はカウンタメモリ手段の
カウンタ値の一例を示す図、第10図は更新登録の処理
動作を示すフロー図である。2・・単音節認識部、3・・・標準パターンメモリ、4
・・・カウンタメモリ手段、ro−・・コントローラ(
CPU)。代理人 弁理士 福 丁 愛 彦(他2名)第9図第10図
FIG. 1 is a block diagram showing the configuration of a device according to an embodiment of the present invention, FIG. 2 is a top-down view showing an example of a key-powered device, FIG. 3 is a diagram showing the initial storage contents of the counter memory means, and FIG. Figure 4 is a flowchart showing the initial registration operation, Figure 5 is a flowchart showing the processing operation during recognition, Figure 6 is a diagram showing examples of increases and decreases in the counter value of the counter memory means, and Figure 7 is the process in test mode. Flowchart showing the operation, FIG. 8 is a flowchart showing the processing flow of recognition between standard patterns, FIG. 9 is a diagram showing an example of the counter value of the counter memory means, and FIG. 10 is the flowchart showing the processing operation of update registration. It is a diagram. 2... Monosyllable recognition unit, 3... Standard pattern memory, 4
... Counter memory means, ro-... Controller (
CPU). Agent: Patent attorney Aihiko Fuku (2 others) Figure 9 Figure 10

Claims (1)

Translated fromJapanese
【特許請求の範囲】1、認識すべき音声の特徴パターンと、予め登録された
複数種類の音声の特徴標準パターンとの類似度計算を行
なって、認識判定を行なう認識装置において、上記複数種類の特徴標準パターン毎にカウンタ手段を備
えたことを特徴とする音声認識装置。2 前記カウンタ手段は認識すべき音声の認識判定結果
に応じてそのカウンタ値を増減する手段を含む特許請求
の範囲第1項記載の音声認識装置。3、 前記カウンタ手段は該カウンタ値に応じて特徴標
準パターンの更新を制御する手段を含む特許請求の範囲
第1項記載の音声認識装置。
[Claims] 1. A recognition device that performs a recognition determination by calculating the similarity between a feature pattern of a voice to be recognized and a standard pattern of features of a plurality of types of voices registered in advance, comprising: A speech recognition device characterized by comprising a counter means for each feature standard pattern. 2. The speech recognition device according to claim 1, wherein the counter means includes means for increasing or decreasing the counter value according to the recognition determination result of the speech to be recognized. 3. The speech recognition device according to claim 1, wherein the counter means includes means for controlling updating of the feature standard pattern according to the counter value.
JP57217296A1982-12-101982-12-10Voice recognition equipmentGrantedJPS59107397A (en)

Priority Applications (1)

Application NumberPriority DateFiling DateTitle
JP57217296AJPS59107397A (en)1982-12-101982-12-10Voice recognition equipment

Applications Claiming Priority (1)

Application NumberPriority DateFiling DateTitle
JP57217296AJPS59107397A (en)1982-12-101982-12-10Voice recognition equipment

Publications (2)

Publication NumberPublication Date
JPS59107397Atrue JPS59107397A (en)1984-06-21
JPH0555880B2 JPH0555880B2 (en)1993-08-18

Family

ID=16701909

Family Applications (1)

Application NumberTitlePriority DateFiling Date
JP57217296AGrantedJPS59107397A (en)1982-12-101982-12-10Voice recognition equipment

Country Status (1)

CountryLink
JP (1)JPS59107397A (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication numberPriority datePublication dateAssigneeTitle
JPS6063900U (en)*1983-10-051985-05-04カシオ計算機株式会社 voice recognition device
US6983248B1 (en)1999-09-102006-01-03International Business Machines CorporationMethods and apparatus for recognized word registration in accordance with speech recognition
JP2008063601A (en)*2006-09-052008-03-21Nippon Steel Corp Molten salt piping and heat treatment method

Citations (3)

* Cited by examiner, † Cited by third party
Publication numberPriority datePublication dateAssigneeTitle
JPS5379345A (en)*1976-12-241978-07-13Hitachi LtdSpeaker identification system
JPS5766498A (en)*1980-10-141982-04-22Fujitsu LtdReference voice registration pattern automatic deleting system
JPS57105798A (en)*1980-12-231982-07-01Sanyo Electric CoDevice for identifying sound

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication numberPriority datePublication dateAssigneeTitle
JPS5379345A (en)*1976-12-241978-07-13Hitachi LtdSpeaker identification system
JPS5766498A (en)*1980-10-141982-04-22Fujitsu LtdReference voice registration pattern automatic deleting system
JPS57105798A (en)*1980-12-231982-07-01Sanyo Electric CoDevice for identifying sound

Cited By (3)

* Cited by examiner, † Cited by third party
Publication numberPriority datePublication dateAssigneeTitle
JPS6063900U (en)*1983-10-051985-05-04カシオ計算機株式会社 voice recognition device
US6983248B1 (en)1999-09-102006-01-03International Business Machines CorporationMethods and apparatus for recognized word registration in accordance with speech recognition
JP2008063601A (en)*2006-09-052008-03-21Nippon Steel Corp Molten salt piping and heat treatment method

Also Published As

Publication numberPublication date
JPH0555880B2 (en)1993-08-18

Similar Documents

PublicationPublication DateTitle
JP5093963B2 (en) Speech recognition method with replacement command
JP4574390B2 (en) Speech recognition method
JPS62235998A (en) Syllable identification method
KR20010096490A (en)Spelling speech recognition apparatus and method for mobile communication
JPH0423799B2 (en)
JPH0159600B2 (en)
CN118098290A (en)Reading evaluation method, device, equipment, storage medium and computer program product
JPS59107397A (en)Voice recognition equipment
JP6527000B2 (en) Pronunciation error detection device, method and program
JP2002215184A (en) Voice recognition device and program
JPS60172100A (en)Voice recognition equipment
JP4736423B2 (en) Speech recognition apparatus and speech recognition method
JP3090204B2 (en) Speech model learning device and speech recognition device
KR100404852B1 (en)Speech recognition apparatus having language model adaptive function and method for controlling the same
JP2002082688A (en) Speaker adaptation apparatus, speaker adaptation method, computer-readable recording medium recording speaker adaptation program, speech recognition device, speech recognition method, and computer-readable recording medium recording speech recognition program
JPH0619491A (en)Speech recognizing device
JP3254933B2 (en) Voice recognition method
JPH11352988A (en)Voice recognition device
JPH103296A (en)Word preliminary selecting device in voice recognition system
JPH05197397A (en) Speech recognition method and apparatus thereof
JPH06289899A (en)Speech recognition device
JPS6073592A (en) Speech recognition device for specific speakers
JP2000010588A (en) Voice recognition method and apparatus
JPH10319987A (en)Recurrence of erroneous recognition preventing device in voice recognition system
JP2001092492A (en) Voice recognition device

[8]ページ先頭

©2009-2025 Movatter.jp