【0001】[0001]
【発明の属する技術分野】本発明は、連続音声文章入力
装置及び連続音声文章入力方法に関し、特に、音声コマ
ンド用認識対象語彙の管理方法の改良に関する。BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a continuous speech text input device and a continuous speech text input method, and more particularly to an improvement in a method of managing a recognition target vocabulary for voice commands.
【0002】[0002]
【従来の技術】近年、コンピュータその他の機器の操作
を音声で行う連続音声文章入力装置が研究されている。
これらの連続音声文章入力装置においては、装置の操作
性を向上させるために、キーボードでコマンドを入力し
たり、あるいは、マウスでコマンドを選択する代わり
に、音声でコマンドを入力する。例えば、『ここを削
除』と音声でコマンドを入力すると、直前に入力した音
声認識結果が削除されるようになっている。2. Description of the Related Art In recent years, continuous speech text input devices for operating computers and other devices by voice have been studied.
In these continuous voice text input devices, in order to improve the operability of the device, commands are input by voice instead of inputting commands with a keyboard or selecting commands with a mouse. For example, when a voice command "Delete here" is input, the immediately preceding voice recognition result is deleted.
【0003】従来の連続音声文章入力装置の一例を図1
0に示す。図10に示した従来の連続音声文章入力装置
100は、ユーザーが音声入力を行う音声入力部101
と、入力された音声に対して認識処理を行う音声認識部
102と、認識処理の際に使用する連続音声文章入力用
の認識処理用パターンを記憶した連続音声文章入力用辞
書103と、音声コマンド用の認識処理用パターンを記
憶した音声コマンド用辞書104と、認識結果に基づい
て、入力された音声が連続音声文章入力用の音声か、あ
るいは、音声コマンド用の音声であるかを判断する認識
結果管理部105と、入力された音声が連続文章入力用
の音声であった場合に、認識結果を表示する認識結果表
示部106と、認識結果が音声コマンドであった場合
に、予め定義された各音声コマンドに対応するコマンド
を実行する音声コマンド実行部107と、から構成され
る。FIG. 1 shows an example of a conventional continuous speech text input device.
0 is shown. A conventional continuous speech sentence input device 100 shown in FIG.
A speech recognition unit 102 for performing recognition processing on input speech, a continuous speech text input dictionary 103 storing recognition processing patterns for continuous speech text input used in the recognition processing, and a voice command Command dictionary 104 that stores a recognition processing pattern for voice recognition, and recognition that determines whether the input voice is a voice for continuous voice sentence input or a voice for voice command based on the recognition result. A result management unit 105, a recognition result display unit 106 that displays a recognition result when the input voice is a voice for continuous sentence input, and a predefined result when the recognition result is a voice command. And a voice command execution unit 107 for executing a command corresponding to each voice command.
【0004】[0004]
【発明が解決しようとする課題】しかしながら、上述の
従来の連続音声文章入力装置100には次のような問題
があった。However, the conventional continuous speech sentence input device 100 has the following problems.
【0005】第1の問題点は、入力された文章を認識す
る認識性能が劣化するという点である。The first problem is that the recognition performance for recognizing an input sentence is deteriorated.
【0006】その理由は、文章入力のために発声された
音声が音響的に類似する音声コマンドと誤認識される可
能性があるためである。The reason is that there is a possibility that a voice uttered for text input may be erroneously recognized as an acoustically similar voice command.
【0007】第2の問題点は、あらかじめ用意されてい
る音声コマンドと同一の文字列を入力しにくいという点
である。[0007] The second problem is that it is difficult to input the same character string as a voice command prepared in advance.
【0008】その理由は、連続音声文章入力装置に音声
コマンドと同一の文字列を音声入力したときに、連続音
声文章入力装置は、文章入力のために発声されたもので
あるのか、あるいは、コマンド入力のために発声された
ものであるのかの区別を付けることができないためであ
る。The reason is that when the same character string as the voice command is input to the continuous voice text input device by voice, the continuous voice text input device is uttered for text input, This is because it cannot be distinguished whether the voice is uttered for input.
【0009】例えば、『ここを削除』という音声コマン
ドが用意されている場合において、『ここを削除』とい
う一節を含む文章を連続音声で入力すると、連続音声文
章入力装置はその『ここを削除』という音声が文章の一
部であるのか、あるいは、音声コマンドであるのか区別
することができない。For example, when a voice command "Delete here" is prepared and a sentence including a passage "Delete here" is input in continuous voice, the continuous voice text input device uses the "Delete here" command. It cannot be distinguished whether the voice is a part of a sentence or a voice command.
【0010】図10に示した連続音声文章入力装置にも
多くの連続音声文章入力装置がこれまでに提案されてい
る。Many continuous speech text input devices have been proposed as the continuous speech text input device shown in FIG.
【0011】例えば、特開平7−219584号公報
は、音声により入力されたコマンドに対応する処理を行
う連続音声文章入力装置であって、音声の誤認識による
誤処理を防止する連続音声文章入力装置を提案してい
る。For example, Japanese Unexamined Patent Publication No. 7-219584 discloses a continuous speech text input device for performing a process corresponding to a command input by voice, which prevents erroneous processing due to erroneous recognition of voice. Has been proposed.
【0012】この連続音声文章入力装置においては、再
確認が必要な音声コマンドを予め定めておき、その音声
コマンドが入力された場合には、認識結果の再確認を行
うものである。In this continuous speech sentence input device, a voice command requiring reconfirmation is determined in advance, and when the voice command is input, the recognition result is reconfirmed.
【0013】しかしながら、この連続音声文章入力装置
によれば、再確認を必要とする音声コマンドを予め定め
ておく必要があるが、再確認を必要とするか否かの判断
基準を適正に定めることは極めて困難であるという問題
点がある。However, according to this continuous speech text input device, it is necessary to determine in advance the voice command that requires reconfirmation. However, it is necessary to appropriately determine the criteria for determining whether reconfirmation is required. Is extremely difficult.
【0014】また、特開平10−282987号公報
は、複数の辞書を用意し、その中から一つの辞書を選択
して、その辞書を用いて音声認識を行う音声認識システ
ムを提案している。Japanese Patent Application Laid-Open No. 10-282987 proposes a speech recognition system in which a plurality of dictionaries are prepared, one of the dictionaries is selected, and speech recognition is performed using the dictionaries.
【0015】しかしながら、この音声認識システムによ
れば、複数の辞書を作成しなければならず、そのための
メモリを多数用意する必要があり、システム全体の機構
の単純化を図ることができないという問題点を内包して
いる。However, according to this speech recognition system, a plurality of dictionaries must be created, a large number of memories must be prepared, and the mechanism of the entire system cannot be simplified. Is included.
【0016】本発明は、以上のような従来の連続音声文
章入力装置における問題点に鑑みてなされたものであ
り、入力された文章を認識する認識性能の劣化を防止
し、かつ、予め用意されている音声コマンドと同一の文
字列が入力しやすく、さらに、装置全体の機構の単純化
を図ることができる連続音声文章入力装置及び連続音声
文章入力方法を提供することを目的とする。SUMMARY OF THE INVENTION The present invention has been made in view of the above-described problems in the conventional continuous speech text input device, and prevents the deterioration of the recognition performance for recognizing the input text and prepares the data in advance. It is an object of the present invention to provide a continuous-speech text input device and a continuous-speech text input method capable of easily inputting the same character string as a given voice command and further simplifying the mechanism of the entire device.
【0017】[0017]
【課題を解決するための手段】この目的を達成するた
め、本発明は、請求項1に記載されているように、文章
を連続的に音声入力し、かつ、制御用音声コマンドを音
声入力するための音声入力手段と、音声入力手段に入力
された音声を認識する音声認識手段と、音声コマンドの
認識用辞書を記憶する音声コマンド辞書記憶手段と、音
声認識手段における認識結果に基づいて、入力された音
声が連続文章入力用の音声か、あるいは、音声コマンド
用の音声であるかを判断し、入力された音声が音声コマ
ンド用の音声であった場合には、各音声コマンドに対応
する制御動作を実行させる認識結果管理手段と、入力さ
れた音声が音声コマンド用の音声であった場合の音声コ
マンドの履歴を記憶する音声コマンド履歴管理手段と、
音声コマンド履歴管理手段の記憶内容に基づいて、各音
声コマンドを音声コマンド辞書記憶手段から削除すべき
か否かを判断し、必要ある場合には、その音声コマンド
を削除する音声コマンド辞書管理手段と、を備える連続
音声文章入力装置を提供する。In order to achieve the above object, according to the present invention, a sentence is continuously input by voice and a control voice command is input by voice. Voice input means for recognizing voice input to the voice input means, voice command dictionary storage means for storing a voice command recognition dictionary, and input based on the recognition result in the voice recognition means. It is determined whether the input voice is a voice for continuous sentence input or a voice for voice command. If the input voice is a voice for voice command, the control corresponding to each voice command is performed. A recognition result management unit for executing an operation, a voice command history management unit for storing a history of voice commands when the input voice is voice for voice commands,
Voice command dictionary management means for determining whether each voice command should be deleted from the voice command dictionary storage means based on the storage content of the voice command history management means, and deleting the voice command if necessary, A continuous speech sentence input device provided with:
【0018】請求項1に係る連続音声文章入力装置にお
いては、音声コマンド履歴管理手段は、各音声コマンド
が音声認識手段によって認識結果として出力された回数
を記憶する。また、音声コマンド辞書管理手段は、音声
コマンド履歴管理手段に記憶された各音声コマンドの使
用頻度に従って、使用頻度が低い音声コマンドを認識対
象から除外する。In the continuous speech sentence input device according to the first aspect, the voice command history management means stores the number of times each voice command has been output as a recognition result by the voice recognition means. Further, the voice command dictionary management unit excludes voice commands having a low usage frequency from recognition targets according to the usage frequency of each voice command stored in the voice command history management unit.
【0019】これによって、音声コマンド用辞書に含ま
れる音声コマンドをユーザーが良く使用するもののみに
絞り込むことが可能となる。従って、文章入力のための
入力音声が誤って音声コマンドに誤認識される可能性が
減り、入力された音声の認識性能を改善することができ
る。また、あらかじめ用意されている音声コマンドと同
一の文字列が入力しにくいというケースが発生する可能
性が削減されるという効果を得ることができる。This makes it possible to narrow down the voice commands included in the voice command dictionary to only those frequently used by the user. Therefore, the possibility that the input voice for the text input is erroneously recognized as the voice command is reduced, and the recognition performance of the input voice can be improved. Further, it is possible to obtain an effect that the possibility that a case where it is difficult to input the same character string as a voice command prepared in advance is less likely to occur is reduced.
【0020】請求項2は、文章を連続的に音声入力し、
かつ、制御用音声コマンドを音声入力するための音声入
力手段と、音声コマンドの認識用辞書と、その音声コマ
ンドを認識しやすくするかどうかの音声コマンド毎の優
先度と、を記憶する音声コマンド辞書記憶手段と、音声
入力手段に入力された音声を認識し、かつ、音声コマン
ドを認識処理する場合には優先度に従って認識処理を行
う音声認識手段と、音声認識手段の認識結果に基づい
て、入力された音声が連続文章入力用の音声か、あるい
は、音声コマンド用の音声であるかを判断し、入力され
た音声が音声コマンド用の音声であった場合には、各音
声コマンドに対応する制御動作を実行させる認識結果管
理手段と、入力された音声が音声コマンド用の音声であ
った場合の音声コマンドの履歴を記憶する音声コマンド
履歴管理手段と、音声コマンド履歴管理手段の記憶内容
に基づいて、各音声コマンドの優先度を下げるか否かを
判断し、その判断結果を音声コマンド辞書記憶手段に送
る音声コマンド辞書管理手段と、を備える連続音声文章
入力装置を提供する。According to a second aspect of the present invention, a sentence is continuously input by voice,
A voice input means for voice inputting a control voice command; a voice command recognition dictionary; and a voice command dictionary for storing a priority for each voice command as to whether the voice command can be easily recognized. A storage unit, a voice recognition unit that recognizes voice input to the voice input unit, and performs a recognition process in accordance with a priority when performing a voice command recognition process, based on a recognition result of the voice recognition unit; It is determined whether the input voice is a voice for continuous sentence input or a voice for voice command. If the input voice is a voice for voice command, the control corresponding to each voice command is performed. A recognition result managing means for executing the operation; a voice command history managing means for storing a history of voice commands when the input voice is voice voice voice; Voice command dictionary management means for determining whether to lower the priority of each voice command based on the storage contents of the command history management means and sending the determination result to the voice command dictionary storage means Provide equipment.
【0021】本請求項に係る連続音声文章入力装置にお
いては、音声コマンド辞書管理手段が、音声コマンド履
歴管理手段の記憶内容に基づいて、各音声コマンドの優
先度を下げるか否かを判断する。音声コマンド辞書管理
手段によってある音声コマンドの優先度が下げられる
と、音声認識手段がその音声コマンドを認識しにくくな
る。従って、文章入力のための入力音声が誤って音声コ
マンドに誤認識される可能性が減り、入力された音声の
認識性能を改善することができる。また、あらかじめ用
意されている音声コマンドと同一の文字列が入力しにく
いというケースが発生する可能性が削減されるという効
果を得ることができる。In the continuous voice sentence input device according to the present invention, the voice command dictionary management means determines whether to lower the priority of each voice command based on the storage contents of the voice command history management means. When the priority of a certain voice command is lowered by the voice command dictionary management unit, it becomes difficult for the voice recognition unit to recognize the voice command. Therefore, the possibility that the input voice for the text input is erroneously recognized as the voice command is reduced, and the recognition performance of the input voice can be improved. Further, it is possible to obtain an effect that the possibility that a case where it is difficult to input the same character string as a voice command prepared in advance is less likely to occur is reduced.
【0022】音声コマンド履歴管理手段は、例えば、請
求項3に記載されているように、音声コマンドの使用頻
度を計算する音声コマンド使用頻度計算手段を備えるこ
とが好ましい。Preferably, the voice command history management means includes voice command usage frequency calculation means for calculating the usage frequency of voice commands, for example.
【0023】また、音声コマンド履歴管理手段は、例え
ば、請求項4に記載されているように、各音声コマンド
毎に削除するか否かの判定基準となる最低使用頻度を記
憶しておく音声コマンド最低使用頻度記憶手段を備える
ことが好ましい。The voice command history management means may store, for example, a voice command that stores a minimum frequency of use as a criterion for determining whether or not to delete each voice command. It is preferable to provide a minimum use frequency storage unit.
【0024】これによって、各音声コマンド毎に削除す
るか否かの判定基準を変えることができ、音声コマンド
の使用状況に応じた管理を行うことができる。Thus, the criterion for determining whether or not to delete each voice command can be changed, and management according to the usage status of the voice command can be performed.
【0025】また、請求項5に記載されているように、
本連続音声文章入力装置は、音声コマンド辞書管理手段
が音声コマンド辞書記憶手段から削除した音声コマンド
を記憶しておく削除コマンド記憶手段と、削除コマンド
記憶手段の記憶内容を表示する削除コマンド表示手段
と、をさらに備えることが好ましい。Also, as described in claim 5,
The continuous voice sentence input device includes: a deletion command storage means for storing voice commands deleted from the voice command dictionary storage means by the voice command dictionary management means; a deletion command display means for displaying storage contents of the deletion command storage means. Is preferably further provided.
【0026】これによって、ユーザーは既に削除した音
声コマンドを容易に知ることができ、現在、認識対象と
されている音声コマンドを容易に把握することができ
る。Thus, the user can easily know the voice command that has already been deleted, and can easily recognize the voice command that is currently recognized.
【0027】また、この場合、請求項6に記載されてい
るように、削除コマンド記憶手段に記憶されている音声
コマンドを再登録する削除コマンド再登録手段をさらに
設けることが好ましい。In this case, it is preferable that a delete command re-registering means for re-registering the voice command stored in the delete command storing means be further provided.
【0028】一旦は削除した音声コマンドであっても、
後に、その音声コマンドを再び認識対象とする必要が生
じる場合もある。このため、削除コマンド記憶手段に記
憶されている音声コマンドを再登録することができるよ
うにすることによって、音声コマンドを新たに登録する
場合と比較して、より容易に所望の音声コマンドを認識
対象に組み入れることができる。Even if the voice command is once deleted,
Later, the voice command may need to be recognized again. For this reason, by enabling the voice command stored in the deletion command storage means to be re-registered, the desired voice command can be more easily recognized as compared with the case of newly registering the voice command. Can be incorporated into
【0029】音声コマンド履歴管理手段は、請求項7に
記載されているように、ユーザー毎の音声コマンド使用
履歴を記憶するユーザー別音声コマンド履歴管理手段を
備えることが好ましい。It is preferable that the voice command history management means includes a user-specific voice command history management means for storing a voice command usage history for each user.
【0030】このように、音声コマンド履歴管理手段が
ユーザー毎に音声コマンド使用履歴を記憶することによ
り、認識対象から削除する音声コマンドをユーザー毎に
変えることができる。As described above, since the voice command history management means stores the voice command use history for each user, the voice command to be deleted from the recognition target can be changed for each user.
【0031】請求項8に記載されているように、本連続
音声文章入力装置は、音声コマンド辞書管理手段から音
声コマンドが削除されるときに、その旨の表示を行う削
除表示手段をさらに備えることが好ましい。According to an eighth aspect of the present invention, when the voice command is deleted from the voice command dictionary management means, the continuous voice sentence input device further comprises a deletion display means for displaying the fact. Is preferred.
【0032】これによって、ユーザーは音声コマンドを
認識対象から削除する前に、改めて削除するか否かの再
確認を行うことができ、削除対象ではない音声コマンド
を誤って削除することを防止することができる。Thus, before deleting a voice command from a recognition target, the user can reconfirm whether or not to delete the voice command, thereby preventing a voice command that is not a deletion target from being erroneously deleted. Can be.
【0033】音声コマンド履歴管理手段は、請求項9に
記載されているように、一定時間経過後に、または、音
声コマンドが一定回数使用された後に、音声コマンドの
履歴の記憶を開始するものであることが好ましい。The voice command history management means starts storing the history of the voice command after a lapse of a predetermined time or after the voice command has been used a certain number of times. Is preferred.
【0034】例えば、請求項1に係る連続音声文章入力
装置においては、使用開始時からの全音声コマンドの使
用回数に基づいて、特定の音声コマンドを認識対象から
削除するかどうかを判断している。これに対して、ユー
ザーが連続音声文章入力装置の使用に不慣れな期間と、
ある程度慣れた期間とでは、使用する音声コマンドが異
なる可能性もあるため、ユーザーが連続音声文章入力装
置の使用に不慣れな期間においては、全音声コマンドの
使用回数を計数しない方が好ましいこともある。このた
め、請求項9においては、一定時間経過後に、または、
音声コマンドが一定回数使用された後に、音声コマンド
履歴管理手段が音声コマンドの履歴の記憶を開始するも
のとしている。For example, in the continuous voice sentence input device according to the first aspect, it is determined whether or not a specific voice command is to be deleted from the recognition target based on the number of times all voice commands have been used since the start of use. . On the other hand, during periods when users are unfamiliar with using continuous speech text input devices,
Since a voice command to be used may be different from a period to which the user is accustomed to some extent, it may be preferable not to count the number of times of using all voice commands during a period when the user is unfamiliar with using the continuous voice sentence input device . For this reason, in claim 9, after a lapse of a predetermined time, or
After the voice command is used a certain number of times, the voice command history management means starts storing the history of the voice command.
【0035】また、本発明は、請求項10に記載されて
いるように、音声による文章入力の際に使用された各音
声コマンドを記憶する第一の過程と、所定回数だけ音声
コマンドが使用されたときに、各音声コマンドが予め定
められた最低回数に達しているか否かを判定する第二の
過程と、最低回数に達していない音声コマンドを認識の
対象から削除する第三の過程と、からなる連続音声文章
入力方法を提供する。According to a tenth aspect of the present invention, a first step of storing each voice command used at the time of inputting a sentence by voice, and the voice command is used a predetermined number of times. When, the second step of determining whether each voice command has reached a predetermined minimum number of times, and the third step of deleting the voice command that has not reached the minimum number of times from the target of recognition, And a method for inputting continuous voice sentences.
【0036】本請求項に係る方法によれば、請求項1に
係る連続音声文章入力装置と同様の効果を得ることがで
きる。According to the method of the present invention, it is possible to obtain the same effects as those of the continuous speech sentence input device according to the first aspect.
【0037】さらに、本発明は、請求項11に記載され
ているように、音声による文章入力の際に使用された各
音声コマンドを記憶する第一の過程と、所定回数だけ音
声コマンドが使用されたときに、各音声コマンドが予め
定められた最低回数に達しているか否かを判定する第二
の過程と、最低回数に達していない音声コマンドについ
て、その音声コマンドを認識しやすくするかどうかの優
先度を下げる第三の過程と、からなる連続音声文章入力
方法を提供する。Further, according to the present invention, a first step of storing each voice command used at the time of inputting a sentence by voice, and the voice command is used a predetermined number of times. A second step of determining whether or not each voice command has reached a predetermined minimum number of times, and for voice commands not reaching the minimum number of times, whether or not to facilitate recognition of the voice command. And a third step of lowering the priority.
【0038】本請求項に係る方法によれば、請求項2に
係る連続音声文章入力装置と同様の効果を得ることがで
きる。According to the method of the present invention, it is possible to obtain the same effects as those of the continuous speech sentence input device of the second aspect.
【0039】請求項12に記載されているように、本連
続音声文章入力方法は、認識対象から削除された音声コ
マンドを記憶する過程と、一旦認識対象から削除され、
記憶されている音声コマンドを表示する過程と、をさら
に備えることが好ましい。According to a twelfth aspect of the present invention, there is provided a continuous speech sentence input method, comprising the steps of: storing a voice command deleted from a recognition target;
Displaying the stored voice command.
【0040】本請求項に係る方法によれば、請求項5に
係る連続音声文章入力装置と同様の効果を得ることがで
きる。According to the method of the present invention, it is possible to obtain the same effect as the continuous speech sentence input device of the fifth aspect.
【0041】請求項13に記載されているように、本連
続音声文章入力方法は、一旦認識対象から削除され、記
憶されている音声コマンドを再度認識対象とする過程を
さらに備えることが好ましい。As described in the thirteenth aspect, it is preferable that the continuous voice sentence input method further includes a step of once recognizing the stored voice command from the recognition target and re-recognizing the stored voice command.
【0042】本請求項に係る方法によれば、請求項6に
係る連続音声文章入力装置と同様の効果を得ることがで
きる。According to the method of the present invention, it is possible to obtain the same effect as the continuous speech sentence input device of the sixth aspect.
【0043】請求項14に記載されているように、本連
続音声文章入力方法は、音声コマンドが認識対象から削
除されるときに、その旨の表示を行う過程をさらに備え
ることが好ましい。As described in the fourteenth aspect, it is preferable that the continuous voice sentence input method further includes a step of, when a voice command is deleted from a recognition target, displaying a message to that effect.
【0044】本請求項に係る方法によれば、請求項8に
係る連続音声文章入力装置と同様の効果を得ることがで
きる。According to the method of the present invention, it is possible to obtain the same effect as the continuous speech sentence input device of the eighth aspect.
【0045】請求項15に記載されているように、第一
の過程は、一定時間経過後に、または、音声コマンドが
一定回数使用された後に、開始されるものであることが
好ましい。[0045] As described in claim 15, the first step is preferably started after a lapse of a predetermined time or after a voice command is used a predetermined number of times.
【0046】本請求項に係る方法によれば、請求項9に
係る連続音声文章入力装置と同様の効果を得ることがで
きる。According to the method of the present invention, it is possible to obtain the same effects as the continuous speech sentence input device of the ninth aspect.
【0047】[0047]
【発明の実施の形態】次に、本発明の実施の形態に係る
連続音声文章入力装置及び連続音声文章入力方法を説明
する。Next, a continuous speech text input device and a continuous speech text input method according to an embodiment of the present invention will be described.
【0048】(第一の実施形態)図1は、本発明の第一
の実施形態に係る連続音声文章入力装置10のブロック
図である。(First Embodiment) FIG. 1 is a block diagram of a continuous speech sentence input device 10 according to a first embodiment of the present invention.
【0049】本実施形態に係る連続音声文章入力装置1
0は、ユーザーが文章を連続的に音声入力し、かつ、制
御用音声コマンドを音声入力するための音声入力部11
と、音声入力部11に入力された音声を認識する音声認
識部12と、音声の認識処理の際に使用する連続音声文
章入力用の認識処理用パターンを記憶した連続音声文章
入力用辞書13と、音声コマンドの認識用パターンを記
憶した音声コマンド用辞書14と、音声認識部12にお
ける音声の認識結果を管理し、音声認識部12における
認識結果に基づいて、入力された音声が連続文章入力用
の音声か、あるいは、音声コマンド用の音声であるかを
判断する認識結果管理部15と、入力された音声が連続
文章入力用の音声であった場合に、認識結果を表示する
認識結果表示部16と、入力された音声が音声コマンド
用の音声であった場合には、各音声コマンドに対応する
制御動作を実行させる音声コマンド実行部17と、入力
された音声が音声コマンド用の音声であった場合にその
音声コマンドの履歴を記憶する音声コマンド履歴管理部
18と、音声コマンド用辞書14の記憶内容を管理する
音声コマンド用辞書管理部19と、からなる。The continuous speech sentence input device 1 according to the present embodiment
0 is a voice input unit 11 for a user to continuously input a sentence and input a control voice command.
A voice recognition unit 12 for recognizing voice input to the voice input unit 11, a continuous voice text input dictionary 13 storing recognition processing patterns for continuous voice text input used in voice recognition processing, A voice command dictionary 14 storing voice command recognition patterns and a voice recognition result in the voice recognition unit 12 are managed. Based on the recognition result in the voice recognition unit 12, the input voice is used for continuous sentence input. Or a recognition result management unit 15 for determining whether the voice is a voice command voice or a voice command voice, and a recognition result display unit for displaying a recognition result when the input voice is a voice for continuous text input. 16, when the input voice is a voice command voice, a voice command execution unit 17 for executing a control operation corresponding to each voice command; A voice command history management unit 18 for storing the history of the voice command when was the voice for command, a voice command dictionary management unit 19 for managing the contents stored in the voice command dictionary 14 consists.
【0050】以上のような構成を有する本実施形態に係
る連続音声文章入力装置は以下のように作動する。The continuous-speech sentence input device according to the present embodiment having the above configuration operates as follows.
【0051】音声入力部11は、ユーザーが入力した音
声を取り込み、その音声のデータを音声認識部12に送
る。The voice input unit 11 takes in the voice input by the user and sends the voice data to the voice recognition unit 12.
【0052】音声認識部12は、連続音声文章入力用辞
書13及び音声コマンド用辞書14の記憶内容に基づい
て、入力された音声に対して認識処理を行い、認識結果
を示す情報と、連続音声文章入力用辞書13と音声コマ
ンド用辞書14の何れを用いて認識した結果であるかの
情報とを認識結果管理部15に出力する。The voice recognition unit 12 performs a recognition process on the input voice based on the contents stored in the continuous voice sentence input dictionary 13 and the voice command dictionary 14, and outputs information indicating the recognition result and continuous voice. It outputs to the recognition result management unit 15 information on which of the sentence input dictionary 13 and the voice command dictionary 14 has been used as the recognition result.
【0053】連続音声文章入力用辞書13は、音声認識
部12において連続音声文章入力認識用に使用する音声
認識辞書を記憶している。The continuous speech sentence input dictionary 13 stores a speech recognition dictionary used by the speech recognition unit 12 for continuous speech sentence input recognition.
【0054】音声コマンド用辞書14は、音声認識部1
2において音声コマンド認識用に使用する音声認識辞書
を記憶している。The voice command dictionary 14 includes the voice recognition unit 1.
2 stores a voice recognition dictionary used for voice command recognition.
【0055】認識結果管理部15は、音声認識部12か
ら送られてきた認識結果が連続音声文章入力用辞書13
を用いて出された結果である場合には、その認識結果を
認識結果表示部16に送り、音声認識部12から送られ
てきた認識結果が音声コマンド用辞書14を用いて出さ
れた結果である場合には、その認識結果を音声コマンド
実行部17に送る。The recognition result management unit 15 stores the recognition result sent from the speech recognition unit 12 in the continuous speech sentence input dictionary 13.
If the recognition result is output using the voice command dictionary 14, the recognition result transmitted from the voice recognition unit 12 is transmitted to the recognition result display unit 16 if the recognition result is output using the voice command dictionary 14. If there is, the recognition result is sent to the voice command execution unit 17.
【0056】認識結果表示部16は認識結果管理部15
から送られてきた認識結果を、例えば、スクリーン上に
表示し、ユーザーに告知する。The recognition result display unit 16 is a recognition result management unit 15
The recognition result sent from is displayed on the screen, for example, to notify the user.
【0057】音声コマンド実行部17は、認識結果管理
部15から送られてきた認識結果に対して、あらかじめ
記憶していた対応する動作を実行する。例えば、音声コ
マンド実行部17には、『ここを削除』という音声コマ
ンドに対して「現在、ユーザーに表示している画面上に
おいて直前に入力した音声認識結果を削除する」という
動作が記憶されているものとする。このような場合に
は、『ここを削除』という音声コマンドが認識されたと
いう認識結果が認識結果管理部15から送られてきた場
合には、音声コマンド実行部17は、その音声コマンド
に対応する動作として、「現在、ユーザーに表示してい
る画面上において直前に入力した音声認識結果を削除す
る」という動作を実行する。The voice command execution unit 17 executes a corresponding operation stored in advance on the recognition result sent from the recognition result management unit 15. For example, the voice command execution unit 17 stores an operation of “deleting the voice recognition result input immediately before on the screen currently displayed to the user” in response to the voice command “delete here”. Shall be In such a case, when a recognition result indicating that the voice command “Delete here” has been recognized is sent from the recognition result management unit 15, the voice command execution unit 17 responds to the voice command. As an operation, an operation of “deleting the speech recognition result input immediately before on the screen currently displayed to the user” is executed.
【0058】音声コマンド実行部17は、このようにし
て実行した音声コマンドの情報を音声コマンド履歴管理
部18に送る。The voice command execution unit 17 sends information on the voice command executed in this way to the voice command history management unit 18.
【0059】音声コマンド履歴管理部18は、音声コマ
ンド実行部17において実行された各音声コマンドの履
歴を記憶する。The voice command history management section 18 stores a history of each voice command executed in the voice command execution section 17.
【0060】音声コマンド用辞書管理部19は、音声コ
マンド履歴管理部18の記憶内容に基づいて、各音声コ
マンドを削除すべきか否かを判断し、必要に応じて、音
声コマンド用辞書14に記憶されている音声コマンドを
削除する。すなわち、後述するように、音声コマンド用
辞書管理部19は、音声コマンド履歴管理部18に記憶
された各音声コマンドの使用頻度に従って、使用頻度が
低い音声コマンドを音声コマンド用辞書14から削除す
る。The voice command dictionary management unit 19 determines whether or not each voice command should be deleted based on the contents stored in the voice command history management unit 18, and stores it in the voice command dictionary 14 as necessary. Delete the voice command that is being performed. That is, as will be described later, the voice command dictionary management unit 19 deletes voice commands that are used less frequently from the voice command dictionary 14 in accordance with the usage frequency of each voice command stored in the voice command history management unit 18.
【0061】次に、具体的なデータを使用して本実施形
態に係る連続音声文章入力装置10を説明する。Next, the continuous speech sentence input device 10 according to the present embodiment will be described using specific data.
【0062】本実施形態に係る連続音声文章入力装置1
0には、図2に示すように、複数個の音声コマンドとそ
れに対応する動作が登録されているものとする。例え
ば、「ここを削除」という音声コマンドが入力された場
合には、その音声コマンドに対応して、「直前に入力し
た音声認識結果を削除する」という動作が実行されるも
のとし、あるいは、「ここで改行」という音声コマンド
が入力された場合には、その音声コマンドに対応して、
「直前に入力した音声の直後に改行を行う」という動作
が実行されるものとする。The continuous speech sentence input device 1 according to the present embodiment
It is assumed that a plurality of voice commands and operations corresponding to the voice commands are registered in 0, as shown in FIG. For example, when a voice command of “Delete here” is input, an operation of “Delete the previously input voice recognition result” is performed in response to the voice command, or “ If a voice command of "Line feed here" is input, in response to the voice command,
It is assumed that an operation of “perform a line feed immediately after the voice input immediately before” is executed.
【0063】本連続音声文章入力装置10をユーザーが
ある程度利用し、連続音声による文章入力を行い、その
際に音声コマンドも使用したものとする。It is assumed that the user uses the continuous voice text input device 10 to some extent to input text by continuous voice, and also uses voice commands at that time.
【0064】音声コマンド履歴管理部18は、使用開始
時からの各音声コマンドが使用された回数及び全使用回
数をカウントする。例えば、合計30回音声コマンドが
使用されたときに、各音声コマンドの使用回数が図3に
示す通りになっているものとする。The voice command history management unit 18 counts the number of times each voice command has been used since the start of use and the total number of times each voice command has been used. For example, when the voice command is used 30 times in total, it is assumed that the number of times each voice command is used is as shown in FIG.
【0065】音声コマンド用辞書管理部19は、音声コ
マンド履歴管理部18の記憶内容を常時監視しており、
各音声コマンドが使用された回数の合計が音声コマンド
用辞書管理部19においてあらかじめ定められた回数
(ここでは、30回とする)だけ使用された時に、各音
声コマンドが予め定められた最低回数(ここでは、1回
とする)に達しているか否かを判定する。The voice command dictionary management unit 19 constantly monitors the contents stored in the voice command history management unit 18.
When the total number of times each voice command has been used is a predetermined number of times (here, 30 times) in the voice command dictionary management unit 19, each voice command has a predetermined minimum number of times (30 times). Here, it is determined whether or not it has reached once.
【0066】図3に示した場合では、音声コマンド『シ
ャットダウン』が、最低回数に達していないため、音声
コマンド用辞書管理部19は音声コマンド用辞書14に
記憶されている音声コマンド『シャットダウン』を削除
する。In the case shown in FIG. 3, since the voice command “shutdown” has not reached the minimum number, the voice command dictionary management unit 19 executes the voice command “shutdown” stored in the voice command dictionary 14. delete.
【0067】以上のように、本実施形態に係る連続音声
文章入力装置によれば、音声コマンド履歴管理部18が
各音声コマンドの使用頻度を記憶し、音声コマンド辞書
管理部19がその使用頻度に従って、使用頻度が低い音
声コマンドを音声コマンド用辞書14から除外する。As described above, according to the continuous voice sentence input device according to the present embodiment, the voice command history management unit 18 stores the usage frequency of each voice command, and the voice command dictionary management unit 19 stores the usage frequency according to the usage frequency. , Voice commands that are used less frequently are excluded from the voice command dictionary 14.
【0068】このため、音声コマンド用辞書14に含ま
れる音声コマンドは使用頻度が高いもののみに絞り込ま
れる。従って、文章入力のための入力音声が誤って音声
コマンドに誤認識されるおそれを少なくすることができ
る。また、あらかじめ用意されている音声コマンドと同
一の文字列が入力しにくくなるという問題点も解消する
ことができる。For this reason, the voice commands included in the voice command dictionary 14 are narrowed down to only those frequently used. Therefore, it is possible to reduce the possibility that an input voice for inputting a sentence is erroneously recognized as a voice command. Further, it is possible to solve the problem that it becomes difficult to input the same character string as a voice command prepared in advance.
【0069】(第二の実施形態)以下、本発明の第二の
実施形態に係る連続音声文章入力装置を説明する。(Second Embodiment) Hereinafter, a continuous speech sentence input device according to a second embodiment of the present invention will be described.
【0070】本実施形態に係る連続音声文章入力装置の
構造は上記の第一の実施形態に係る連続音声文章入力装
置10と同じである。ただし、各構成要素の機能が以下
のように異なっている。The structure of the continuous speech text input device according to the present embodiment is the same as that of the continuous speech text input device 10 according to the first embodiment. However, the function of each component is different as follows.
【0071】本実施形態に係る連続音声文章入力装置に
おける音声コマンド用辞書14には、各コマンド毎にそ
のコマンドを認識しやすくするか否かの度合いを示す優
先度が記憶されており、音声認識部12が音声コマンド
を認識処理する場合には、この優先度に従って音声コマ
ンドを認識処理する。The voice command dictionary 14 in the continuous voice sentence input device according to the present embodiment stores, for each command, a priority indicating whether or not the command is easily recognized. When the unit 12 recognizes a voice command, it recognizes the voice command according to the priority.
【0072】音声コマンド用辞書14に記憶されている
優先度は、以下のように、必要に応じて、下げられる。The priority stored in the voice command dictionary 14 is lowered as necessary as described below.
【0073】本実施形態に係る連続音声文章入力装置に
おいては、音声コマンド履歴管理部18は、上記の第一
の実施形態の場合と同様に、各音声コマンドの使用頻度
を記憶する。In the continuous voice sentence input device according to this embodiment, the voice command history management unit 18 stores the frequency of use of each voice command, as in the case of the first embodiment.
【0074】音声コマンド用辞書管理部19は、音声コ
マンド履歴管理部18の記憶内容を常時監視しており、
各音声コマンドが使用された回数の合計が音声コマンド
用辞書管理部19においてあらかじめ定められた回数
(ここでは、30回とする)だけ使用された時に、各音
声コマンドが予め定められた最低回数(ここでは、1回
とする)に達しているか否かを判定する。The voice command dictionary management unit 19 constantly monitors the contents stored in the voice command history management unit 18.
When the total number of times each voice command has been used is a predetermined number of times (here, 30 times) in the voice command dictionary management unit 19, each voice command has a predetermined minimum number of times (30 times). Here, it is determined whether or not it has reached once.
【0075】例えば、図3に示した場合においては、音
声コマンド『シャットダウン』が、最低回数に達してい
ないため、音声コマンド用辞書管理部19は音声コマン
ド用辞書14に記憶されている音声コマンド『シャット
ダウン』の優先度を低くする。従って、音声認識部12
は優先度に従って各音声コマンドを認識処理しているた
め、優先度が低くなった音声コマンド『シャットダウ
ン』を認識することができる度合いが低くなる。すなわ
ち、音声コマンド『シャットダウン』を認識しにくくな
る。For example, in the case shown in FIG. 3, since the voice command “shutdown” has not reached the minimum number, the voice command dictionary management unit 19 stores the voice command “shutdown” stored in the voice command dictionary 14. Shutdown ”priority. Therefore, the voice recognition unit 12
Recognizes each voice command in accordance with the priority, the degree to which the voice command “shutdown” having a lower priority can be recognized becomes lower. That is, it becomes difficult to recognize the voice command “shutdown”.
【0076】以上のように、本実施形態によれば、使用
頻度が低い音声コマンドは認識され難くなる。従って、
第一の実施形態の場合と同様に、文章入力のための入力
音声が誤って音声コマンドと誤認識される可能性が減
り、認識性能を改善することができる。また、あらかじ
め用意されている音声コマンドと同一の文字列が入力し
にくくなるという問題点を解消することもできる。As described above, according to the present embodiment, it is difficult to recognize a voice command that is used less frequently. Therefore,
As in the case of the first embodiment, the possibility that an input voice for inputting a sentence is erroneously recognized as a voice command is reduced, and the recognition performance can be improved. It is also possible to solve the problem that it is difficult to input the same character string as a voice command prepared in advance.
【0077】(第三の実施形態)図5は、本発明の第三
の実施形態に係る連続音声文章入力装置20のブロック
図である。(Third Embodiment) FIG. 5 is a block diagram of a continuous speech sentence input device 20 according to a third embodiment of the present invention.
【0078】本実施形態に係る連続音声文章入力装置2
0は、図1に示した第一の実施形態に係る連続音声文章
入力装置10の構成要素に加えて、音声コマンド使用頻
度計算ユニット21、音声コマンド最低使用頻度記憶ユ
ニット22、ユーザー別音声コマンド履歴管理ユニット
23及びタイマー24を備えている。これらは何れも音
声コマンド履歴管理部18に接続されている。The continuous speech sentence input device 2 according to the present embodiment
0 is a voice command usage frequency calculation unit 21, a voice command minimum usage frequency storage unit 22, a voice command history for each user, in addition to the components of the continuous voice sentence input device 10 according to the first embodiment shown in FIG. A management unit 23 and a timer 24 are provided. These are all connected to the voice command history management unit 18.
【0079】前述の第一及び第二の実施形態において
は、音声コマンド履歴管理部18が使用開始時からの各
音声コマンドの使用回数をカウントしていたが、本実施
形態のように、音声コマンド使用頻度計算ユニット21
を別個に設け、この音声コマンド使用頻度計算ユニット
21により、各音声コマンドの使用頻度を計算するよう
ようにすることができる。In the above-described first and second embodiments, the voice command history management unit 18 counts the number of times each voice command has been used since the start of use. Usage frequency calculation unit 21
Are separately provided, and the voice command usage frequency calculation unit 21 calculates the usage frequency of each voice command.
【0080】音声コマンド使用頻度計算ユニット21は
任意に交換することができるので、計算に必要な容量を
所望の値に設定することができる。Since the voice command usage frequency calculation unit 21 can be replaced arbitrarily, the capacity required for calculation can be set to a desired value.
【0081】音声コマンド最低使用頻度記憶ユニット2
2は各音声コマンド毎に削除するか否かの判定基準とな
る最低使用頻度を記憶している。Voice command minimum use frequency storage unit 2
Reference numeral 2 stores a minimum usage frequency which is a criterion for determining whether or not to delete each voice command.
【0082】第一及び第二の実施形態においては、各音
声コマンドを音声コマンド用辞書14から削除するかど
うかの判定の際に、判定基準となる使用頻度を全ての音
声コマンドに対して均一な値を用いていたが、音声コマ
ンド最低使用頻度記憶ユニット22を設けることによ
り、各音声コマンド毎に削除するか否かの判定基準を変
えることができ、音声コマンドの使用状況に応じた管理
を行うことができる。In the first and second embodiments, when determining whether or not each voice command is to be deleted from the voice command dictionary 14, the frequency of use as a criterion is made uniform for all voice commands. Although the value is used, the provision of the voice command minimum use frequency storage unit 22 can change the criterion of whether or not to delete each voice command, and perform management according to the usage status of the voice command. be able to.
【0083】ユーザー別音声コマンド履歴管理ユニット
23は、ユーザー毎の音声コマンド使用履歴を記憶して
いる。The voice command history management unit 23 for each user stores voice command usage history for each user.
【0084】ユーザー別音声コマンド履歴管理ユニット
23を設けることによって、ユーザー毎の音声コマンド
使用履歴がそれぞれ独立に記憶することができるため、
音声コマンド用辞書14から削除する音声コマンドをユ
ーザー毎に変えることが可能になる。By providing the voice command history management unit 23 for each user, the voice command usage history for each user can be stored independently.
The voice command to be deleted from the voice command dictionary 14 can be changed for each user.
【0085】タイマー24は、本連続音声文章入力装置
の使用が開始されてからの時間を計測する。The timer 24 measures the time from the start of use of the continuous speech text input device.
【0086】例えば、第一の実施形態に係る連続音声文
章入力装置においては、使用開始時からの全音声コマン
ドの使用回数が所定の回数に達した後、特定の音声コマ
ンドを音声コマンド用辞書14から削除するかどうかを
判断している。これに対して、ユーザーが連続音声文章
入力装置の使用に不慣れな期間と、それ以後の連続音声
文章入力装置の使用に慣れた期間とでは、使用する音声
コマンドが異なる可能性が大きい。従って、ユーザーが
連続音声文章入力装置の使用に不慣れな期間において
は、全音声コマンドの使用回数を計数しない方が好まし
い。For example, in the continuous voice sentence input device according to the first embodiment, after the number of times all voice commands have been used since the start of use reaches a predetermined number, a specific voice command is input to the voice command dictionary 14. Has been determined whether to delete. On the other hand, there is a high possibility that the voice command to be used is different between a period during which the user is unfamiliar with using the continuous voice sentence input device and a period during which the user is familiar with using the continuous voice text input device. Therefore, it is preferable not to count the number of times all voice commands are used during a period when the user is unfamiliar with using the continuous voice sentence input device.
【0087】このため、タイマー24を用いて、本連続
音声文章入力装置の使用開始以後の時間を計測し、使用
開始から所定時間内においては、音声コマンドの使用回
数を計数せず、所定時間経過後に音声コマンドの使用回
数の計数を開始する。これによって、ユーザーの実際の
使用状況に応じて音声コマンドを削除するか否かの判定
を行うことができる。For this reason, the timer 24 is used to measure the time after the start of use of the continuous speech sentence input device, and within a predetermined time from the start of use, the number of times the voice command is used is not counted. Later, the counting of the number of times the voice command is used is started. This makes it possible to determine whether or not to delete the voice command according to the actual usage status of the user.
【0088】なお、音声コマンドの使用回数の計数開始
は、使用開始時からの時間に代えて、使用開始時からの
音声コマンドの使用回数に依存させることもできる。す
なわち、例えば、使用開始時からの音声コマンドの使用
回数が所定回数(例えば、100回)に達したときに、
それ以後の音声コマンドの使用回数を音声コマンド用辞
書管理部19における判断の基準に用いることもでき
る。The start of counting the number of times the voice command is used can be made dependent on the number of times the voice command has been used since the start of use instead of the time from the start of use. That is, for example, when the number of times the voice command has been used since the start of use reaches a predetermined number (for example, 100),
The number of times the voice command is used thereafter can also be used as a criterion for determination in the voice command dictionary management unit 19.
【0089】(第四の実施形態)図6は、本発明の第四
の実施形態に係る連続音声文章入力装置30のブロック
図である。(Fourth Embodiment) FIG. 6 is a block diagram of a continuous speech sentence input device 30 according to a fourth embodiment of the present invention.
【0090】本実施形態に係る連続音声文章入力装置3
0は、図1に示した第一の実施形態に係る連続音声文章
入力装置10の構成要素に加えて、削除コマンド記憶ユ
ニット31、削除コマンド表示ユニット32、削除コマ
ンド再登録ユニット33及び削除動作表示ユニット34
をさらに備えている。The continuous speech sentence input device 3 according to the present embodiment
0 is a deletion command storage unit 31, a deletion command display unit 32, a deletion command re-registration unit 33, and a deletion operation display in addition to the components of the continuous speech sentence input device 10 according to the first embodiment shown in FIG. Unit 34
Is further provided.
【0091】削除コマンド記憶ユニット31は音声コマ
ンド辞書管理部19が音声コマンド用辞書14から削除
した音声コマンドを記憶する。削除コマンド表示ユニッ
ト32は削除コマンド記憶ユニット31の記憶内容、す
なわち、削除された音声コマンドのリストを表示する。The deletion command storage unit 31 stores the voice command deleted from the voice command dictionary 14 by the voice command dictionary management unit 19. The deletion command display unit 32 displays the storage contents of the deletion command storage unit 31, that is, a list of deleted voice commands.
【0092】削除コマンド表示ユニット32が既に音声
コマンド用辞書14から削除された音声コマンドを表示
することによって、ユーザーは既に削除した音声コマン
ドと現存している音声コマンドとを容易に把握すること
ができる。Since the deleted command display unit 32 displays the voice command already deleted from the voice command dictionary 14, the user can easily grasp the already deleted voice command and the existing voice command. .
【0093】削除コマンド再登録ユニット33は、削除
コマンド記憶ユニット31に記憶されている音声コマン
ドを音声コマンド用辞書14に再登録する。The deletion command re-registration unit 33 re-registers the voice commands stored in the deletion command storage unit 31 in the voice command dictionary 14.
【0094】一旦は削除した音声コマンドであっても、
後に、その音声コマンドを再び認識対象とする必要が生
じる場合もある。このため、削除コマンド記憶ユニット
31に記憶されている音声コマンドを音声コマンド用辞
書14に再登録することができるようにすることによっ
て、音声コマンドを新たに音声コマンド用辞書14に登
録する場合と比較して、より容易に所望の音声コマンド
を認識対象に組み入れることができる。Even if the voice command is once deleted,
Later, the voice command may need to be recognized again. For this reason, by enabling the voice command stored in the deletion command storage unit 31 to be re-registered in the voice command dictionary 14, the voice command is compared with a case where the voice command is newly registered in the voice command dictionary 14. Thus, the desired voice command can be more easily incorporated into the recognition target.
【0095】削除動作表示ユニット34は、音声コマン
ド用辞書14から音声コマンドが削除されるときに、そ
の旨の表示を行う。When a voice command is deleted from the voice command dictionary 14, the deletion operation display unit 34 displays a message to that effect.
【0096】例えば、音声コマンド「シャットダウン」
を音声コマンド用辞書14から削除する場合、削除動作
表示ユニット34は図4に示すようなダイアログをスク
リーン上に表示する。For example, the voice command “Shutdown”
Is deleted from the voice command dictionary 14, the deletion operation display unit 34 displays a dialog as shown in FIG. 4 on the screen.
【0097】これによって、ユーザーは音声コマンドを
音声コマンド用辞書14から削除する前に、改めて削除
するか否かの再確認を行うことができ、必要な音声コマ
ンドを誤って削除することを防止することができる。Thus, before the user deletes the voice command from the voice command dictionary 14, the user can reconfirm whether or not the voice command should be deleted, thereby preventing a necessary voice command from being erroneously deleted. be able to.
【0098】以下、本発明に係る連続音声文章入力方法
の実施形態を説明する。Hereinafter, an embodiment of the continuous speech sentence input method according to the present invention will be described.
【0099】(第五の実施形態)図7は、本発明の第五
の実施形態に係る連続音声文章入力方法の各過程を示す
フローチャートである。(Fifth Embodiment) FIG. 7 is a flowchart showing the steps of a continuous speech sentence input method according to a fifth embodiment of the present invention.
【0100】先ず、連続音声文章が音声コマンドととも
に入力される(ステップ10)。First, a continuous voice sentence is input together with a voice command (step 10).
【0101】この際、使用された各音声コマンドが記憶
され、各音声コマンド毎に使用回数が記憶される(ステ
ップ20)。At this time, each voice command used is stored, and the number of times of use is stored for each voice command (step 20).
【0102】次いで、全ての音声コマンドの使用回数が
所定回数A1(例えば、30回)に達したか否かが判定
される(ステップ30)。Next, it is determined whether or not the number of use of all voice commands has reached a predetermined number A1 (for example, 30) (step 30).
【0103】全ての音声コマンドの使用回数が所定回数
A1に達していない場合(ステップ30のNO)には、
各音声コマンド毎の使用回数の計数が継続して行われる
(ステップ20)。If the number of uses of all voice commands has not reached the predetermined number A1 (NO in step 30),
The number of times of use for each voice command is counted continuously (step 20).
【0104】全ての音声コマンドの使用回数が所定回数
A1に達した場合(ステップ30のYES)には、各音
声コマンドの使用回数が所定回数A2(例えば、3回)
に達したか否かが判定される(ステップ40)。When the number of times of use of all voice commands has reached the predetermined number of times A1 (YES in step 30), the number of times of use of each voice command is equal to the predetermined number of times A2 (for example, three times).
Is determined (step 40).
【0105】音声コマンドの使用回数が所定回数A2に
達していない場合(ステップ40のNO)には、本プロ
セスはそのまま終了する。すなわち、その音声コマンド
は認識対象から削除されることなく、そのまま認識対象
として残される。If the number of times the voice command has been used has not reached the predetermined number A2 (NO in step 40), the present process ends. That is, the voice command is not deleted from the recognition target, but remains as the recognition target.
【0106】所定の音声コマンドの使用回数が所定回数
A2に達した場合(ステップ40のYES)には、その
音声コマンドは認識対象から削除される(ステップ5
0)。以後、その音声コマンドが入力されても、その音
声コマンドに対応する制御動作は実行されない。If the number of times the predetermined voice command has been used has reached the predetermined number A2 (YES in step 40), the voice command is deleted from the recognition target (step 5).
0). Thereafter, even if the voice command is input, the control operation corresponding to the voice command is not executed.
【0107】以上のように、本実施形態に係る連続音声
文章入力方法によれば、使用頻度が低い音声コマンドが
認識対象から除外される。このため、使用頻度が高い音
声コマンドのみが認識対象として残るため、文章入力の
ための入力音声が誤って音声コマンドに誤認識されるお
それを少なくすることができる。また、あらかじめ用意
されている音声コマンドと同一の文字列が入力しにくく
なるという問題点も解消することができる。As described above, according to the continuous-speech sentence input method according to the present embodiment, a voice command with a low use frequency is excluded from recognition targets. For this reason, only the frequently used voice command remains as the recognition target, and the possibility that the input voice for inputting the text is erroneously recognized as the voice command can be reduced. Further, it is possible to solve the problem that it becomes difficult to input the same character string as a voice command prepared in advance.
【0108】(第六の実施形態)図8は、本発明の第六
の実施形態に係る連続音声文章入力方法の各過程を示す
フローチャートである。(Sixth Embodiment) FIG. 8 is a flowchart showing each step of a continuous speech sentence input method according to a sixth embodiment of the present invention.
【0109】本実施形態に係る連続音声文章入力方法に
おいては、前述の第五の実施形態におけるステップ50
に代えてステップ60が実施される。多のステップ10
乃至40は第五の実施形態の場合と同様である。In the continuous speech sentence input method according to the present embodiment, step 50 in the fifth embodiment is used.
Step 60 is performed instead of. Many steps 10
Steps 40 to 40 are the same as those in the fifth embodiment.
【0110】ステップ60においては、所定の音声コマ
ンドの使用回数が所定回数A2に達した場合(ステップ
40のYES)には、その音声コマンドの優先度が低く
される。この結果、優先度が低くなった音声コマンドは
認識される度合いが低くなる。すなわち、その音声コマ
ンドは認識されにくくなる。In step 60, when the number of times of use of the predetermined voice command has reached the predetermined number of times A2 (YES in step 40), the priority of the voice command is lowered. As a result, the voice command having the lower priority has a lower recognition degree. That is, the voice command becomes difficult to be recognized.
【0111】本実施形態によっても、第五の実施形態に
よる効果と同一の効果を得ることができる。According to the present embodiment, the same effect as that of the fifth embodiment can be obtained.
【0112】(第七の実施形態)図9は、本発明の第七
の実施形態に係る連続音声文章入力方法の各過程を示す
フローチャートである。(Seventh Embodiment) FIG. 9 is a flowchart showing the steps of a continuous speech sentence input method according to a seventh embodiment of the present invention.
【0113】本実施形態に係る連続音声文章入力方法
は、図7に示した第五の実施形態における各ステップ1
0乃至40に加えて、ステップ70乃至ステップ100
を備えている。The continuous speech sentence input method according to the present embodiment corresponds to the step 1 in the fifth embodiment shown in FIG.
Steps 70 to 100 in addition to 0 to 40
It has.
【0114】ステップ10乃至40は第五の実施形態の
場合と同様に実施される。Steps 10 to 40 are performed in the same manner as in the fifth embodiment.
【0115】所定の音声コマンドの使用回数が所定回数
A2に達した場合(ステップ40のYES)には、その
音声コマンドを認識対象から削除しても良いかどうかの
再確認を求める表示が行われる(ステップ70)。例え
ば、図4に示したようなダイアログがスクリーン上に表
示される。When the number of times the predetermined voice command has been used reaches the predetermined number A2 (YES in step 40), a display requesting reconfirmation as to whether the voice command may be deleted from the recognition target is displayed. (Step 70). For example, a dialog as shown in FIG. 4 is displayed on the screen.
【0116】ユーザーが削除不可を選択した場合(ステ
ップ70のNO)には、本プロセスはそのまま終了す
る。すなわち、その音声コマンドは認識対象から削除さ
れることなく、そのまま認識対象として残される。If the user selects the deletion prohibition (NO in step 70), the present process ends. That is, the voice command is not deleted from the recognition target, but remains as the recognition target.
【0117】ユーザーが削除可を選択した場合(ステッ
プ70のYES)には、その音声コマンドは認識対象か
ら削除される(ステップ50)。以後、その音声コマン
ドが入力されても、その音声コマンドに対応する制御動
作は実行されない。When the user selects the deletion permission (YES in step 70), the voice command is deleted from the recognition target (step 50). Thereafter, even if the voice command is input, the control operation corresponding to the voice command is not executed.
【0118】このように認識対象から除外された音声コ
マンドは所定の記憶ユニット内に記憶される(ステップ
80)。The voice command excluded from the recognition target is stored in a predetermined storage unit (step 80).
【0119】記憶ユニット内に記憶された音声コマン
ド、すなわち、認識対象から削除された音声コマンドの
リストは、ユーザーの要求に応じて、あるいは、ユーザ
ーの要求の有無にかかわらず常にスクリーン上に表示さ
れる(ステップ90)。The voice command stored in the storage unit, that is, the list of voice commands deleted from the recognition target, is always displayed on the screen in response to the user's request or regardless of the user's request. (Step 90).
【0120】ユーザーが、スクリーン上に表示された削
除済み音声コマンドの中から再度認識対象として登録を
希望するものがある場合(ステップ100のYES)に
は、リスト中の所望の音声コマンドを選択することによ
り、その音声コマンドは認識対象として再登録される
(ステップ110)。If the user wishes to register again as a recognition target from among the deleted voice commands displayed on the screen (YES in step 100), the user selects the desired voice command in the list. As a result, the voice command is re-registered as a recognition target (step 110).
【0121】[0121]
【発明の効果】以上のように、本発明は次のような効果
を奏する。As described above, the present invention has the following effects.
【0122】第1の効果は認識性能を改善することがで
きるという効果である。The first effect is that the recognition performance can be improved.
【0123】第2の効果は、あらかじめ用意されている
音声コマンドと同一の文字列が入力しにくいというケー
スが発生するおそれを小さくすることができるという効
果である。The second effect is that it is possible to reduce a possibility that a case where it is difficult to input the same character string as a voice command prepared in advance is reduced.
【0124】その理由は、使用頻度が低い音声コマンド
を認識対象から削除することにより、音声コマンド辞書
をユーザーの使用頻度が高いもののみに絞り込むことが
でき、文章入力のための入力音声が誤って音声コマンド
に誤認識される可能性が減るためである。The reason is that by deleting a voice command that is not frequently used from the recognition target, the voice command dictionary can be narrowed down to only those that are frequently used by the user, and the input voice for inputting a sentence may be erroneously input. This is because the possibility of being erroneously recognized as a voice command is reduced.
【図1】本発明の第一の実施形態に係る連続音声文章入
力装置の構成を示すブロック図である。FIG. 1 is a block diagram showing a configuration of a continuous speech sentence input device according to a first embodiment of the present invention.
【図2】本発明の第一の実施形態において使用される登
録された音声コマンドの具体例の一つである。FIG. 2 is a specific example of a registered voice command used in the first embodiment of the present invention.
【図3】本発明の第一の実施形態における音声コマンド
使用回数の記憶内容の具体例の一つである。FIG. 3 is a specific example of a storage content of a voice command usage count in the first embodiment of the present invention.
【図4】本発明の第一の実施形態においてユーザーに表
示するダイアログの具体例の一つである。FIG. 4 is a specific example of a dialog displayed to a user in the first embodiment of the present invention.
【図5】本発明の第三の実施形態に係る連続音声文章入
力装置の構成を示すブロック図である。FIG. 5 is a block diagram showing a configuration of a continuous speech sentence input device according to a third embodiment of the present invention.
【図6】本発明の第四の実施形態に係る連続音声文章入
力装置の構成を示すブロック図である。FIG. 6 is a block diagram showing a configuration of a continuous speech sentence input device according to a fourth embodiment of the present invention.
【図7】本発明の第五の実施形態に係る連続音声文章入
力方法の各過程を示すフローチャートである。FIG. 7 is a flowchart showing each step of a continuous speech sentence input method according to a fifth embodiment of the present invention.
【図8】本発明の第六の実施形態に係る連続音声文章入
力方法の各過程を示すフローチャートである。FIG. 8 is a flowchart showing each step of a continuous speech sentence input method according to a sixth embodiment of the present invention.
【図9】本発明の第七の実施形態に係る連続音声文章入
力方法の各過程を示すフローチャートである。FIG. 9 is a flowchart illustrating each step of a continuous speech sentence input method according to a seventh embodiment of the present invention.
【図10】従来の連続音声文章入力装置の構成を示すブ
ロック図である。FIG. 10 is a block diagram showing a configuration of a conventional continuous speech sentence input device.
10 第一の実施形態に係る連続音声文章入力装置 11 音声入力部 12 音声認識部 13 連続音声文章入力用辞書 14 音声コマンド用辞書 15 認識結果管理部 16 認識結果表示部 17 音声コマンド実行部 18 音声コマンド履歴管理部 19 音声コマンド用辞書管理部 20 第二の実施形態に係る連続音声文章入力装置 21 音声コマンド使用頻度計算ユニット 22 音声コマンド最低使用頻度記憶ユニット 23 ユーザー別音声コマンド履歴管理ユニット 24 タイマー 30 第三の実施形態に係る連続音声文章入力装置 31 削除コマンド記憶ユニット 32 削除コマンド表示ユニット 33 削除コマンド再登録ユニット 34 削除動作表示ユニット Reference Signs List 10 Continuous speech text input device according to first embodiment 11 Voice input unit 12 Voice recognition unit 13 Continuous speech text input dictionary 14 Voice command dictionary 15 Recognition result management unit 16 Recognition result display unit 17 Voice command execution unit 18 Voice Command history management unit 19 Voice command dictionary management unit 20 Continuous voice sentence input device according to the second embodiment 21 Voice command usage frequency calculation unit 22 Voice command minimum usage frequency storage unit 23 Voice command history management unit for each user 24 Timer 30 Continuous voice sentence input device 31 according to the third embodiment 31 Delete command storage unit 32 Delete command display unit 33 Delete command re-registration unit 34 Delete operation display unit
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP11059059AJP2000259180A (en) | 1999-03-05 | 1999-03-05 | Continuous voice text input device and continuous voice text input method |
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP11059059AJP2000259180A (en) | 1999-03-05 | 1999-03-05 | Continuous voice text input device and continuous voice text input method |
| Publication Number | Publication Date |
|---|---|
| JP2000259180Atrue JP2000259180A (en) | 2000-09-22 |
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP11059059APendingJP2000259180A (en) | 1999-03-05 | 1999-03-05 | Continuous voice text input device and continuous voice text input method |
| Country | Link |
|---|---|
| JP (1) | JP2000259180A (en) |
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2005055198A1 (en)* | 2003-12-04 | 2005-06-16 | Toyota Infotechnology Center Co., Ltd. | Shortcut names for use in a speech recognition system |
| JP2005300989A (en)* | 2004-04-13 | 2005-10-27 | Mitsubishi Electric Corp | Speech recognition system |
| US7231343B1 (en) | 2001-12-20 | 2007-06-12 | Ianywhere Solutions, Inc. | Synonyms mechanism for natural language systems |
| JP2007226098A (en)* | 2006-02-27 | 2007-09-06 | Denso Corp | Speech recognition device |
| JP2008242059A (en)* | 2007-03-27 | 2008-10-09 | Mitsubishi Electric Corp | Speech recognition dictionary creation device and speech recognition device |
| US7516077B2 (en) | 2002-07-25 | 2009-04-07 | Denso Corporation | Voice control system |
| US8560317B2 (en) | 2006-05-18 | 2013-10-15 | Fujitsu Limited | Voice recognition apparatus and recording medium storing voice recognition program |
| WO2014032597A1 (en)* | 2012-08-29 | 2014-03-06 | 联想(北京)有限公司 | Voice recognition method and electronic device |
| JP2021013099A (en)* | 2019-07-05 | 2021-02-04 | コニカミノルタ株式会社 | Image forming apparatus, control method for image forming apparatus, and control program for image forming apparatus |
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US7231343B1 (en) | 2001-12-20 | 2007-06-12 | Ianywhere Solutions, Inc. | Synonyms mechanism for natural language systems |
| US7516077B2 (en) | 2002-07-25 | 2009-04-07 | Denso Corporation | Voice control system |
| WO2005055198A1 (en)* | 2003-12-04 | 2005-06-16 | Toyota Infotechnology Center Co., Ltd. | Shortcut names for use in a speech recognition system |
| US7292978B2 (en) | 2003-12-04 | 2007-11-06 | Toyota Infotechnology Center Co., Ltd. | Shortcut names for use in a speech recognition system |
| JP2005300989A (en)* | 2004-04-13 | 2005-10-27 | Mitsubishi Electric Corp | Speech recognition system |
| JP2007226098A (en)* | 2006-02-27 | 2007-09-06 | Denso Corp | Speech recognition device |
| US8560317B2 (en) | 2006-05-18 | 2013-10-15 | Fujitsu Limited | Voice recognition apparatus and recording medium storing voice recognition program |
| JP2008242059A (en)* | 2007-03-27 | 2008-10-09 | Mitsubishi Electric Corp | Speech recognition dictionary creation device and speech recognition device |
| WO2014032597A1 (en)* | 2012-08-29 | 2014-03-06 | 联想(北京)有限公司 | Voice recognition method and electronic device |
| CN103632665A (en)* | 2012-08-29 | 2014-03-12 | 联想(北京)有限公司 | Voice identification method and electronic device |
| US20150325238A1 (en)* | 2012-08-29 | 2015-11-12 | Lenovo (Beijing) Co., Ltd. | Voice Recognition Method And Electronic Device |
| JP2021013099A (en)* | 2019-07-05 | 2021-02-04 | コニカミノルタ株式会社 | Image forming apparatus, control method for image forming apparatus, and control program for image forming apparatus |
| JP7334510B2 (en) | 2019-07-05 | 2023-08-29 | コニカミノルタ株式会社 | IMAGE FORMING APPARATUS, IMAGE FORMING APPARATUS CONTROL METHOD, AND IMAGE FORMING APPARATUS CONTROL PROGRAM |
| Publication | Publication Date | Title |
|---|---|---|
| US9760560B2 (en) | Correction of previous words and other user text input errors | |
| US7562007B2 (en) | Method and apparatus for recognizing language input mode and method and apparatus for automatically switching language input modes using the same | |
| US20210073467A1 (en) | Method, System and Apparatus for Entering Text on a Computing Device | |
| CA2967405C (en) | Message correction and updating system and method, and associated user interface operation | |
| JP3486459B2 (en) | Electronic information equipment and control method thereof | |
| CN105204617B (en) | The method and system integrated for Input Method Editor | |
| US20100115402A1 (en) | System for data entry using multi-function keys | |
| JPWO2018186445A1 (en) | Dialogue system | |
| KR20140014200A (en) | Conversational dialog learning and correction | |
| US7912697B2 (en) | Character inputting method and character inputting apparatus | |
| US7913184B1 (en) | Intelligent auto-tabbing systems and methods | |
| US9557818B2 (en) | Contextually-specific automatic separators | |
| JP2000259180A (en) | Continuous voice text input device and continuous voice text input method | |
| US7675435B2 (en) | Smart filtering with multiple simultaneous keyboard inputs | |
| EP3267301A1 (en) | High-efficiency touch screen text input system and method | |
| JP2003167600A (en) | Speech recognition device and method, page description language display device and control method thereof, and computer program | |
| CN111857362A (en) | Character input method and character input device | |
| US11640502B2 (en) | Word registration device, word registration method, and word registration program stored on computer-readable storage | |
| KR102158544B1 (en) | Method and system for supporting spell checking within input interface of mobile device | |
| JP5674140B2 (en) | Text input device, text input receiving method and program | |
| KR20130016867A (en) | User device capable of displaying sensitive word, and method of displaying sensitive word using user device | |
| JP6304449B1 (en) | Information processing apparatus, image processing apparatus, and menu screen display control method | |
| CN109240511A (en) | It is a kind of to update the method for dictionary, system and a kind of for updating the device of dictionary | |
| JPH10143501A (en) | Character string prediction method and document creation device using this character string prediction method | |
| JP2012014517A (en) | Handwritten character recognition method and system thereof |