













本発明は、認識処理性能を向上させる認識処理制御装置、認識処理制御方法および認識処理制御プログラムに関する。 The present invention relates to a recognition processing control device, a recognition processing control method, and a recognition processing control program for improving recognition processing performance.
近年、情報通信インフラの発展にともない、スマートフォンやタブレット端末などの情報端末の普及が進んでいる。さらに、これら情報端末を利用したクラウドサービスが始まっている。例えば、音声認識を用いたWeb検索システムや会話型応答システムがクラウドサービスとして利用可能となってきた。 In recent years, with the development of information communication infrastructure, information terminals such as smartphones and tablet terminals have been popularized. In addition, cloud services using these information terminals have begun. For example, Web search systems and conversational response systems using voice recognition have become available as cloud services.
特許文献1には、音声認識を使用した機械翻訳の技術が開示されている。特許文献1の技術は、原言語の用例に基づく音声認識結果と、原言語の文字列として音声認識結果の類似度を算定する。特許文献1の技術は、算定した類似度が所定の閾値を超えている場合に、用例に基づく音声認識結果を用いて翻訳を行うものである。
特許文献2には、特定の文法を定義し、定義された文法に適合する音声認識を行う技術が開示されている。「文法」とは、特許文献2では、単語または文の集合との意味である。特許文献2の技術は、音声認識対象として限定された単語または文の集合を与える特定の文法を定義する。その際、その文法は、音声認識対象となる単語または文を効率よく追加、削除できる記述方法で定義される。
特許文献1、2の技術は、特定の用例や特定の文法に基づいて音声認識を行う技術である。すなわち、特許文献1、2の技術では、特定の用例や特定の文法を用いて音声認識を行うため、音声認識を用いるサービスは、特定の用例や特定の文法に基づいた特定の分野やサービスに限定される。また、特許文献1、2の技術は、音声認識対象が特定の用例や特定の文法に基づいて限定されるため、認識不可能な音声が存在するという点で、音声認識の性能にも限界がある。 The techniques of
したがって、特許文献1、2の技術は、特定の用例や特定の文法を定義しているために、用例や文法によって特定の分野やサービスに限定され、認識対象が限定されてしまい、認識性能を向上させられないという課題がある。 Therefore, since the techniques of
この課題は、音声認識にとどまらず、一般に、ある入力情報に対する認識処理を行う場合にも当てはまる。例えば、文字認識を行う場合に、文字認識の対象となるイメージ画像には、どの言語の文字が記載されているかが不明であるときに、日本語の文字を認識する機能しかない文字認識エンジンでは対応ができない。 This problem is not limited to voice recognition, and is generally applicable to recognition processing for certain input information. For example, when performing character recognition, a character recognition engine that has only a function of recognizing Japanese characters when it is unclear what language characters are included in the image image that is the target of character recognition. Cannot handle.
本発明の目的は、上記の課題に鑑みてなされたもので、効率的に認識処理を行って認識性能を向上させる認識処理制御装置、認識処理制御方法および認識処理制御プログラムを提供することにある。 An object of the present invention is to provide a recognition processing control device, a recognition processing control method, and a recognition processing control program that efficiently perform recognition processing to improve recognition performance. .
本発明にかかる認識処理制御装置は、認識処理対象の処理属性にしたがって認識処理を行う認識エンジンを指定するエンジン指定情報に基づいて、認識処理対象を認識エンジンに送信する送信手段と、認識エンジンから認識処理の結果情報を受信する受信手段と、予め設定された前記処理属性に対応する認識エンジンを選択する際の優先度の高さに基づいて結果情報を評価し、評価結果を出力する出力手段を備えることを特徴とする。
The recognition processing control device according to the present invention includes a transmission unit that transmits a recognition processing target to the recognition engine based on engine designation information that specifies a recognition engine that performs the recognition processing according to the processing attribute of the recognition processing target, and a recognition engine. receiving means for receiving the result information of the recognition processing, and evaluation result information basedon the height ofpriority in selecting a recognition engine corresponding to the processing attribute that is set in advance, an output means for outputting the evaluation result It is characterized by providing.
本発明にかかる認識処理制御方法は、認識処理対象の処理属性にしたがって認識処理を行う認識エンジンを指定するエンジン指定情報に基づいて、認識処理対象を認識エンジンに送信し、認識エンジンから認識処理の結果情報を受信し、予め設定された前記処理属性に対応する認識エンジンを選択する際の優先度の高さに基づいて結果情報を評価し、評価結果を出力することを特徴とする。
The recognition processing control method according to the present invention transmits a recognition processing target to a recognition engine based on engine designation information for specifying a recognition engine that performs the recognition processing according to the processing attribute of the recognition processing target. results receives information to evaluate the result information basedon the height ofpriority in selecting a recognition engine corresponding to the processing attribute set in advance, and outputs the evaluation result.
本発明にかかる認識処理制御プログラムは、認識処理制御装置が備えるコンピュータを、認識処理対象の処理属性にしたがって認識処理を行う認識エンジンを指定するエンジン指定情報に基づいて、認識処理対象を認識エンジンに送信する送信手段と、認識エンジンから認識処理の結果情報を受信する受信手段と、予め設定された前記処理属性に対応する認識エンジンを選択する際の優先度の高さに基づいて結果情報を評価し、評価結果を出力する出力手段として動作させることを特徴とする。
The recognition processing control program according to the present invention allows a computer included in a recognition processing control device to recognize a recognition processing target as a recognition engine based on engine designation information that specifies a recognition engine that performs recognition processing according to a processing attribute of the recognition processing target. evaluation and sending means for sending, receiving means for receiving the result information of the recognition processing from the recognition engine, the result information basedon the height ofpriority in selecting a recognition engine corresponding to the processing attribute set in advance And operating as output means for outputting the evaluation result.
本発明によれば、効率的に認識処理を行って認識性能を向上させることが可能となる。 According to the present invention, it is possible to improve recognition performance by efficiently performing recognition processing.
以下に、本発明の実施形態について図面を参照して詳細に説明する。
(第1の実施形態)
本発明の第1の実施形態について説明する。図1は、本発明の第1の実施形態の認識処理システムの構成例を示す全体構成図である。Embodiments of the present invention will be described below in detail with reference to the drawings.
(First embodiment)
A first embodiment of the present invention will be described. FIG. 1 is an overall configuration diagram illustrating a configuration example of a recognition processing system according to a first embodiment of this invention.
図1を参照して、本実施形態の認識処理システム10の構成について説明する。認識処理システム10は、入力手段1、出力手段2、属性記憶手段3、配信手段4と認識制御手段5を備える。認識処理手段9は、配信手段4と接続された認識エンジン9−1〜n(nは、1以上の整数)を備える。 With reference to FIG. 1, the structure of the
入力手段1は、認識処理を行うための認識処理対象信号の入力と、登録および操作設定を受け付ける。出力手段2は、認識処理結果情報の出力と、登録および操作設定に関わる表示および出力を行う。属性記憶手段3は、認識処理対象信号を判断するための処理属性情報、認識処理結果情報を評価するための評価情報と、認識処理手段9が備える認識エンジン9−1〜nに関わる配信先情報を含む属性情報を記憶する。配信手段4は、認識処理手段9が備える認識エンジン9−1〜nに認識処理対象情報を送信し、認識エンジン9−1〜nから認識処理結果情報を受信する。認識制御手段5は、入力手段1、出力手段2、属性記憶手段3、配信手段4の制御を行う。 The
図1を参照して、本実施形態の認識処理システム10の動作について説明する。入力手段1は、認識処理対象信号を入力し、認識処理対象情報に変換して認識制御手段5に送る。認識制御手段5は、入力手段1の種類と属性記憶手段3に予め記憶される属性情報に基づいて、認識処理対象情報の処理属性を判断する。「処理属性」とは、認識処理対象情報にどの認識処理を行うかを示すものである。認識制御手段5は、認識処理対象情報に対する処理の内容、例えば、音声認識あるいは画像認識等、を示す処理属性を判断する。 With reference to FIG. 1, the operation of the
具体的には、認識制御手段5は、例えば、入力手段1がマイクであるとき、マイク入力に関わる処理属性を属性記憶手段3から取得する。属性記憶手段3には、マイク入力に関わる処理属性として、音声認識が記憶されているものとする。認識制御手段5は、属性記憶手段3のマイク入力に関わる処理属性に基づいて、処理属性を音声認識と判断する。すなわち、認識制御手段5は、入力手段1からの認識処理対象情報の処理属性を音声認識と判断する。 Specifically, for example, when the
認識制御手段5は、認識処理対象情報の処理属性に基づいて、属性記憶手段3に記憶される配信先情報を取得する。 The
具体的には、認識制御手段5は、認識処理対象情報の処理属性が音声認識であることから、音声認識に関わる配信先情報を、属性記憶手段3から取得する。そして、認識制御手段5は、音声認識に関わる配信先情報に基づいて、認識処理対象情報の配信先である認識エンジンを、認識エンジン9−1〜nの中から選定する。例えば、認識制御手段5は、音声認識の処理属性に対応する認識エンジン9−1〜m(mは1以上で、n以下の整数)を選定する。 Specifically, since the processing attribute of the recognition processing target information is voice recognition, the
認識制御手段5は、認識処理対象情報から、選定された認識エンジン9−1〜mに対応する配信先認識処理対象情報#1〜#mを作成する。すなわち、認識制御手段5は、属性記憶手段3に記憶される配信先情報に基づいて、認識処理対象情報が認識エンジン9−1〜mに対応するように、それぞれ、配信先認識処理対象情報#1〜#mに変換する。 The recognition control means 5 creates distribution destination recognition processing
認識制御手段5は、各配信先向けに変換された配信先認識処理対象情報#1〜#mを、配信手段4を経由して認識エンジン9−1〜mに送信する。すなわち、認識制御手段5は、配信手段4を制御して、配信先認識処理対象情報#1〜#mを、それぞれ、認識エンジン9−1〜mに送信する。 The
このように、認識処理システム10の入力手段1に入力された認識処理対象信号は、認識制御手段5によって配信先認識処理対象情報#1〜mに変換されて、認識エンジン9−1〜mに送信される。 As described above, the recognition process target signal input to the
認識処理手段9の認識エンジン9−1〜mは、送信された配信先認識処理対象情報#1〜#mを受信して認識処理を行う。認識エンジン9−1〜mは、認識処理結果を認識処理結果情報#1〜#mとして、配信手段4に送付する。 The recognition engines 9-1 to m of the
配信手段4は、送付された認識処理結果情報#1〜#mを認識制御手段5に送る。認識制御手段5は、送られた認識処理結果情報#1〜#mを、属性記憶手段3に記憶される属性情報に基づいて評価する。例えば、認識制御手段5は、音声認識に関わる属性情報に基づいて、認識処理結果情報#1〜#mを評価する。 The
そして、認識制御手段5は、評価に基づいて、認識処理結果情報#1〜#mの内、最も高い評価の認識処理結果情報、例えば認識処理結果情報#5を出力手段2に出力する。 Based on the evaluation, the
このように、本実施形態の認識処理システム10は、入力手段1が受け付けた認識処理対象信号の処理属性を判断し、判断された処理属性に対応する認識エンジンを選択して、選択された認識エンジン9−1〜mに認識処理対象情報を送信して認識処理を行う。すなわち、本実施形態では、認識処理対象信号を予め記憶される処理属性に対応する認識エンジンを選択して認識処理を行うことができるので、認識処理対象の属性、分野やサービスが限定されない。 As described above, the
認識処理システム10は、認識エンジン9−1〜mから認識処理結果情報を受信して、属性記憶手段3に記憶される属性情報に基づいて評価を行い、最も高い評価の認識処理結果情報を出力手段2に出力する。したがって、本実施形態では、認識処理対象信号の処理属性に対応する認識エンジンを複数選択して認識処理を行い、認識処理結果情報を予め記憶される属性情報に基づいて評価するので、認識処理を効率的に行い、認識性能を向上させることができる。 The
したがって、本実施形態は、効率的に認識処理を行って認識性能を向上することが可能となる。 Therefore, this embodiment can improve recognition performance by efficiently performing recognition processing.
図2〜6は、本実施形態の認識処理システムの属性情報を例示したものである。図2〜6を参照して、本実施形態の動作について説明する。 2 to 6 exemplify attribute information of the recognition processing system according to the present embodiment. The operation of this embodiment will be described with reference to FIGS.
図2は、本実施形態の認識処理システムの属性記憶手段3に記憶される認識処理に関わる処理属性情報100を例示したものである。 FIG. 2 illustrates
認識制御手段5は、入力手段1に入力された認識処理対象信号の処理属性を判断する。具体的には、認識制御手段5は、入力手段1に入力された認識処理対象信号が、例えば、マイク入力であるとき、マイク入力についての処理属性を属性記憶手段3から取得する。認識制御手段5は、属性記憶手段3に予め記憶される認識処理の処理属性情報100を参照する。認識制御手段5は、入力デバイス欄101の「マイク」に関わる処理属性欄102に記載されている「音声認識」が、処理属性であると判断する。例えば、スキャナ入力であれば、「スキャナ」に関わる処理属性は、「画像認識」、「顔認識」、「文字認識」、「バーコード認識」と判断される。 The
図3は、本実施形態の認識処理システムの属性記憶手段3に記憶される認識処理に関わる配信先情報110を例示したものである。音声認識エンジン#1、画像認識エンジン#1、標識認識エンジン#1等は、認識エンジン9−1〜nのいずれかである。認識制御手段5は、認識エンジン9−1〜nの中から認識エンジンを指定するエンジン指定情報として、配信先情報を使用する。 FIG. 3 exemplifies the
認識制御手段5は、入力手段1に入力された認識処理対象信号の処理属性の判断に基づいて、属性記憶手段3に記憶される配信先情報を取得する。具体的には、認識制御手段5は、認識処理対象信号の処理属性が、例えば、「音声認識」であるとき、「音声認識」に関わる配信先情報を、属性記憶手段3から取得する。認識制御手段5は、属性記憶手段3に予め記憶される認識処理の配信先情報110を参照して、処理属性欄111の「音声認識」に関わる配信先欄112、入力条件欄113などに記憶されている配信先情報を取得する。 The
認識制御手段5は、配信先情報に基づいて、認識処理対象情報の配信先を選定する。具体的には、認識制御手段5は、例えば、処理属性が「音声認識」であれば、属性記憶手段3に予め記憶される認識処理の配信先情報110を参照して、処理属性欄111の「音声認識」に関わる配信先欄112、入力条件欄113などの配信先情報に基づいて、音声認識エンジンを選択する。例えば、処理属性が「画像認識」であれば、認識制御手段5は、「画像認識」に関わる配信先情報に基づいて、画像認識エンジンを選択すればよい。 The
認識制御手段5は、選択された認識処理エンジンに対応する配信先情報に基づいて、認識処理対象情報から、配信先認識処理対象情報を作成する。具体的には、認識制御手段5は、例えば、選択された音声認識エンジン#1であれば、音声認識エンジン#1の入力条件欄113などに基づいて、認識処理対象情報を、音声認識エンジン#1の入力条件に合致するように変換する。すなわち、認識制御手段5は、認識処理対象情報を、音声認識エンジン#1に入力できるように、例えば、情報のデータ形式やデータ長などを変換して、配信先認識処理対象情報#1を作成する。 The recognition control means 5 creates delivery destination recognition processing target information from the recognition processing target information based on the delivery destination information corresponding to the selected recognition processing engine. Specifically, for example, if the selected speech
認識制御手段5は、選択された認識処理エンジンに対応する配信先欄112に基づいて、作成された配信先認識対象情報を、配信先である認識エンジンに配信手段4を経由して送信する。すなわち、認識制御手段5は、例えば、配信先認識処理情報#1を、配信先である音声認識エンジン#1に、配信手段4を経由して送信する。 The
認識エンジンは、送信された配信先認識処理対象情報を受け付けて、認識処理を行った認識処理結果情報を配信手段4に送付する。すなわち、本実施形態では、認識処理対象信号を予め記憶される処理属性に対応する認識エンジンを選択して認識処理を行うことができるので、認識処理対象の属性、分野やサービスが限定されない。 The recognition engine receives the transmitted delivery destination recognition process target information and sends the recognition process result information obtained by the recognition process to the delivery means 4. That is, in the present embodiment, the recognition process target signal can be selected and the recognition process corresponding to the processing attribute stored in advance can be selected, so that the recognition process target attribute, field, and service are not limited.
配信手段4は、送付された認識処理結果情報を認識制御手段5に送る。認識制御手段5は、送られた認識処理結果情報を、属性記憶手段3に記憶される属性情報に基づいて評価する。すなわち、認識制御手段5は、例えば、音声認識エンジン#1からの認識処理結果情報#1を、音声認識に関わる属性情報に基づいて評価する。 The distribution means 4 sends the sent recognition processing result information to the recognition control means 5. The
認識処理結果情報の評価については、音声認識を例として説明する。図4、5、6は、本実施形態の認識処理システムの属性記憶手段3に記憶される音声認識の評価に関わる属性情報を例示したものである。図4、5、6を参照して、各図の構成について説明する。 The evaluation of the recognition processing result information will be described using voice recognition as an example. 4, 5, and 6 exemplify attribute information related to speech recognition evaluation stored in the
図4は、音声認識に関わる文法番号と文法の評価情報200を例示する。「文法」とは、特定の単語、または複数の単語群を組み合わせたものである。図4の文法欄202は、単語群を表すルール名、例えば、[MONTH]や[DAY]および特定の単語、例えば「を」や「再生」などを組み合わせた文法の具体例を、文法番号欄201と対応付けて示す。 FIG. 4 illustrates a grammar number and
図5は、音声認識に関わる単語群の評価情報210を例示する。図5では、ルール名欄211に単語群を表す名称がルール名として示され、表記欄212に各ルール名に対応する複数の単語が示される。図5の同音語・同意語欄213には、表記欄212に示された単語に対応する同音語(対応する単語の発声音が同じ単語)や同意語(対応する単語と発声音が異なるが意味が同じ単語)が記載される。 FIG. 5 illustrates the
図6は、音声認識が利用される利用目的に対応する、文法の評価情報220を例示する。「利用目的」とは、入力手段1に認識処理対象信号が入力されたときの、認識処理システム10のユーザ(以下、ユーザという。)が利用していたサービス、アプリケーションや出力手段2で出力していた表示内容が示す、認識処理結果情報を利用する利用目的である。例えば、ユーザがカーナビゲーションシステムを操作して、目的地を入力している場合は、「利用目的」は、図6の利用目的欄221の「目的地入力」となる。利用目的が「目的地入力」であるとき、対応する文法として、文法番号欄222の「2」が設定される。 FIG. 6 illustrates
次に、図4、5、6を参照して、認識制御手段5が行う認識処理結果情報の評価について説明する。認識制御手段5は、入力手段1に認識処理対象信号が入力されたときの利用目的を確認する。例えば、利用目的が「目的地入力」であれば、認識制御手段5は、図6の音声認識に関わる属性情報の利用目的に基づいて、認識処理結果情報の評価に適用すべき文法番号「2」を選択する。認識制御手段5は、図4の音声認識に関わる文法に基づいて、文法番号「2」に対応する文法定義を選択する。認識制御手段5は、図5の音声認識に関わる単語群に基づいて、文法番号「2」に関わる単語群を選択する。 Next, with reference to FIGS. 4, 5, and 6, evaluation of recognition processing result information performed by the
このように、認識制御手段5は、利用目的に基づいて、認識処理対象信号の認識結果の評価に用いる評価情報を選択する。そして、認識制御手段5は、選択された評価情報に基づいて、認識処理結果情報を評価する。すなわち、認識制御手段5は、音声認識エンジン#1の認識処理結果情報#1を、「目的地入力」に関わる文法番号「2」の文法定義と、文法定義に対応した特定の単語および単語群との適合度を評価すればよい。具体的には、認識制御手段5は、認識処理結果情報#1が、選択された文法定義、特定の単語および単語群と、完全一致するか否か、または含んでいるか否かを評価すればよい。 As described above, the recognition control means 5 selects evaluation information used for evaluating the recognition result of the recognition processing target signal based on the purpose of use. And the recognition control means 5 evaluates recognition process result information based on the selected evaluation information. That is, the recognition control means 5 uses the recognition processing
このとき、例えば、特定の分野や単語などの文法を定義しない音声認識エンジンの認識処理結果情報は、選択された評価情報に基づいて評価される。また、特定の分野や単語などの文法を定義して認識結果を出力する音声認識エンジンの認識結果情報も、選択された評価情報に基づいて、同様に評価される。 At this time, for example, recognition processing result information of a speech recognition engine that does not define a grammar such as a specific field or word is evaluated based on the selected evaluation information. The recognition result information of the speech recognition engine that defines the grammar of a specific field or word and outputs the recognition result is similarly evaluated based on the selected evaluation information.
したがって、認識制御手段5は、利用目的に基づいて選択された評価情報を使用して評価を行う。すなわち、特定の分野や単語などの文法を定義しない音声認識エンジンの認識処理結果情報は、利用目的に基づいて選択された評価情報を使用して効率的に評価される。また、特定の分野や単語などの文法を定義して認識結果を出力する音声認識エンジンの認識結果情報は、例えば、利用目的に基づいて選択された評価情報が、音声認識エンジンの文法定義と合致していなければ、低い評価となり、合致していれば、高い評価を得る可能性がある。 Therefore, the recognition control means 5 performs evaluation using the evaluation information selected based on the purpose of use. That is, recognition processing result information of a speech recognition engine that does not define a grammar such as a specific field or word is efficiently evaluated using evaluation information selected based on the purpose of use. The recognition result information of the speech recognition engine that defines the grammar of a specific field or word and outputs the recognition result is, for example, the evaluation information selected based on the purpose of use matches the grammar definition of the speech recognition engine. If it is not done, the evaluation is low, and if it matches, there is a possibility of obtaining a high evaluation.
そして、認識制御手段5は、認識処理結果情報の内、最も高い評価の認識処理結果情報を、出力手段2に出力する。あるいは、認識制御手段5は、認識処理結果情報の内、評価の上位から所定の順位までの認識処理結果情報を、出力手段2に出力してもよい。また、認識制御手段5は、認識処理結果情報の評価が所定の閾値に至らない場合や、所定の時間内で認識処理結果情報が送付されない場合には、認識処理結果なしとして、出力手段2に出力してもよい。 Then, the
このように、本実施形態の認識処理システム10は、入力手段1から入力された認識処理対象信号の処理属性を判断し、判断された処理属性に対応する認識エンジンを選択して、選択された認識エンジンに認識処理対象情報を送信して認識処理を行う。すなわち、本実施形態では、認識処理対象信号を予め記憶される処理属性に対応する認識エンジンを選択して認識処理を行うことができるので、認識処理対象の属性、分野やサービスが限定されない。 As described above, the
そして、認識処理システム10は、認識エンジンの認識処理結果情報を受信して、属性記憶手段3に記憶される属性情報に基づいて評価を行い、最も高い評価の認識処理結果情報を出力手段2に出力する。したがって、本実施形態では、例えば、特定の分野や単語などの文法を定義しない汎用の音声認識エンジンと、特定の分野や単語などの文法を定義して認識結果を出力する専用の音声認識エンジンの両方を選択して使用することができる。すなわち、本実施形態では、認識処理対象信号の処理属性に対応する認識エンジンを複数選択して認識処理を行い、認識処理結果を予め記憶される属性情報に基づいて評価するので、認識処理を効率的に行い、認識性能を向上することができる。 Then, the
したがって、本実施形態は、認識処理の属性、対象分野やサービスが限定されず、効率的に認識処理を行って認識性能を向上することが可能となる。 Therefore, in the present embodiment, the recognition process attributes, target fields, and services are not limited, and the recognition performance can be improved by efficiently performing the recognition process.
なお、本実施形態では、認識処理対象信号はマイク入力によるものとして説明したが、マイク入力に限定されない。例えば、カメラ入力でもよいし、スキャナ入力でもよいし、振動センサ入力でもよいし、タッチセンサでもよい。すなわち、認識処理対象信号は、認識処理システムの入力手段が備える入力デバイスから入力されるものであって、認識処理対象情報として取り扱えるものであればよい。 In the present embodiment, the recognition processing target signal is described as being based on microphone input, but is not limited to microphone input. For example, camera input, scanner input, vibration sensor input, or touch sensor may be used. That is, the recognition processing target signal may be input from an input device provided in the input unit of the recognition processing system and can be handled as recognition processing target information.
また、本実施形態では、マイクから入力された認識処理対象情報の処理属性は、音声認識として説明したが、マイクに対応する処理属性は音声認識に限定されない。例えば、マイクに対応する処理属性は、話者識別(発声した話者が特定の話者であるか否かを識別する)でもよいし、楽曲識別(発声された音、例えばハミングから楽曲を識別する)でもよいし、DTMF認識(Dual Tone Muti Frequency:プッシュ式電話などのプッシュボタンを押すたびに発信される音から、押されたプッシュボタンを識別する)でもよい。すなわち、認識処理対象情報は、認識処理システムの入力手段が備えるマイクから入力されたものであって、入力された認識処理対象信号を認識処理対象情報として取り扱えるものであればよい。 In the present embodiment, the processing attribute of the recognition processing target information input from the microphone has been described as speech recognition. However, the processing attribute corresponding to the microphone is not limited to speech recognition. For example, the processing attribute corresponding to the microphone may be speaker identification (identifying whether or not the speaker who uttered is a specific speaker) or music identification (identifying music from uttered sound, for example, humming). Or DTMF recognition (Dual Tone Muti Frequency: identifying a pushed push button from a sound transmitted each time a push button such as a push-type telephone is pushed). That is, the recognition processing target information may be input from a microphone included in the input unit of the recognition processing system and can handle the input recognition processing target signal as recognition processing target information.
また、本実施形態では、認識処理結果情報の評価は、音声認識のみの認識結果を評価するものとして説明したが、認識結果の評価は単一の認識結果の評価に限定されない。例えば、音声認識と話者識別の認識結果を併用して評価してもよい。すなわち、音声指令を受け付ける場合には、予め登録された話者の発声であるか否かを識別する話者識別の認識結果と、発声された指令を認識する音声認識の認識結果に基づいて、両者の認識結果を併用して評価してもよい。
また、認識処理対象情報がカメラによる画像である場合には、画像認識の認識結果として文字部分の位置が特定され、特定された部分に対応する文字認識の認識結果が評価してもよい。すなわち、認識結果の評価は、認識処理対象情報を認識処理した結果を併用して評価してもよい。In the present embodiment, the evaluation of the recognition processing result information has been described as evaluating the recognition result of only speech recognition. However, the evaluation of the recognition result is not limited to the evaluation of a single recognition result. For example, speech recognition and speaker identification recognition results may be used in combination for evaluation. That is, when accepting a voice command, based on a recognition result of speaker identification for identifying whether or not the voice of a speaker registered in advance and a recognition result of voice recognition for recognizing the spoken command, You may evaluate using both recognition results together.
Further, when the recognition processing target information is an image by a camera, the position of the character part may be specified as the recognition result of the image recognition, and the recognition result of the character recognition corresponding to the specified part may be evaluated. In other words, the recognition result may be evaluated by using the result of recognition processing of the recognition processing target information.
また、本実施形態では、認識処理対象情報の属性の異なる認識処理結果情報が併用され、評価されてもよい。例えば、予め記憶された個人を識別する際には、音声識別と画像識別が併用されてよい。すなわち、マイクまたは通話回線からの音声信号が音声識別された識別結果と、カメラからの映像信号が画像識別された識別結果が併用されて、個人識別の評価が行われてもよい。 In the present embodiment, recognition process result information having different attributes of the recognition process target information may be used together and evaluated. For example, when identifying an individual stored in advance, voice identification and image identification may be used in combination. In other words, the identification result obtained by voice identification of the audio signal from the microphone or the telephone line and the identification result obtained by image identification of the video signal from the camera may be used in combination to evaluate personal identification.
また、本実施形態では、認識処理結果情報の評価に関わる属性情報は、音声認識に関わる評価に関わる属性情報を固定的なものとして説明したが、認識処理の評価に関わる属性情報は固定的なものに限定されない。 In the present embodiment, the attribute information related to the evaluation of the recognition processing result information has been described as the fixed attribute information related to the evaluation related to speech recognition. However, the attribute information related to the evaluation of the recognition processing is fixed. It is not limited to things.
例えば、ユーザが利用しているサービスやアプリケーションなどに基づいて、評価に関わる属性情報は取得されて、更新されてもよい。つまり、ユーザがカーナビゲーションシステムを操作して「目的地入力」しているときに表示されている地図情報に基づいて、表示されている地図に関わる地名情報やランドマーク情報などが取得されて、[LOCATION](図5参照)に対応する単語群として評価情報に追加されてもよい。 For example, the attribute information related to the evaluation may be acquired and updated based on the service or application used by the user. In other words, based on the map information displayed when the user operates the car navigation system and performs “destination input”, the place name information and landmark information related to the displayed map are acquired, It may be added to the evaluation information as a word group corresponding to [LOCATION] (see FIG. 5).
また、カーナビゲーションシステムがCD(登録商標、Compact Disk:ディスク規格の1つ)プレーヤ機能を備える場合であれば、ユーザがCDプレーヤを操作しているときに、CDに記憶された楽曲名やアーティスト名が取得されて、[MUSIC](図5参照)に対応する単語群として評価情報に追加されてもよい。すなわち、認識処理結果情報の評価に関わる属性情報は、予め登録された固定的なものでもよく、ユーザが使用するサービスやアプリケーションなどが認識処理結果情報を利用する利用目的に基づいて取得される情報であって、評価に関わる属性情報として追加できる情報でもよい。 Also, if the car navigation system has a CD (registered trademark, one of the disc standards) player function, when the user operates the CD player, the music title and artist stored on the CD are displayed. A name may be acquired and added to the evaluation information as a word group corresponding to [MUSIC] (see FIG. 5). That is, the attribute information related to the evaluation of the recognition processing result information may be fixed information registered in advance, and is acquired based on the purpose of use of the recognition processing result information by the service or application used by the user. However, it may be information that can be added as attribute information related to evaluation.
また、本実施形態では、認識処理結果情報の評価結果は、評価に基づいて、最も高い評価の認識処理結果情報を出力手段に出力すると説明したが、認識処理結果情報は最も高い評価結果には限定されない。例えば、認識制御手段は、認識処理結果情報の内、評価の上位から所定の順位までの認識処理結果情報を出力してもよい。また、認識制御手段は、認識処理結果情報の評価が所定の閾値以上の認識処理結果情報を出力してもよい。また、認識制御手段は、予め配布先情報に設定された優先度に基づいて、優先度の高い認識エンジンの認識処理結果情報を出力してもよい。また、ユーザが使用するサービスやアプリケーションに基づいて、認識処理結果情報の評価結果の出力方法は適宜変更されてもよい。 In the present embodiment, the evaluation result of the recognition process result information has been described as outputting the highest evaluation recognition process result information to the output unit based on the evaluation. However, the recognition process result information is the highest evaluation result. It is not limited. For example, the recognition control means may output the recognition process result information from the top of the evaluation to a predetermined rank in the recognition process result information. The recognition control means may output recognition process result information whose evaluation of the recognition process result information is equal to or greater than a predetermined threshold. Further, the recognition control means may output recognition process result information of a recognition engine having a high priority based on a priority set in advance in the distribution destination information. Moreover, based on the service and application which a user uses, the output method of the evaluation result of recognition process result information may be changed suitably.
また、本実施形態では、認識処理手段が備える認識エンジンは、固定的ではない。例えば、認識処理結果情報の評価結果に基づいて、ユーザは認識エンジンの評価や優先度付けを行って配信先情報に記憶させてもよい。認識制御手段は、予め設定された評価や優先度に基づいて認識エンジンを適宜選択すればよい。すなわち、予め設定された評価値が所定の閾値に至らない認識エンジンは認識処理の選択対象から外されてもよい。認識エンジンは予め設定された優先度に基づいて選択されてもよい。認識エンジンは新たに追加されてもよい。また、認識制御手段は、認識エンジンとの接続状態または認識エンジンの稼働状態の確認に基づいて、認識エンジンを選択してもよい。すなわち、認識エンジンは、認識処理の処理属性と配信先情報が明示され、認識処理対象情報を入力して認識処理結果情報を出力できるものであればよい。
(第2の実施形態)
本発明において、図1に示された本実施形態の認識処理システム10における入力手段1、出力手段2、配信手段4は必須ではない。すなわち、認識制御手段5が、認識処理対象情報を入力されて、外部の属性記憶手段3に記憶される属性情報に基づいて、外部の認識処理手段9が備える認識エンジン9−1〜nに送信して認識処理結果情報を取得して評価を行えればよい。したがって、本発明に必須の構成は、認識制御手段5のみである。In the present embodiment, the recognition engine included in the recognition processing unit is not fixed. For example, based on the evaluation result of the recognition processing result information, the user may perform recognition engine evaluation and prioritization and store the information in the distribution destination information. The recognition control means may select a recognition engine as appropriate based on a preset evaluation or priority. That is, a recognition engine in which a preset evaluation value does not reach a predetermined threshold value may be excluded from selection targets for recognition processing. The recognition engine may be selected based on a preset priority. A recognition engine may be newly added. Further, the recognition control means may select the recognition engine based on confirmation of a connection state with the recognition engine or an operation state of the recognition engine. That is, the recognition engine only needs to be able to output the recognition process result information by inputting the recognition process target information by specifying the process attribute of the recognition process and the delivery destination information.
(Second Embodiment)
In the present invention, the input means 1, the output means 2, and the distribution means 4 in the
図7は、本発明の最小の構成を備える、第2の実施形態の認識処理制御装置20の構成例を示すブロック図である。 FIG. 7 is a block diagram illustrating a configuration example of the recognition
認識処理制御装置20は、認識制御手段21を備える。認識制御手段21は、情報送信部22と、結果受信部23と評価結果出力部24を備える。情報送信部22は、認識処理を行う認識エンジンを指定するエンジン指定情報に基づいて、認識処理対象情報を送信する。結果受信部23は、認識エンジンから認識処理結果情報を受信する。評価結果出力部24は、所定の評価情報に基づいて認識処理結果情報を評価し、評価結果を出力する。 The recognition
なお、本実施形態では、認識処理結果情報の評価に基づいて、評価結果出力部は、最も高い評価の評価結果を出力すればよい。あるいは、評価結果出力部は、予め設定された条件を満足する評価結果を出力してもよい。例えば、予め設定された閾値を超える評価の評価結果が出力されてもよい。 In the present embodiment, the evaluation result output unit may output the evaluation result with the highest evaluation based on the evaluation of the recognition processing result information. Alternatively, the evaluation result output unit may output an evaluation result that satisfies a preset condition. For example, an evaluation result of evaluation exceeding a preset threshold value may be output.
また、本実施形態では、認識処理対象情報の属性は、1種類であってもよいし、複数種類であってもよい。すなわち、本実施形態は、認識処理対象情報の属性に基づいて、認識エンジンは選択されてもよい。本実施形態は、認識処理対象情報の属性に基づいて、評価情報は選択されてもよい。本実施形態は、複数の属性の異なる認識エンジンの結果情報を併用して評価してもよいし、同一の属性の認識エンジンの結果情報を併用して評価してもよい。例えば、話者識別エンジンの結果情報と顔認証の結果情報を併用して個人識別が評価されてもよいし、日本語音声認識エンジンの結果情報と英語音声認識エンジンの結果情報を併用して数字認識が評価されてもよい。 In the present embodiment, the recognition process target information may have one or more attributes. That is, in this embodiment, the recognition engine may be selected based on the attribute of the recognition processing target information. In the present embodiment, the evaluation information may be selected based on the attribute of the recognition process target information. In the present embodiment, the result information of recognition engines having different attributes may be used together for evaluation, or the result information of recognition engines having the same attribute may be used for evaluation. For example, personal identification may be evaluated using both the result information of the speaker identification engine and the result information of the face recognition, or a number using the result information of the Japanese speech recognition engine and the result information of the English speech recognition engine. Recognition may be evaluated.
また、本実施形態では、評価結果の利用目的に基づいて、評価情報は選択されてもよい。すなわち、例えば、ユーザが利用するサービスやアプリケーションなどが評価結果を利用する利用目的に対応して評価情報が選択され、選択された評価情報に基づいて、結果情報が評価されてもよい。
(第3の実施形態)
本発明の第3の実施形態について説明する。図8は、本発明の第3の実施形態の認識処理システムの構成例を示す全体構成図である。図8の第3の実施形態は、認識処理システム11に履歴記憶手段6が追加されているところが、第1の実施形態と相違する。よって、第1の実施形態と同一の構成要素には同一の参照数字を付記して、その説明を省略する。In the present embodiment, the evaluation information may be selected based on the use purpose of the evaluation result. That is, for example, evaluation information may be selected corresponding to the purpose of use of the evaluation result by a service or application used by the user, and the result information may be evaluated based on the selected evaluation information.
(Third embodiment)
A third embodiment of the present invention will be described. FIG. 8 is an overall configuration diagram showing a configuration example of a recognition processing system according to the third embodiment of the present invention. The third embodiment of FIG. 8 is different from the first embodiment in that a
図8を参照して、本実施形態の認識処理システム11の構成について説明する。履歴記憶手段6は、認識処理に関わる履歴情報を記憶するとともに、認識処理対象情報、配信先認識対象情報と評価結果を記憶する。 With reference to FIG. 8, the structure of the
図8を参照して、本実施形態の認識処理システム11の動作について説明する。入力手段1は、認識処理対象信号を入力して、認識処理対象情報して認識制御手段5に送る。認識制御手段5は、入力手段1の種類と属性記憶手段3に予め記憶される属性情報に基づいて、認識処理対象情報の処理属性を判断する。 With reference to FIG. 8, the operation of the
具体的には、認識制御手段5は、例えば、入力手段1がカメラであるとき、カメラ入力に関わる処理属性を属性記憶手段3から取得する。属性記憶手段3には、カメラ入力に関わる処理属性として、標識認識が記憶されているものとする。認識制御手段5は、属性記憶手段3のカメラ入力に関わる処理属性に基づいて、処理属性を標識認識と判断する。すなわち、認識制御手段5は、入力手段1からの認識処理対象情報の処理属性を標識認識と判断する。 Specifically, for example, when the
認識制御手段5は、認識処理対象情報の処理属性に基づいて、属性記憶手段3に記憶される配信先情報を取得する。 The
具体的には、認識制御手段5は、認識処理対象情報の処理属性が標識認識であることから、標識認識に関わる配信先情報を、属性記憶手段3から取得する。そして、認識制御手段5は、標識認識に関わる配信先情報に基づいて、認識処理対象情報の配信先である認識エンジンを、認識エンジン9−1〜nの中から選定する。例えば、認識制御手段5は、標識認識の処理属性に対応する認識エンジン9−d〜h(dは1以上で、n以下の整数、hはd以上で、n以下の整数)を選定する。 Specifically, since the processing attribute of the recognition process target information is sign recognition, the recognition control means 5 acquires distribution destination information related to sign recognition from the attribute storage means 3. And the recognition control means 5 selects the recognition engine which is a delivery destination of recognition process target information from the recognition engines 9-1 to n based on the delivery destination information related to the sign recognition. For example, the recognition control means 5 selects the recognition engines 9-d to h (d is 1 or more and an integer of n or less, h is an integer of d or more and n or less) corresponding to the processing attribute of the sign recognition.
認識制御手段5は、認識処理対象情報から、選定された認識エンジン9−d〜hに対応する配信先認識処理対象情報#d〜#hを作成する。すなわち、認識制御手段5は、属性記憶手段3に記憶される配信先情報に基づいて、認識処理対象情報が認識エンジン9−d〜hに対応するように、それぞれ、配信先認識処理対象情報#d〜#hに変換する。 The recognition control means 5 creates distribution destination recognition process target information #d to #h corresponding to the selected recognition engine 9-d to h from the recognition process target information. That is, the recognition control means 5 is based on the delivery destination information stored in the attribute storage means 3 so that the recognition process target information corresponds to the recognition engines 9-d to h, respectively. Convert to d to #h.
認識制御手段5は、各配信先向けに変換された配信先認識処理対象情報#d〜#hを、配信手段4を経由して認識エンジン9−d〜hに送信する。すなわち、認識制御手段5は、配信手段4を制御して、配信先認識処理対象情報#d〜#hを、それぞれ、認識エンジン9−d〜hに送信する。 The
このように、認識処理システム11の入力手段1に入力された認識処理対象信号は、配信先認識処理対象情報#d〜#hに変換されて、認識エンジン9−d〜hに送信される。 As described above, the recognition processing target signal input to the
認識エンジン9−d〜hは、送信された配信先認識処理対象情報#d〜#hを受信して認識処理を行う。認識エンジン9−d〜hは、認識処理結果を認識処理結果情報#d〜#hとして、配信手段4に送付する。 The recognition engines 9-d to h receive the transmitted delivery destination recognition process target information #d to #h and perform a recognition process. The recognition engines 9-d to h send the recognition process results to the
配信手段4は、送付された認識処理結果情報#d〜#hを認識制御手段5に送る。認識制御手段5は、送られた認識処理結果情報#d〜#hを、属性記憶手段3に記憶される属性情報に基づいて評価する。例えば、認識制御手段5は、標識認識に関わる属性情報に基づいて、認識処理結果情報#d〜#hを評価する。 The
そして、認識制御手段5は、評価に基づいて、認識処理結果情報#d〜#hの内、最も高い評価の認識処理結果情報、例えば認識処理結果情報#fを出力手段2に出力する。 Based on the evaluation, the
このように、本実施形態の認識システム11は、入力手段1に入力された認識処理対象信号の処理属性を判断し、判断された処理属性に対応する認識エンジンを選択して、選択された認識エンジン9−d〜hに認識処理対象情報を送信して認識処理を行う。すなわち、本実施形態では、認識処理対象信号を予め記憶される処理属性に対応する認識エンジンを選択して認識処理を行うことができるので、認識処理対象の属性、分野やサービスが限定されない。 As described above, the
認識処理システム11は、認識エンジン9−d〜hの認識処理結果情報を受信して、属性記憶手段3に記憶される属性情報に基づいて評価し、最も高い評価の認識処理結果情報を出力手段2に出力する。 The
履歴記憶手段6は、認識処理に関わる履歴情報を記憶する。例えば、履歴記憶手段6は、認識処理対象情報、認識処理結果情報とその評価結果を履歴情報として記憶する。認識制御手段5は、評価結果の履歴情報に基づいて、各処理属性に対応する認識エンジンを選定する際の優先度を設定する。例えば、認識制御手段5は、音声認識に関わる認識エンジンの「目的地入力」に対する履歴情報に基づいて優先度を設定する。認識制御手段5は、設定された優先度を、属性記憶手段3の配信先情報として記憶させる。認識制御手段5は、属性記憶手段3に記憶される配信先情報の優先度に基づいて、認識処理対象情報の配信先選定を行ってもよい。また、認識制御手段5は、配信先情報に記憶される優先度に基づいて認識処理結果情報の評価を行ってもよい。 The history storage means 6 stores history information related to recognition processing. For example, the
また、ユーザは、履歴記憶手段6に記憶される認識処理対象情報、認識処理結果情報および評価結果を出力手段2に出力させて、認識処理対象情報に対する認識処理結果情報とその評価結果の妥当性を確認することができる。そして、ユーザは、評価結果の妥当性の確認に基づいて、認識エンジンの優先度を変更することができる。本実施形態は、認識処理に関わる履歴情報に基づいて、認識エンジンの評価に対応する優先度を用いて認識処理を行うことで、認識処理の効率化と精度の向上を図ることができる。 Further, the user causes the
認識処理結果情報の評価については、標識認識を例として説明する。図9〜11は、本実施形態の認識処理システム11の属性情報を例示したものである。図2、3と図9〜11を参照して、本実施形態の動作について説明する。 The evaluation of the recognition processing result information will be described by taking the sign recognition as an example. 9 to 11 illustrate the attribute information of the
認識制御手段5は、入力手段1に入力された認識処理対象信号の処理属性を判断する。具体的には、認識制御手段5は、属性記憶手段3に記憶される認識処理に関わる処理属性情報100(図2参照)から、入力手段1に入力された認識処理対象信号の処理属性を判断する。例えば、認識制御手段5は、入力手段1に入力された認識処理対象信号が、カメラ入力であるとき、カメラ入力についての処理属性を、属性記憶手段3から取得する。認識制御手段5は、属性記憶手段3に予め記憶される認識処理の処理属性情報100を参照する。認識制御手段5は、入力デバイス欄101の「カメラ」に関わる処理属性欄102に記載されている「標識認識」が処理属性であると判断する。カメラ入力に関わる処理属性は、標識認識に限定されない。カメラ入力に関わる処理属性は、「画像認識」、「顔認識」、「文字認識」、「バーコード認識」などがあげられるが、ここでは、標識認識として説明する。 The
認識制御手段5は、入力手段1に入力された認識処理対象信号の処理属性の判断に基づいて、属性記憶手段3に記憶される配信先情報を取得する。具体的には、認識制御手段5は、認識処理対象信号の処理属性が、例えば、「標識認識」であるとき、「標識認識」に関わる配信先情報を、属性記憶手段3から取得する。認識制御手段5は、属性記憶手段3に予め記憶される認識処理の配信先情報110(図3参照)を参照して、処理属性欄111の「標識認識」に関わる配信先欄112、入力条件欄113などに記憶される配信先情報を取得する。 The
認識制御手段5は、配信先情報に基づいて、認識処理対象情報の配信先を選定する。具体的には、認識制御手段5は、例えば、処理属性が「標識認識」であれば、属性記憶手段3に予め記憶される認識処理の配信先情報110(図3参照)を参照して、処理属性欄111の「標識認識」に関わる配信先欄112、入力条件欄113などの配信先情報に基づいて、標識認識エンジンを選択する。例えば、処理属性が「音声認識」であれば、認識制御手段5は、「音声認識」に関わる配信先情報に基づいて、音声認識エンジンを選択すればよい。 The
認識制御手段5は、選択された認識処理エンジンに対応する配信先情報に基づいて、認識処理対象情報から、配信先認識処理対象情報を作成する。具体的には、認識制御手段5は、例えば、選択された標識認識エンジン#1であれば、標識認識エンジン#1の入力条件欄113などに基づいて、認識処理対象情報を、標識認識エンジン#1の入力条件に合致するように変換する。すなわち、認識制御手段5は、認識処理対象情報を、標識認識エンジン#1が入力を受け付けられるように、例えば、情報のデータ形式やデータ長などを変換して、配信先認識処理対象情報#1を作成する。 The recognition control means 5 creates delivery destination recognition processing target information from the recognition processing target information based on the delivery destination information corresponding to the selected recognition processing engine. Specifically, for example, if the selected sign
認識制御手段5は、選択された認識エンジンに対応する配信先情報に基づいて、変換された配信先認識対象情報を、配信先である認識エンジンに配信手段4を経由して送信する。すなわち、認識制御手段5は、例えば、配信先認識処理情報#1を、配信先である標識認識エンジン#1に配信手段4を経由して送信する。 The recognition control means 5 transmits the converted delivery destination recognition target information to the recognition engine that is the delivery destination via the delivery means 4 based on the delivery destination information corresponding to the selected recognition engine. That is, the
認識エンジンは、配信された配信先認識処理対象情報を受け付けて、認識処理を行った認識処理結果情報を配信手段4に送付する。すなわち、本実施形態では、認識処理対象信号を予め記憶される処理属性に対応する認識エンジンを選択して認識処理を行うことができるので、認識処理対象の属性、対象分野やサービスは限定されない。 The recognition engine receives the distributed destination recognition processing target information and sends the recognition processing result information obtained by the recognition processing to the distribution means 4. That is, in the present embodiment, the recognition process target signal can be selected and the recognition process corresponding to the processing attribute stored in advance can be selected, so that the recognition process target attribute, target field, and service are not limited.
配信手段4は、送付された認識処理結果情報を認識制御手段5に送る。認識制御手段5は、送られた認識処理結果情報を、属性記憶手段3に記憶される属性情報に基づいて評価する。すなわち、認識制御手段5は、例えば、標識認識エンジン#1からの認識処理結果情報#1を、標識認識に関わる属性情報に基づいて評価する。 The distribution means 4 sends the sent recognition processing result information to the recognition control means 5. The
認識処理結果情報の評価については、標識認識を例として説明する。図9、10、11は、本実施形態の認識処理システムの属性記憶手段3に記憶される標識認識の評価に関わる属性情報を例示したものである。図9、10、11を参照して、各図の構成について説明する。 The evaluation of the recognition processing result information will be described by taking the sign recognition as an example. 9, 10, and 11 illustrate attribute information related to the evaluation of the marker recognition stored in the
図9は、標識認識に関わる文法番号と文法の評価情報300を例示する。図9の文法欄302は、単語群を表すルール名、例えば、[KISEI]や[HOJO]などの組み合わせた文法の具体例を、文法番号欄301と対応付けて示す。[KISEI]とは、速度や重量、高さなどを規制する規制標識群を示すルール名である。[HOJO]とは、規制標識や案内標識、注意標識を補助する補助標識群を示すルール名である。例えば、補助標識は、規制区間の始まりや解除、時間規制の時刻などを示すものである。 FIG. 9 illustrates a grammar number and
図10は、標識認識に関わる単語群の評価情報310を例示する。図10では、ルール名欄311に単語群を表す名称がルール名として示され、表記欄312に各ルール名に対応する複数の単語が示される。そして、図10の同音語・同意語欄313には、表記欄312に示された単語に対応する同音語(対応する単語の発声音が同じ単語)や同意語(対応する単語と発声音が異なるが意味が同じ単語)が記載される。 FIG. 10 illustrates the
図11は、標識認識が利用される利用目的に対応する、文法の評価情報320を例示する。「利用目的」とは、入力手段1に認識処理対象信号が入力されたときに、認識処理システム11のユーザが利用していたサービスや出力手段2で出力していた内容を示す。例えば、ユーザがカーナビゲーションシステムを操作して、道路の規制確認をしている場合は、図11の利用目的欄321が、「規制確認」となる。利用目的が「規制確認」であるとき、対応する文法は、文法番号欄322の「5」、「6」、「7」が設定される。 FIG. 11 illustrates
次に、図9、10、11を参照して、認識制御手段5が行う認識処理結果情報の評価について説明する。認識制御手段5は、入力手段1に認識処理対象信号が入力されたときの利用目的を確認する。例えば、利用目的が「規制確認」であれば、認識制御手段5は、図11の標識認識に関わる属性情報の利用目的に基づいて、認識処理結果情報の評価に適用すべき文法番号「5」、「6」、「7」を選択する。認識制御手段5は、図9の標識認識に関わる文法に基づいて、文法番号「5」、「6」、「7」に対応する文法定義を選択する。認識制御手段5は、図10の標識認識に関わる単語群に基づいて、文法番号「5」、「6」、「7」に関わる単語群を選択する。 Next, the evaluation of the recognition process result information performed by the
このように、認識制御手段5は、利用目的に基づいて、認識処理対象信号の認識結果の評価に用いる評価情報を選択する。そして、認識制御手段5は、選択された評価情報に基づいて、認識処理結果情報を評価する。すなわち、認識制御手段5は、標識認識エンジン#1の認識処理結果情報#1を、「規制確認」に関わる文法番号「5」、「6」、「7」の文法定義と、文法定義に対応した特定の単語および単語群との適合度を評価すればよい。例えば、標識認識の結果である認識処理結果情報#1は、道路規制に関わる標識であるか否か、規制標識の中での種別と規制、補助標識の有無と補助標識の中での種別と規制などを示す単語および単語群などが内容として含まれる。よって、認識制御手段5は、認識処理結果情報#1が、選択された「規制確認」に関わる文法定義、特定の単語および単語群と、完全一致するか否か、または含んでいるか否かを評価すればよい。 As described above, the recognition control means 5 selects evaluation information used for evaluating the recognition result of the recognition processing target signal based on the purpose of use. And the recognition control means 5 evaluates recognition process result information based on the selected evaluation information. That is, the recognition control means 5 corresponds to the recognition processing
そして、認識制御手段5は、認識処理結果情報の内、最も高い評価の認識処理結果情報を、出力手段2に出力する。あるいは、認識制御手段5は、認識処理結果情報の内、評価の上位から所定の順位までの認識処理結果情報を、出力手段2に出力してもよい。また、認識制御手段5は、認識処理結果情報の評価が所定の閾値に至らない場合や、所定の時間内で認識処理結果情報が送付されない場合には、認識処理結果なしとして、出力手段2に出力してもよい。 Then, the
このように、本実施形態の認識処理システム11は、入力手段1から入力された認識処理対象信号の処理属性を判断し、判断された処理属性に対応する認識エンジンをその優先度に基づいて選択して、選択された認識エンジンに認識処理対象情報を送信して認識処理を行う。すなわち、本実施形態では、認識処理対象信号を予め記憶される処理属性に対応する認識エンジンを選択して認識処理を行うことができるので、認識処理対象の属性、分野やサービスが限定されない。 As described above, the
そして、認識処理システム11は、認識エンジンの認識処理結果情報を受信して、属性記憶手段3に記憶される属性情報に基づいて評価を行い、最も高い評価の認識処理結果情報を出力手段2に出力する。認識制御手段5は、認識処理対象情報と認識処理結果情報および評価結果を履歴記憶手段6に記憶させる。さら、認識制御手段5は、履歴記憶手段6の履歴情報に基づいて、認識エンジンの優先度を設定する。したがって、本実施形態では、認識処理対象信号の処理属性に対応する認識エンジンを優先度に基づいて複数選択して認識処理を行い、認識処理結果を予め記憶される属性情報に基づいて評価するので、認識処理を効率的に行い、認識性能を向上することができる。 The
したがって、本実施形態は、第1の実施形態と同様の効果を得るとともに、認識処理に関わる認識エンジンを効果的に選択することができる効果が得られる。 Therefore, this embodiment can obtain the same effect as the first embodiment and the effect that the recognition engine related to the recognition process can be effectively selected.
なお、本実施形態では、認識制御手段は、履歴記憶手段に記憶される履歴情報に基づいて優先度を設定する。例えば、認識制御手段は、認識処理結果情報の評価が高い認識エンジンの優先度を高く設定し、認識処理結果情報の評価が低い認識エンジンの優先度を低く設定する。認識処理システムのユーザは、履歴記憶手段に記憶される履歴情報に基づいて、評価結果の妥当性を確認し、設定された優先度を変更することができる。したがって、本実施形態では、設定された優先度に基づいて、認識処理対象情報に適合した認識エンジンを効率的に選択して、認識処理の精度の向上を図ることができる。 In the present embodiment, the recognition control unit sets the priority based on the history information stored in the history storage unit. For example, the recognition control unit sets the priority of a recognition engine having a high evaluation of recognition processing result information to a high priority, and sets the priority of a recognition engine having a low evaluation of recognition processing result information to a low. The user of the recognition processing system can confirm the validity of the evaluation result based on the history information stored in the history storage means, and can change the set priority. Therefore, in the present embodiment, it is possible to efficiently select a recognition engine that is suitable for the recognition processing target information based on the set priority and improve the accuracy of the recognition processing.
なお、本実施形態では、認識処理対象信号はカメラ入力によるものとして説明したが、カメラ入力に限定されない。例えば、マイク入力でもよいし、スキャナ入力でもよいし、振動センサ入力でもよいし、タッチセンサでもよい。すなわち、認識処理対象信号は、認識処理システムの入力手段が備える入力デバイスから入力されるものであって、認識処理対象情報として取り扱えるものであればよい。 In the present embodiment, the recognition process target signal is described as being based on camera input, but is not limited to camera input. For example, a microphone input, a scanner input, a vibration sensor input, or a touch sensor may be used. That is, the recognition processing target signal may be input from an input device provided in the input unit of the recognition processing system and can be handled as recognition processing target information.
また、本実施形態では、カメラから入力された認識処理対象信号の処理属性は標識認識として説明したが、カメラに対応する処理属性は標識認識に限定されない。例えば、カメラに対応する処理属性は、路面表示識別でもよいし、前方車両の車両番号認識でもよい。すなわち、認識処理システムの入力手段が備えるカメラから入力されるものであって、認識処理対象情報として取り扱えるものであればよい。 In the present embodiment, the processing attribute of the recognition processing target signal input from the camera has been described as the sign recognition, but the processing attribute corresponding to the camera is not limited to the sign recognition. For example, the processing attribute corresponding to the camera may be road surface display identification or vehicle number recognition of the preceding vehicle. In other words, it may be input from a camera included in the input unit of the recognition processing system and can be handled as recognition processing target information.
また、本実施形態では、認識処理結果情報の評価は、標識認識のみの認識結果を評価するものとして説明したが、認識結果の評価は単一の認識結果の評価に限定されない。例えば、標識認識と文字認識の認識結果を併用して評価してもよい。すなわち、案内板の標識認識の場合には、案内板であるか否かを識別する標識認識の認識結果と、案内板に記載された文字を識別する文字認識の認識結果に基づいて、両者の認識結果を併用して評価してもよい。また、認識処理対象情報がカメラによる画像である場合には、画像処理の処理結果として車両番号部分の位置が特定され、特定された車両番号部分に対応する文字認識の認識結果が評価されてもよい。すなわち、認識結果の評価は、認識処理対象情報を認識処理した結果を併用して評価してもよい。 In this embodiment, the evaluation of the recognition processing result information has been described as evaluating the recognition result of only the label recognition, but the evaluation of the recognition result is not limited to the evaluation of a single recognition result. For example, the recognition result of the marker recognition and the character recognition may be evaluated in combination. That is, in the case of the sign recognition of the guide plate, based on the recognition result of the sign recognition for identifying whether it is a guide plate and the recognition result of the character recognition for identifying the character described on the guide plate, You may evaluate using a recognition result together. Further, when the recognition processing target information is an image from a camera, the position of the vehicle number portion is specified as the processing result of the image processing, and the recognition result of character recognition corresponding to the specified vehicle number portion is evaluated. Good. In other words, the recognition result may be evaluated by using the result of recognition processing of the recognition processing target information.
また、本実施形態では、認識処理結果情報の評価に関わる属性情報は、標識認識に関わる評価に関わる属性情報を固定的なものとして説明したが、認識処理の評価に関わる属性情報は固定的なものに限定されない。例えば、ユーザが利用しているサービスやアプリケーションなどが認識処理結果情報を使用する利用目的に基づいて、評価に関わる属性情報は取得されて、更新されてもよい。つまり、ユーザがカーナビゲーションシステムを操作して「目的地入力」しているときに表示されている地図情報に基づいて、表示されている地図に関わる地名情報やランドマーク情報、道路名称などが取得されて、案内標識情報の[ANNAI](図10参照)に対応する単語群として評価情報に追加され選択されてもよい。すなわち、認識処理結果情報の評価に関わる属性情報は、予め登録された固定的なものでもよく、ユーザが使用するサービスやアプリケーションなどに基づいて取得される情報であって、評価に関わる属性情報として追加され選択できる情報でもよい。 In the present embodiment, the attribute information related to the evaluation of the recognition process result information is described as fixed attribute information related to the evaluation related to the marker recognition. However, the attribute information related to the evaluation of the recognition process is fixed. It is not limited to things. For example, the attribute information related to the evaluation may be acquired and updated based on the purpose of use in which the service or application used by the user uses the recognition processing result information. In other words, based on the map information that is displayed when the user operates the car navigation system and performs “input destination”, the location name information, landmark information, road name, etc. related to the displayed map are acquired. Then, it may be selected by being added to the evaluation information as a word group corresponding to [ANNNAI] (see FIG. 10) of the guide sign information. In other words, the attribute information related to the evaluation of the recognition processing result information may be fixed information registered in advance, and is acquired based on the service or application used by the user, and is attribute information related to the evaluation. It may be information that can be added and selected.
また、本実施形態では、認識処理結果情報の評価結果は、評価に基づいて、最も高い評価の認識処理結果情報を出力手段に出力すると説明したが、認識処理結果情報は最も高い評価結果には限定されない。例えば、予め設定された閾値以上の評価の情報処理結果情報を出力手段に出力してもよい。また、予め設定された数の情報処理結果情報を評価の高い順から選定して出力手段に出力してもよい。また、認識制御手段は、予め配布先情報に記憶された優先度に基づいて、優先度の高い認識エンジンの認識処理結果情報を出力してもよい。ユーザが使用するアプリケーションやサービスに基づいて、認識処理結果情報の評価結果の出力方法は適宜変更されてもよい。 In the present embodiment, the evaluation result of the recognition process result information has been described as outputting the highest evaluation recognition process result information to the output unit based on the evaluation. However, the recognition process result information is the highest evaluation result. It is not limited. For example, information processing result information of an evaluation equal to or higher than a preset threshold value may be output to the output unit. Alternatively, a preset number of information processing result information may be selected from the highest evaluation order and output to the output means. Further, the recognition control means may output recognition process result information of a recognition engine having a high priority based on the priority stored in advance in the distribution destination information. Based on the application or service used by the user, the output method of the evaluation result of the recognition processing result information may be changed as appropriate.
また、本実施形態では、認識処理手段が備える認識エンジンは、固定的ではない。例えば、認識処理結果情報の評価結果に基づいて、ユーザは認識エンジンの評価を行って配信先情報に記憶させてもよい。認識制御手段は、配信先情報に基づいて予め設定された評価の閾値に至らない認識エンジンを認識処理の選択対象から外してもよい。認識エンジンは新たに追加されてもよい。また、認識制御手段は、認識エンジンとの接続状態または認識エンジンの稼働状態の確認に基づいて、認識エンジンを選択してもよい。すなわち、認識エンジンは、認識処理の処理属性と配信先情報が明示され、認識処理対象情報を入力して認識処理結果情報を出力できるものであればよい。
(第4の実施形態)
本発明の第4の実施形態について説明する。図12は、本発明の第4の実施形態の認識処理システム12の構成例を示す全体構成図である。図12を参照して、本実施形態の認識処理システム12の構成について説明する。In the present embodiment, the recognition engine included in the recognition processing unit is not fixed. For example, based on the evaluation result of the recognition process result information, the user may evaluate the recognition engine and store it in the delivery destination information. The recognition control means may exclude a recognition engine that does not reach a preset evaluation threshold based on the distribution destination information from the selection target of the recognition process. A recognition engine may be newly added. Further, the recognition control means may select the recognition engine based on confirmation of a connection state with the recognition engine or an operation state of the recognition engine. That is, the recognition engine only needs to be able to output the recognition process result information by inputting the recognition process target information by specifying the process attribute of the recognition process and the delivery destination information.
(Fourth embodiment)
A fourth embodiment of the present invention will be described. FIG. 12 is an overall configuration diagram illustrating a configuration example of the
認識処理システム12は、認識処理制御装置30と通信処理装置40を備える。認識処理システム12は、ネットワークを介して、認識処理手段9が備える認識エンジン9−1〜nと接続される。認識処理制御装置30は、入力部31、出力部32、属性記憶部33、通信部34、認識制御部35と認識エンジン91を備える。通信処理装置40は、通信部41、43と通信制御部42を備える。
入力部31は、認識処理を行うための認識処理対象信号の入力と、登録および操作設定を受け付ける。出力部32は、認識処理結果の出力と、登録および操作設定に関わる表示および出力を行う。属性記憶部33は、認識処理対象信号を判断するための処理属性情報、認識処理結果情報を評価するための評価情報と、認識処理手段9が備える認識エンジン9−1〜n、91に関わる配信先情報を含む属性情報を記憶する。通信部34は、通信処理装置40を経由して認識処理手段9の備える認識エンジン9−1〜nに接続される。また、通信部34は、認識処理制御装置30の内部の認識エンジン91に接続される。The
The
通信処理装置40は、認識処理制御装置30と認識処理手段9の間の通信を中継する。すなわち、通信部41は、認識処理制御装置30の通信部34と、例えば、Bluetooth(登録商標)通信や無線LAN(Local Area Network)通信などの無線、または有線で接続される。通信部43は、認識処理手段9が備える認識エンジン9−1〜nに、公衆網や移動無線網など、または有線で接続される。通信制御部42は、通信部41と43の制御を行って、認識処理制御装置30と認識処理手段9の間の通信を中継する。 The
認識処理制御装置30の入力部31、出力部32、属性記憶部33と認識制御部35は、図8で示した第3の実施形態の入力手段1、出力手段2、属性記憶手段3と認識制御手段5に相当するので説明を省略する。
また、認識処理制御装置30の通信部34と通信処理装置40は、図8で示した配信手段4に相当するので説明を省略する。認識処理制御装置30は、ローカルに認識処理を行う認識エンジンとして、認識エンジン91を備えていてもよいが、なくてもよい。 Moreover, since the
図13は、本実施形態の認識処理制御装置30の動作例を示すフローチャートである。図14は、本実施形態の通信処理装置40の動作例を示すフローチャートである。 FIG. 13 is a flowchart illustrating an operation example of the recognition
図13を参照して、認識処理制御装置30の認識処理の動作について説明する。 With reference to FIG. 13, the operation of the recognition process of the recognition
入力部31に認識処理対象信号が入力されると、入力部31は、入力された認識処理対象信号を認識処理対象情報に変換して認識制御部35に送る。認識制御部35は、属性記憶部33に記憶される属性情報に基づいて選択された配信先に、変換された認識処理対象情報を、通信部34と通信処理装置40を経由して送信する(A101)。ここで、配信先とは、認識制御部35が属性記憶部33に記憶される配信先情報に基づいて選択された認識エンジンである。配信先として選択された認識エンジンは、認識処理対象情報を受信して認識処理を行った認識処理結果情報を、通信処理装置40と通信部34を経由して認識処理制御装置30に送信する。 When the recognition processing target signal is input to the
認識制御部35は、配信先から認識処理結果情報を受信する(A102)。そして、認識制御部35は、配信先からの認識処理結果情報の有無を確認する(A103)。 The
配信先からの認識処理結果情報がなければ(A103:NO)、認識制御部35は、処理結果なしと、出力部32に出力して処理を終了する(A111)。 If there is no recognition process result information from the delivery destination (A103: NO), the
配信先からの認識処理結果情報があれば(A103:YES)、認識制御部35は、現在の利用目的に対応する属性情報、例えば音声認識の「目的地入力」に対応する文法を選択する(A104)。 If there is recognition processing result information from the delivery destination (A103: YES), the
認識制御部35は、選択された属性情報に沿った認識処理結果情報があるかを確認する(A105)。具体的には、音声認識の「目的地入力」に対応する文法番号「2」(図4、5参照)の示す単語群および特定の単語が、認識処理結果情報に含まれているか否かを、認識制御部35は評価する。 The
そして、認識制御部35は、選択された属性情報に沿った認識処理結果情報があれば(A105:YES)、認識処理結果情報を処理結果として、出力部2に出力して処理を終了する(A121)。 Then, if there is the recognition processing result information along the selected attribute information (A105: YES), the
一方、認識制御部35は、選択された属性情報に沿った認識処理結果情報がなければ(A105:NO)、現在の利用目的に対応するA104において未だ選択されていない未選択の属性情報があるかを確認する(A106)。認識制御部35は、未選択の属性情報がなければ(A106:NO)、処理結果なしと、出力部32に出力して処理を終了する(A111)。 On the other hand, if there is no recognition processing result information according to the selected attribute information (A105: NO), the
認識制御部35は、未選択の属性情報があれば、次の属性情報を選択(A107)して、ステップA105の処理に戻る。 If there is unselected attribute information, the
このように、本実施形態の認識処理装置30は、入力部31に入力された認識処理対象信号の認識処理を行うことができる。 As described above, the
図14を参照して、通信処理装置40の動作について説明する。 The operation of the
通信制御部42は、認識処理制御装置30の通信部34から認識処理対象情報を、通信部41で受信し、配信先である認識処理手段9の認識エンジン9−1〜nに、通信部43から送信する(B101)。そして、通信制御部42は、配信先の認識エンジン9−1〜nからの認識処理結果情報を、通信部43を経由して受信する(B102)。 The
通信制御部42は、認識処理結果情報を、通信部41を経由して認識処理制御装置30に送信して処理を終了する(B104)。 The
こうして、本実施形態の通信処理装置40は、認識処理制御装置30と認識処理手段9の間の通信を中継する。 In this way, the
このように、本実施形態の認識処理システム12は、情報処理制御装置30の入力部31に入力された認識処理対象情報を、認識制御部35は、属性記憶部33に記憶される属性情報に基づいて、認識エンジン9−1〜nの中から選択された認識エンジンに送信する。そして、選択された認識エンジンからの認識処理結果情報を受信して、認識制御部35は、属性記憶部33に記憶される属性情報に基づいて評価する。認識制御部35は、評価結果に基づいて、認識処理結果情報を出力部32に出力する。 As described above, the
したがって、本実施形態は、認識処理の属性、対象分野やサービスが限定されず、効率的に認識処理を行って認識性能を向上することが可能となる。 Therefore, in the present embodiment, the recognition process attributes, target fields, and services are not limited, and the recognition performance can be improved by efficiently performing the recognition process.
なお、本実施形態では、選択された属性情報に沿っている認識処理結果情報があれば、認識処理結果とすると説明したが、選択された属性情報に沿っていることに限定されない。例えば、認識制御部は、属性情報に基づいて、受信された認識処理結果情報を評価して、最も高い評価の認識処理結果情報を出力手段に出力してもよいし、予め設定された閾値以上の評価を得た情報処理結果情報を出力手段に出力してもよいし、予め設定された数の情報処理結果情報を評価の高い順から選定して出力手段に出力してもよい。また、ユーザが使用するサービスやアプリケーションなどに基づいて、認識処理結果情報の評価結果の出力方法は適宜変更されてもよい。 In the present embodiment, it has been described that there is recognition processing result information if there is recognition processing result information along the selected attribute information. However, it is not limited to being along the selected attribute information. For example, the recognition control unit may evaluate the received recognition process result information based on the attribute information, and may output the highest-recognized recognition process result information to the output unit, or more than a preset threshold value The information processing result information obtained from the evaluation may be output to the output unit, or a preset number of information processing result information may be selected in descending order of evaluation and output to the output unit. Moreover, the output method of the evaluation result of the recognition processing result information may be appropriately changed based on the service or application used by the user.
また、本実施形態では、認識制御部は、予め配信先情報に設定された優先度に基づいて、認識エンジンを選定してもよいし、または認識処理結果情報の評価を行ってもよい。 In this embodiment, the recognition control unit may select a recognition engine based on the priority set in advance in the distribution destination information, or may evaluate the recognition processing result information.
また、本実施形態では、認識処理制御装置と通信処理装置を分離して説明したが、認識処理制御装置と通信処理装置は必ずしも分離される必要はない。ここで、認識処理制御装置は、車載システムであれば、例えばカーナビシステムやクルージングシステムなどに適用される。カーナビシステムやクルージングシステムなどの車載装置が公衆網や移動無線網などの広域通信機能を備えていれば、本実施形態の通信処理装置は不要となる。また、カーナビシステムやクルージングシステムなどの車載装置が広域通信機能を備えていなければ、例えば広域通信機能を備えた移動端末や情報端末が、車載装置と近接通信機能または有線で通信する。すなわち、移動端末や情報端末が本実施形態の通信処理装置として機能し、認識処理制御装置として機能するカーナビシステムやクルージングシステムなどの車載装置と連携することで、本実施形態が実現されればよい。このとき、カーナビシステムやクルージングシステムなどの車載装置が備えるマイク入力、各種センサ情報やカメラ映像、移動端末のマイク入力、センサ情報やカメラ映像を、本実施形態は、認識処理対象情報に適用する。また、認識処理制御装置は、移動端末や情報端末であってもよい。移動端末や情報端末が備えるマイク入力、カメラ映像や各種センサ情報を認識処理対象情報として、本実施形態は適用される。すなわち、本実施形態は、センサを備え、センサ情報を認識処理対象情報として送信し、認識処理結果情報を受信できるものであれば適用される。 In this embodiment, the recognition processing control device and the communication processing device are described separately. However, the recognition processing control device and the communication processing device do not necessarily have to be separated. Here, if the recognition processing control device is an in-vehicle system, it is applied to, for example, a car navigation system or a cruising system. If an in-vehicle device such as a car navigation system or a cruising system has a wide-area communication function such as a public network or a mobile wireless network, the communication processing device of this embodiment is not necessary. In addition, if an in-vehicle device such as a car navigation system or a cruising system does not have a wide area communication function, for example, a mobile terminal or an information terminal having a wide area communication function communicates with the in-vehicle device by a proximity communication function or by wire. That is, the present embodiment may be realized by a mobile terminal or an information terminal functioning as a communication processing device of the present embodiment and in cooperation with an in-vehicle device such as a car navigation system or a cruising system that functions as a recognition processing control device. . At this time, in this embodiment, the microphone input, various sensor information and camera video, the microphone input of the mobile terminal, the sensor information and the camera video included in the in-vehicle device such as the car navigation system and the cruising system are applied to the recognition processing target information. The recognition processing control device may be a mobile terminal or an information terminal. The present embodiment is applied using the microphone input, camera video, and various sensor information included in the mobile terminal and the information terminal as the recognition process target information. That is, this embodiment is applied as long as it includes a sensor, can transmit sensor information as recognition process target information, and can receive recognition process result information.
また、本実施形態は、センサを備え、センサ情報を認識処理対象情報として、認識処理制御装置に入力する入力装置と、認識処理制御装置が組み合わされてもよい。 In addition, the present embodiment may include a sensor, and an input device that inputs sensor information as recognition processing target information to the recognition processing control device may be combined with the recognition processing control device.
また、本実施形態では、認識処理制御装置または通信処理装置が認識エンジンを備え、認識処理対象信号の処理属性の判断に基づいて、その認識エンジンが選択されてもよいし、選択されなくてもよい。 In the present embodiment, the recognition processing control device or the communication processing device includes a recognition engine, and the recognition engine may or may not be selected based on the determination of the processing attribute of the recognition processing target signal. Good.
なお、本願発明は、上述の各実施形態に限定されるものではなく、本願発明の要旨を逸脱しない範囲で種々変更、変形して実施することができる。 Note that the present invention is not limited to the above-described embodiments, and various modifications and changes can be made without departing from the spirit of the present invention.
例えば、第3の実施形態で追加された履歴記憶手段は、第1の実施形態や第4の実施形態に追加されてもよい。 For example, the history storage unit added in the third embodiment may be added to the first embodiment or the fourth embodiment.
また、本願発明では、音声認識または標識認識を用いて認識処理を説明したが、認識処理は、音声認識と標識認識に限定されない。例えば、認識処理は、音を使用するものであれば、話者識別、楽曲識別、DTMF認識などがあげられる。また、画像を使用するものであれば、画像認識、顔認識、文字認識、バーコード認識、指紋認識、路面表示識別、車両番号認識などがあげられる。本願発明は、これらの認識処理の認識処理結果情報を組み合わせて評価されてもよい。すなわち、本願発明は、認識処理対象信号が入力されて、認識処理対象情報に変換されて送信でき、認識処理結果情報と属性情報が得られて、評価できるものであれば適用できる。そして、本願発明は、各種の処理属性に対応する認識エンジンを認識処理制御装置に備えていなくても、認識処理結果情報を受信して評価し取り扱うことができる効果がある。また、本願発明は、認識処理システムとして認識処理制御装置と接続できる認識エンジンであれば、既存の認識エンジンや最新のアルゴリズムを使用する認識エンジンを使用することができる効果が得られる。さらに、本願発明は、認識処理システムとしての構築コストを軽減できる効果があるとともに、認識処理の性能の向上を期待できる効果がある。 In the present invention, the recognition process has been described using voice recognition or sign recognition. However, the recognition process is not limited to voice recognition and sign recognition. For example, if the recognition process uses sound, speaker identification, music identification, DTMF recognition, and the like can be given. In the case of using an image, image recognition, face recognition, character recognition, barcode recognition, fingerprint recognition, road surface identification, vehicle number recognition, and the like can be given. The present invention may be evaluated by combining the recognition process result information of these recognition processes. That is, the present invention can be applied as long as a recognition processing target signal is input, converted into recognition processing target information and transmitted, and recognition processing result information and attribute information can be obtained and evaluated. The present invention has an effect that the recognition process result information can be received, evaluated and handled even if the recognition process control apparatus does not include a recognition engine corresponding to various process attributes. In addition, the present invention can obtain an effect that an existing recognition engine or a recognition engine using the latest algorithm can be used as long as it is a recognition engine that can be connected to a recognition processing control device as a recognition processing system. Furthermore, the present invention has an effect of reducing the construction cost as a recognition processing system and an effect of expecting an improvement in recognition processing performance.
また、各実施形態で説明した属性記憶手段、属性記憶部、履歴記憶手段は、認識処理に関わる属性情報を記憶するハードディスク装置であってもよいし、ネットワークで接続されたサーバ装置であってもよいし、ROM(Read Only Memory)、RAM(Random Access Memory)、フラッシュメモリ等の半導体記憶装置、光ディスク、磁気ディスク、光磁気ディスク等、非一時的な媒体でもよい。すなわち、属性記憶手段、属性記憶部は、認識制御手段または認識制御部の制御を受けて、認識処理に関わる属性情報を記憶できるものであればよい。また、履歴記憶手段は、認識制御手段の制御を受けて、認識処理に関わる履歴情報を記憶できるものであればよい。 In addition, the attribute storage unit, attribute storage unit, and history storage unit described in each embodiment may be a hard disk device that stores attribute information related to recognition processing, or may be a server device connected via a network. Alternatively, a non-transitory medium such as a ROM (Read Only Memory), a RAM (Random Access Memory), a semiconductor memory device such as a flash memory, an optical disk, a magnetic disk, or a magneto-optical disk may be used. That is, the attribute storage unit and the attribute storage unit only need to be able to store attribute information related to the recognition process under the control of the recognition control unit or the recognition control unit. Further, the history storage means may be anything that can store history information related to recognition processing under the control of the recognition control means.
また、上述の各実施形態の認識制御手段または認識制御部による認識制御処理は、認識制御手段または認識処理制御装置が備えるコンピュータ(図示なし)を用いたソフトウェアによって実行されてもよい。すなわち、認識制御処理を行うコンピュータプログラムが、CPU(Central Processing Unit)によって読み込まれ、実行されることによって実現されてもよい。 In addition, the recognition control processing by the recognition control unit or the recognition control unit in each of the above embodiments may be executed by software using a computer (not shown) provided in the recognition control unit or the recognition processing control device. That is, a computer program that performs recognition control processing may be realized by being read and executed by a CPU (Central Processing Unit).
なお、プログラムは、ROM、RAM、フラッシュメモリ等の半導体記憶装置、光ディスク、磁気ディスク、光磁気ディスク等、非一時的な媒体に格納されてもよい。 Note that the program may be stored in a non-transitory medium such as a semiconductor storage device such as a ROM, a RAM, or a flash memory, an optical disk, a magnetic disk, or a magneto-optical disk.
1 入力手段
2 出力手段
3 属性記憶手段
4 配信手段
5、21 認識制御手段
6 履歴記憶手段
9 認識処理手段
9−1〜n、91 認識エンジン
10、11、12 認識処理システム
20、30 認識処理制御装置
22 情報送信部
23 結果受信部
24 評価結果出力部
31 入力部
32 出力部
33 属性記憶部
34、41、43 通信部
35 認識制御部
40 通信処理装置
42 通信制御部DESCRIPTION OF
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2013067907AJP6050171B2 (en) | 2013-03-28 | 2013-03-28 | Recognition processing control device, recognition processing control method, and recognition processing control program |
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2013067907AJP6050171B2 (en) | 2013-03-28 | 2013-03-28 | Recognition processing control device, recognition processing control method, and recognition processing control program |
| Publication Number | Publication Date |
|---|---|
| JP2014191246A JP2014191246A (en) | 2014-10-06 |
| JP6050171B2true JP6050171B2 (en) | 2016-12-21 |
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2013067907AActiveJP6050171B2 (en) | 2013-03-28 | 2013-03-28 | Recognition processing control device, recognition processing control method, and recognition processing control program |
| Country | Link |
|---|---|
| JP (1) | JP6050171B2 (en) |
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP6866714B2 (en)* | 2017-03-21 | 2021-04-28 | 株式会社リコー | Image processing equipment, image processing system, image processing method, and program |
| WO2023139769A1 (en)* | 2022-01-21 | 2023-07-27 | ファナック株式会社 | Grammar adjustment device and computer-readable storage medium |
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2986345B2 (en)* | 1993-10-18 | 1999-12-06 | インターナショナル・ビジネス・マシーンズ・コーポレイション | Voice recording indexing apparatus and method |
| DE19910236A1 (en)* | 1999-03-09 | 2000-09-21 | Philips Corp Intellectual Pty | Speech recognition method |
| US6898567B2 (en)* | 2001-12-29 | 2005-05-24 | Motorola, Inc. | Method and apparatus for multi-level distributed speech recognition |
| JP2005031758A (en)* | 2003-07-07 | 2005-02-03 | Canon Inc | Audio processing apparatus and method |
| JP2008033198A (en)* | 2006-08-01 | 2008-02-14 | Nec System Technologies Ltd | Voice interaction system, voice interaction method, voice input device and program |
| JP2008293354A (en)* | 2007-05-25 | 2008-12-04 | Canon Inc | Document image recognition system |
| JP5916054B2 (en)* | 2011-06-22 | 2016-05-11 | クラリオン株式会社 | Voice data relay device, terminal device, voice data relay method, and voice recognition system |
| WO2013001702A1 (en)* | 2011-06-29 | 2013-01-03 | 日本電気株式会社 | Information processing device |
| Publication number | Publication date |
|---|---|
| JP2014191246A (en) | 2014-10-06 |
| Publication | Publication Date | Title |
|---|---|---|
| US10991374B2 (en) | Request-response procedure based voice control method, voice control device and computer readable storage medium | |
| JP5234160B2 (en) | Vehicle apparatus and information display system | |
| US20180090132A1 (en) | Voice dialogue system and voice dialogue method | |
| US20130179154A1 (en) | Speech recognition apparatus | |
| JP7040449B2 (en) | Voice processing device, information processing device, voice processing method and information processing method | |
| JP2010236858A (en) | Navigation device | |
| CN107808667A (en) | Voice recognition device and voice recognition method | |
| US12038299B2 (en) | Content-aware navigation instructions | |
| JPWO2016129276A1 (en) | Information providing method, server, information terminal device, system, and voice dialogue system | |
| KR20230135396A (en) | Method for dialogue management, user terminal and computer-readable medium | |
| CN107885720A (en) | Keyword generating device and keyword generating method | |
| JP5606951B2 (en) | Speech recognition system and search system using the same | |
| JP4401883B2 (en) | In-vehicle terminal, mobile communication terminal, and mail transmission / reception system using them | |
| JP6050171B2 (en) | Recognition processing control device, recognition processing control method, and recognition processing control program | |
| JP5500100B2 (en) | Voice guidance system | |
| CN111369972A (en) | Guidance sound output control system and guidance sound output control method | |
| JP6444128B2 (en) | Search system | |
| WO2014199428A1 (en) | Candidate announcement device, candidate announcement method, and program for candidate announcement | |
| JP2009282835A (en) | Method and device for voice search | |
| JP6322125B2 (en) | Speech recognition apparatus, speech recognition method, and speech recognition program | |
| WO2010073406A1 (en) | Information providing device, communication terminal, information providing system, information providing method, information output method, information providing program, information output program, and recording medium | |
| US12437759B2 (en) | Dialogue management method, dialogue management system, and computer-readable recording medium | |
| JPH05120596A (en) | Traffic information providing device | |
| US12444418B1 (en) | Device selection for outputting content | |
| JP6115202B2 (en) | Speech recognition system, method and program |
| Date | Code | Title | Description |
|---|---|---|---|
| A02 | Decision of refusal | Free format text:JAPANESE INTERMEDIATE CODE: A02 Effective date:20150106 | |
| A521 | Written amendment | Free format text:JAPANESE INTERMEDIATE CODE: A523 Effective date:20150402 | |
| A911 | Transfer of reconsideration by examiner before appeal (zenchi) | Free format text:JAPANESE INTERMEDIATE CODE: A911 Effective date:20150410 | |
| A912 | Removal of reconsideration by examiner before appeal (zenchi) | Free format text:JAPANESE INTERMEDIATE CODE: A912 Effective date:20150605 | |
| A521 | Written amendment | Free format text:JAPANESE INTERMEDIATE CODE: A523 Effective date:20160331 | |
| A521 | Written amendment | Free format text:JAPANESE INTERMEDIATE CODE: A523 Effective date:20160819 | |
| A521 | Written amendment | Free format text:JAPANESE INTERMEDIATE CODE: A523 Effective date:20160920 | |
| A61 | First payment of annual fees (during grant procedure) | Free format text:JAPANESE INTERMEDIATE CODE: A61 Effective date:20161124 | |
| R150 | Certificate of patent or registration of utility model | Ref document number:6050171 Country of ref document:JP Free format text:JAPANESE INTERMEDIATE CODE: R150 |