




本発明は、音声認識装置に関する。 The present invention relates to a speech recognition apparatus.
近年、ユーザからの発話音声を入力し、入力した発話音声が予め登録された登録語彙に該当すると認識した場合に、認識した登録語彙に応じて制御機器を制御する音声認識装置が知られている。また、大人による登録語彙の発話であるか、子供による登録語彙の発話であるかなどを識別するための音声モデルを複数記憶した音声認識装置についても知られている(特許文献1参照)。
しかし、従来の音声認識装置では、制御機器を適切に制御しているとはいえない。例えば、制御機器が浴室装置であって湯温の設定などを子供にさせないようにチャイルドロック機能がある場合において、子供によってチャイルドロックを解除する登録語彙が発話された場合、チャイルドロックを解除してしまう。このような場合、音声認識装置は、適切な制御を行っているとはいえない。なお、この問題はチャイルドロックが設けられている装置の場合に限らず、チャイルドロックが設けられていない場合においても同様に生じるものである。 However, it cannot be said that the conventional speech recognition apparatus appropriately controls the control device. For example, if the control device is a bathroom device and there is a child lock function that prevents the child from setting the hot water temperature, etc., if the registered vocabulary for releasing the child lock is spoken by the child, the child lock is released. End up. In such a case, it cannot be said that the speech recognition apparatus performs appropriate control. Note that this problem occurs not only in the case of a device provided with a child lock but also in the case where a child lock is not provided.
また、上記のような事情から、子供等の話者を識別する音声認識装置が望まれるが、話者の識別を行うためには、処理負荷やコストの大幅な増大を招くこともあり、望ましいとはいえない。 In addition, a voice recognition device for identifying a speaker such as a child is desired due to the above circumstances. However, in order to identify a speaker, a processing load and cost may be significantly increased, which is desirable. That's not true.
本発明は、上記問題点を解決するために成されたものであり、その目的とするところは、処理負荷やコストの大幅な増大を招くことなく、制御機器をより適切に制御することが可能な音声認識装置を提供することである。 The present invention has been made to solve the above-mentioned problems, and the object of the present invention is to control the control device more appropriately without causing a significant increase in processing load and cost. Is to provide a simple speech recognition device.
本発明に係る音声認識装置は、ユーザからの発話音声を入力し、入力した発話音声が予め登録された登録語彙に該当すると認識した場合に、認識された登録語彙に基づいて制御機器を制御する制御信号を出力する音声認識装置であって、少なくとも1つの登録語彙を記憶した登録語彙記憶手段と、登録語彙記憶手段により記憶される登録語彙が、どの話者によって発話されたかを識別するための複数の音声モデルを記憶した音声モデル記憶手段と、ユーザによる登録語彙の発話音声が入力された場合、音声モデル記憶手段によって記憶された複数の音声モデルから、当該登録語彙がどの話者によって発話されたかを識別する話者識別手段と、話者識別手段により登録語彙が特定の話者によって発話されたと識別された場合と、話者識別手段により登録語彙が特定の話者を除く他の話者によって発話されたと識別された場合とで、登録語彙に基づく制御機器への制御内容を異ならせる制御手段と、を備えている。 The speech recognition apparatus according to the present invention inputs a speech voice from a user, and controls the control device based on the recognized registered vocabulary when it recognizes that the input utterance speech corresponds to a registered vocabulary registered in advance. A speech recognition apparatus that outputs a control signal, for identifying a registered vocabulary storage unit storing at least one registered vocabulary and a speaker uttered by a registered vocabulary stored by the registered vocabulary storage unit When a speech model storage unit storing a plurality of speech models and an utterance speech of a registered vocabulary by a user are input, which speaker utters the registered vocabulary from the plurality of speech models stored by the speech model storage unit A speaker identifying means for identifying whether or not the registered vocabulary is uttered by a specific speaker by the speaker identifying means; Ri in the case where registered vocabulary is identified to have been spoken by other speakers other than the specific speaker, and a, and a control means for varying the control contents of the control devices based on registration vocabulary.
この音声認識装置によれば、複数の音声モデルに基づいて話者を識別し、登録語彙が特定の話者によって発話された場合と、他の話者による発話であると識別された場合とで制御機器への制御内容を異ならせる。このため、話者に応じて制御信号を異ならせることとなり、話者に応じて制御機器を制御することができ、制御機器を話者に応じて適切に制御することができる。さらに、複数の音声モデルにより話者を識別する手法は、従来の音声認識装置に対して処理量の大幅な増加やハードウェアの追加をする必要性がない。従って、処理負荷やコストの大幅な増大を招くことなく、制御機器をより適切に制御することができる。 According to this speech recognition apparatus, a speaker is identified based on a plurality of speech models, and when the registered vocabulary is spoken by a specific speaker and when it is identified as a speech by another speaker. Different control contents for control devices. For this reason, a control signal will be varied according to a speaker, a control apparatus can be controlled according to a speaker, and a control apparatus can be controlled appropriately according to a speaker. Furthermore, the method for identifying a speaker using a plurality of speech models does not require a significant increase in processing amount or addition of hardware compared to a conventional speech recognition apparatus. Therefore, the control device can be more appropriately controlled without causing a significant increase in processing load and cost.
また、本発明に係る音声認識装置において、音声モデル記憶手段は、登録語彙が子供によって発話されたことを認識する子供音声モデルを記憶し、制御手段は、話者識別手段により登録語彙が子供によって発話されたと識別された場合、話者識別手段により登録語彙が子供を除く他の話者によって発話されたと識別された場合とで、登録語彙に基づく制御機器への制御内容を異ならせることが好ましい。 In the speech recognition apparatus according to the present invention, the speech model storage means stores a child speech model that recognizes that the registered vocabulary is spoken by the child, and the control means uses the speaker identification means to register the registered vocabulary by the child. When the utterance is identified, it is preferable that the control content to the control device based on the registered vocabulary is different from the case where the registered vocabulary is identified by the speaker other than the child by the speaker identification means. .
この音声認識装置によれば、子供音声モデルを記憶し、登録語彙が子供によって発話されたと識別した場合と、他の話者によって発話されたと識別した場合とで、制御機器への制御内容を異ならせる。このため、子供用の制御を行うことが可能となり、制御機器がテレビであってテレビの電源をオンする登録語彙が認識された場合に子供向けアニメ等の番組をつけることなどができる。従って、例えば、制御機器の操作が不慣れな子供に対して利便性を向上させることができる。 According to this speech recognition apparatus, the child speech model is stored, and when the registered vocabulary is identified as being uttered by a child, the control content to the control device is different between when the vocabulary is identified as uttered by another speaker. Make it. For this reason, it becomes possible to perform control for children, and when the control device is a television and a registered vocabulary for turning on the television is recognized, a program such as animation for children can be attached. Therefore, for example, it is possible to improve convenience for a child who is unfamiliar with the operation of the control device.
また、本発明に係る音声認識装置において、制御手段は、話者識別手段により登録語彙が子供によって発話されたと識別された場合、制御信号の出力をせず、話者識別手段により登録語彙が子供を除く他の話者によって発話されたと識別された場合、制御信号を出力することが好ましい。 In the speech recognition apparatus according to the present invention, the control means does not output a control signal when the registered vocabulary is uttered by the child by the speaker identifying means, and the registered vocabulary is not reproduced by the speaker identifying means. It is preferable to output a control signal when it is identified that the voice is spoken by another speaker except for.
この音声認識装置によれば、登録語彙が子供によって発話されたと識別された場合に制御信号の出力をせず、登録語彙が子供を除く他の話者によって発話されたと識別された場合に制御信号を出力する。このため、制御機器が浴室装置である場合に湯温の設定を禁止したり、制御機器がパーソナルコンピュータ等のインターネット接続が可能な機器である場合に成人向けコンテンツへの接続を禁止したりなど、不用意に制御機器を動かしてしまいがちな子供に対して制御機器をより適切に制御することができる。 According to this speech recognition apparatus, when the registered vocabulary is identified as uttered by a child, the control signal is not output, and when the registered vocabulary is identified as uttered by another speaker other than the child, the control signal is output. Is output. For this reason, for example, when the control device is a bathroom device, the setting of the hot water temperature is prohibited, or when the control device is a device such as a personal computer that can be connected to the Internet, connection to adult content is prohibited. The control device can be controlled more appropriately for a child who tends to move the control device carelessly.
また、本発明に係る音声認識装置において、登録語彙記憶手段は、子供による制御機器の制御を許可するロック解除語彙を登録語彙として記憶し、制御手段は、話者識別手段によりロック解除語彙が子供によって発話されたと識別された場合、子供による制御機器の制御を許可せず、話者識別手段により登録語彙が子供を除く他の話者によって発話されたと識別された場合、子供による制御機器の制御を許可することが好ましい。 In the speech recognition apparatus according to the present invention, the registered vocabulary storage means stores an unlocked vocabulary allowing the child to control the control device as a registered vocabulary, and the control means uses the speaker identifying means to make the unlocked vocabulary a child Does not allow control of the control device by the child, and controls the control device by the child if the registered vocabulary is identified by another speaker other than the child by the speaker identification means. It is preferable to allow
この音声認識装置によれば、ロック解除語彙を登録語彙として記憶し、ロック解除語彙が子供によって発話されたと識別した場合、子供による制御機器の制御を許可しない。このため、子供によってチャイルドロックが解除されてしまい、子供にとって不適切な制御内容が制御可能となってしまう事態を防止することができる。 According to this speech recognition apparatus, the unlocked vocabulary is stored as a registered vocabulary, and when the unlocked vocabulary is identified as being uttered by a child, the control of the control device by the child is not permitted. For this reason, it is possible to prevent a situation in which the child lock is released by the child and control contents inappropriate for the child can be controlled.
また、本発明に係る音声認識装置において、音声モデル記憶手段は、登録語彙が高齢者によって発話されたことを認識する高齢者音声モデルを記憶し、制御手段は、話者識別手段により登録語彙が高齢者によって発話されたと識別された場合、制御機器に対して予め登録された高齢者向けの制御をし、話者識別手段により登録語彙が高齢者を除く他の話者によって発話されたと識別された場合、制御機器に対して高齢者向けの制御を行わないことが好ましい。 In the speech recognition apparatus according to the present invention, the speech model storage means stores an elderly speech model that recognizes that the registered vocabulary is spoken by the elderly, and the control means stores the registered vocabulary by the speaker identification means. When it is identified that the utterance was made by an elderly person, the control device is controlled for the elderly person registered in advance, and the registered vocabulary is identified by the speaker identifying means as being uttered by another speaker other than the elderly person. In this case, it is preferable not to perform control for the elderly on the control device.
この音声認識装置によれば、高齢者音声モデルを記憶し、登録語彙が高齢者によって発話された識別した場合、制御機器に対して、予め登録された高齢者向けの制御をする。このため、制御機器がパーソナルコンピュータ等の文字を表示するものであって、高齢者からの発話により電源がオンされた場合に、文字を大きく表示することや、制御機器がマッサージ機である場合に、強くマッサージし過ぎないようにすることができる。従って、高齢者向けの制御が可能となって、制御機器をより適切に制御することができる。 According to this speech recognition apparatus, when the elderly speech model is stored and the registered vocabulary is identified as spoken by the elderly, the control device is controlled for the elderly registered in advance. For this reason, when the control device displays characters such as a personal computer and the power is turned on by an utterance from an elderly person, when the character is displayed large, or when the control device is a massage machine You can avoid over-massage. Therefore, control for elderly people is possible, and the control device can be controlled more appropriately.
また、本発明に係る音声認識装置において、音声モデル記憶手段は、特定の登録語彙に対してのみ、複数の音声モデルを記憶していることが好ましい。 In the speech recognition apparatus according to the present invention, the speech model storage means preferably stores a plurality of speech models only for a specific registered vocabulary.
この音声認識装置によれば、また、特定の登録語彙に対してのみ、複数の音声モデルを記憶しているため、話者を識別する必要がない語彙について、話者の識別処理を省略して処理負荷の軽減を図ることができる。 According to this speech recognition apparatus, since a plurality of speech models are stored only for a specific registered vocabulary, speaker identification processing is omitted for a vocabulary that does not require identification of the speaker. The processing load can be reduced.
本発明によれば、処理負荷やコストの大幅な増大を招くことなく、制御機器をより適切に制御することができる。 According to the present invention, it is possible to more appropriately control the control device without causing a significant increase in processing load and cost.
以下、図面を参照して、本発明の実施の形態を説明する。図1は、本発明の実施形態に係る音声認識装置を含む音声認識システムを示す構成図である。音声認識システム1は、ユーザからの発話音声によって制御機器20を制御するものであって、音声認識装置10と、制御機器20とを備えている。 Embodiments of the present invention will be described below with reference to the drawings. FIG. 1 is a configuration diagram showing a voice recognition system including a voice recognition device according to an embodiment of the present invention. The
音声認識装置10は、ユーザから音声及びスイッチ操作による入力を受け付け、受け付けた入力内容に応じて制御機器20を制御するための制御信号を出力するものである。この音声認識装置10は、音声により制御機器20を制御できる音声入力モードと、スイッチ操作により制御機器20を制御できるボタン操作入力モードとが選択可能となっている。音声入力モードにおいて、音声認識装置10は、ユーザからの発話音声を入力して、入力した発話音声が予め登録された登録語彙に該当すると認識した場合に、認識した登録語彙に応じて制御機器20を制御する制御信号を出力する。また、ボタン操作入力モードにおいて、音声認識装置10は、ユーザからのスイッチ操作を入力し、スイッチ操作に該当する内容で制御機器20を制御する制御信号を出力する。 The
制御機器20は、音声認識装置10からの制御信号の内容に応じて動作する外部機器である。具体的に制御機器20は、浴室装置21、換気扇22及びテレビ23の3機器からなっており、音声認識装置10からの制御信号に応じて運転したり、運転を停止したりなどする。一例を挙げると、制御機器20の1つであるテレビ23は、音声認識装置10からの制御信号によって、電源がオンされたり、チャンネルが変えられたりする。 The
図2は、図1に示した音声認識装置10の設置例を示す外観図である。図2に示すように、音声認識装置10は、例えば浴室に設けられる。浴室には、浴室装置21(図2において図示せず)、換気扇22、及びテレビ23が設けられている。さらに、浴室の浴槽30付近には、音声認識装置10の構成要素である後述のコントローラ11が設置されている。 FIG. 2 is an external view showing an installation example of the
なお、図1及び図2では、浴室装置21、換気扇22及びテレビ23を制御機器20の一例として挙げたが、これに限らず、制御機器20は、床暖房機器やマッサージ機やパーソナルコンピュータや音響機器など他の機器であってもよい。また、音声認識装置10は浴室に設けられていなくともよく、寝室、リビング、会社のデスク付近及び会議室など、他の箇所に設けられていてもよい。 In FIG. 1 and FIG. 2, the
再度、図1を参照する。図1に示すように、音声認識装置10は、コントローラ11と、記憶部12と、音声認識部(話者識別手段)13と、制御機器制御部(制御手段)14と、装置制御部15とを備えている。コントローラ11は、ユーザから音声及びスイッチ操作による入力を受け付けるものである。 Reference is again made to FIG. As shown in FIG. 1, the
図3は、図1に示したコントローラ11の詳細を示す正面図である。図3に示すように、コントローラ11は、音声入力部11aと、操作ボタン11bと、表示部11cと、LEDランプ11dとを備えている。なお、表示部11c及びLEDランプ11dは他の要素12〜15,20との接続関係がないため、図1における表示部11c及びLEDランプ11dの図示は省略した。 FIG. 3 is a front view showing details of the
図3に示す音声入力部11aは、マイク等によって構成され、ユーザからの音声入力を受け付けるものである。操作ボタン11bは、ユーザによるスイッチ操作を受け付けるものである。表示部11cは、LCDなどによって構成され、各種制御機器20の動作状況等(例えばふろの温度や現在時刻など)を表示するものである。LEDランプ11dは、現在音声入力モードであるか、ボタン操作入力モードであるかをユーザに提示するものである。このLEDランプ11dは、3つのLEDによって構成され、例えば1つが点灯しているときには音声入力モードであり、他の1つが点灯しているときにはボタン操作入力モードであり、残り1つが点灯しているときには双方のモードの併用状態であることを示す構成となっている。 The
具体的に各種操作ボタン11bを説明する。各種操作ボタン11bは、優先ボタン11b1、追いだきボタン11b2、ふろ自動ボタン11b3、通話ボタン11b4、コントローラオンオフボタン11b5、メニューボタン11b6、確定ボタン11b7、戻るボタン11b8、及び十字キー11b9からなっている。 The
優先ボタン11b1は、浴室で給湯温度やシャワー温度を設定したいときに使用するボタンである。一般的に水や湯は、浴室以外にも台所等で用いられる。このため、浴室装置21の給湯温度やシャワー温度を設定しても他の箇所で水や湯を使用されると、実際の給湯温度やシャワー温度にズレが生じる可能性がある。そこで、優先ボタン11b1を押下することにより、他の箇所よりも浴室を優先し、実際の給湯温度やシャワー温度にズレが生じ難いようにすることができる。また、優先ボタン11b1が押下されると、表示部11cに優先マーク(不図示)が表示される。 The priority button 11b1 is a button used when it is desired to set a hot water supply temperature or a shower temperature in the bathroom. In general, water and hot water are used not only in the bathroom but also in the kitchen. For this reason, even if the hot water supply temperature and the shower temperature of the
追いだきボタン11b2は、浴槽30内で冷たくなった湯水の温度を高くするときに使用されるボタンである。また、追いだきボタン11b2が押下されると、表示部11cに追いだきマーク(不図示)が表示される。 The chasing button 11b2 is a button used when raising the temperature of hot water that has become cold in the
ふろ自動ボタン11b3は、設定した湯量と温度とで浴槽30内にお湯をはるときに使用されるボタンである。また、ふろ自動ボタン11b3が押下されると、表示部11cに自動マーク(不図示)が表示される。 The bath automatic button 11b3 is a button used when hot water is poured into the
通話ボタン11b4は、浴室外、例えば台所などに設置される台所用リモコンと通話するときに使用されるボタンである。また、通話ボタン11b4が押下されると、表示部11cに通話マーク(不図示)が表示される。 The call button 11b4 is a button used when talking with a kitchen remote controller installed outside the bathroom, for example, in a kitchen. When the call button 11b4 is pressed, a call mark (not shown) is displayed on the
コントローラオンオフボタン11b5は、コントローラ11自体の電源をオンオフするためのボタンである。コントローラオンオフボタン11b5により電源がオフされた場合、表示部11cの表示は消去することとなる。 The controller on / off button 11b5 is a button for turning on / off the power of the
メニューボタン11b6は、手入力により制御機器20の動作を設定するためのボタンである。このボタン11b6が押下されると、各制御機器20の動作項目(例えば換気扇オフ、テレビ電源オン、テレビチャンネル+1など)が表示部11cに複数個表示される。ユーザは、これら複数の動作項目から十字キー11b9を操作して1つの動作項目を選択することとなる。 The menu button 11b6 is a button for setting the operation of the
確定ボタン11b7は、十字キー11b9を操作して選択された動作項目の動作を制御機器20に実行させる際に押下されるボタンである。戻るボタン11b8は、表示部11cに表示される画面を1つ前の状態に戻すときなどに使用されるボタンである。例えば、表示部11c上に動作項目を3つ程度しか表示できない場合、十字キー11b9を操作することにより、表示画面を次の画面に移行させて新たな動作項目を表示させることができる。この状態において、戻るボタン11b8を押下すれば、移行した画面を元に戻して、前回画面の動作項目を表示部11cに表示させることができる。 The confirmation button 11b7 is a button that is pressed when the
十字キー11b9は、給湯温度やシャワー温度の温度設定、及び湯量の設定などに用いられるボタンである。また、十字キー11b9は、表示部11cにより表示される動作項目の選択にも用いられる。 The cross key 11b9 is a button used for setting the temperature of the hot water supply temperature or shower temperature, setting the amount of hot water, and the like. The cross key 11b9 is also used to select an operation item displayed on the
さらに、本実施形態では、コントローラ11の操作ボタン11bを操作することにより、音声入力モードと、ボタン操作入力モードとを選択可能となっている。具体的にユーザは、メニューボタン11b6を操作し、表示部11cに表示される入力モードを選択することによって、音声入力モードとボタン操作入力モードとを選択することができる。 Furthermore, in this embodiment, by operating the
再度、図1を参照する。記憶部12は、音声認識に必要となる情報を記憶したものであり、登録語彙記憶部(登録語彙記憶手段)12aと、音声モデル記憶部(音声モデル記憶手段)12bとを備えている。登録語彙記憶部12aは、少なくとも1つの登録語彙を記憶したものであり、例えば「チャイルドロック」、「ロック解除(ロック解除語彙)」、「湯温1℃アップ」、「テレビ電源オン」、「テレビ電源オフ」、及び「モード切替」などの登録語彙を記憶している。 Reference is again made to FIG. The
音声モデル記憶部12bは、登録語彙が、どの話者によって発話されたかを識別するための複数の音声モデルを記憶したものである。具体的に音声モデル記憶部12bは、登録語彙が子供によって発話されたことを識別する子供音声モデルと、登録語彙が大人によって発話されたことを識別する大人音声モデルと、登録語彙が高齢者によって発話されたことを識別する高齢者音声モデルとを記憶している。なお、本実施形態において子供とは幼児、小学生など12歳以下の子供を意味し、高齢者とは60歳以上の成人を意味し、大人とは13歳以上59歳以下の成人を意味している。しかし、子供、高齢者及び大人は、これらに限らず、制御機器20の用途や音声認識システム1の用いられる環境にあわせて、年齢等は変更可能である。さらに、音声モデルは、特に子供、大人、高齢者による発話を識別するものに限らず、男性や女性を識別したり、同じ大人であってもAさんやBさんなど特定人を識別したりするものであってもよい。 The speech model storage unit 12b stores a plurality of speech models for identifying which speaker has spoken the registered vocabulary. Specifically, the speech model storage unit 12b includes a child speech model that identifies that the registered vocabulary is uttered by a child, an adult speech model that identifies that the registered vocabulary is uttered by an adult, and a registered vocabulary by an elderly person. An elderly speech model for identifying the utterance is stored. In this embodiment, a child means a child under 12 years of age such as an infant or elementary school student, an elderly person means an adult over 60 years old, and an adult means an adult over 13 years old and under 59 years old. Yes. However, children, elderly people, and adults are not limited to these, and the age and the like can be changed according to the use of the
ここで、記憶部12の記憶内容をさらに詳細に説明する。図4は、図1に示した記憶部12の記憶内容の一例を示す概念図である。図4に示すように、登録語彙記憶部12aは、「チャイルドロック」、「ロック解除」、「湯温1℃アップ」、「テレビ電源オン」、「テレビ電源オフ」、及び「モード切替」などの登録語彙を記憶している。「チャイルドロック」は、子供にとって不適切な制御機器20の制御を行わせないようにするための登録語彙である。「ロック解除」は、「チャイルドロック」によるロック状態を解除するための登録語彙である。「湯温1℃アップ」は、浴室装置21による給湯及びシャワーの設定温度を1度上げるための登録語彙である。「テレビ電源オン」及び「テレビ電源オフ」は、それぞれテレビ23の電源をオンオフするための登録語彙である。「モード切替」は、音声入力モードからボタン操作入力モードへ移行させるための登録語彙である。 Here, the contents stored in the
また、音声モデル記憶部12bは、登録語彙毎に1又は複数の音声モデルを記憶している。具体的に、音声モデル記憶部12bは、「ロック解除」、「湯温1℃アップ」、及び「テレビ電源オン」に対して、子供音声モデル、大人音声モデル、及び高齢者音声モデルを対応付けて記憶している。 The speech model storage unit 12b stores one or a plurality of speech models for each registered vocabulary. Specifically, the voice model storage unit 12b associates the child voice model, the adult voice model, and the elderly voice model with “unlock”, “up to 1 ° C. hot water temperature”, and “TV power on”. I remember.
また、音声モデル記憶部12bは、子供、大人及び高齢者などの区別がない一般音声モデルを記憶している。この一般音声モデルは、「チャイルドロック」、「テレビ電源オフ」、及び「モード切替」に対応付けて記憶されている。このように、音声モデル記憶部12bは、特定の登録語彙に対してのみ、複数の音声モデルを記憶している。 The speech model storage unit 12b stores a general speech model that does not distinguish between children, adults, and elderly people. This general voice model is stored in association with “child lock”, “TV power off”, and “mode switching”. In this way, the speech model storage unit 12b stores a plurality of speech models only for a specific registered vocabulary.
再度、図1を参照する。音声認識部13は、音声入力モード中に音声入力部11aを介して入力されたユーザからの発話音声が予め登録される登録語彙に該当するか否かを判断するものである。さらに、音声認識部13は、ユーザからの発話音声が登録語彙に該当するか否かを判断するのみならず、音声モデル記憶部12bに記憶される複数の音声モデルに基づいて、登録語彙がどの話者によって発話されたかを識別する構成となっている。すなわち、音声認識部13は、ユーザからの発話音声が登録語彙に該当する否か、及び、話者の識別の2処理を行う構成となっている。 Reference is again made to FIG. The
以下、音声認識部13による登録語彙の認識及び話者の識別方法の一例を説明する。まず、子供により「ロック解除」が発話されたとする。このとき、音声認識部13は、図4に示す記憶内容に沿ってどの登録語彙がどの話者によって発話されたか判断することとなる。まず、音声認識部13は、一般音声モデルに基づく「チャイルドロック」という登録語彙と、ユーザからの発話音声との一致度を算出する。その後、音声認識部13は、子供音声モデルに基づく「ロック解除」、大人音声モデルに基づく「ロック解除」、及び高齢者音声モデルに基づく「ロック解除」との一致度を算出する。さらに、音声認識部13は、他の登録語彙についても音声モデル毎に一致度を算出する。これにより、音声認識部13は、一致度を算出し、最も一致度が高い登録語彙及び音声モデルを判断する。 Hereinafter, an example of a registered vocabulary recognition and speaker identification method by the
ここでは、子供により「ロック解除」が発話されている。このため、ユーザからの発話音声は、子供音声モデルに基づく「ロック解除」と最も一致度が高いこととなり、音声認識部13は、最も一致度が高い「ロック解除」が子供により発話されたと判断する。そして、音声認識部13は、認識した「ロック解除」の登録語彙の情報を制御機器制御部14に出力すると共に、登録語彙が子供により発話されたこと、すなわち、話者に関する情報を制御機器制御部14に出力することとなる。 Here, “unlock” is spoken by the child. Therefore, the speech voice from the user has the highest degree of coincidence with “unlocked” based on the child voice model, and the
なお、音声認識部13は、「チャイルドロック」など、複数の音声モデルと対応付けられていない登録語彙に関しては、一般音声モデルのみに基づいて、発話が「チャイルドロック」であったか否かを判断することとなる。このため、ユーザからの発話音声が「チャイルドロック」に該当した場合、話者は識別されないこととなり、音声認識部13は、話者に関する情報を制御機器制御部14に出力しないこととなる。 Note that, for a registered vocabulary that is not associated with a plurality of voice models, such as “child lock”, the
また、音声認識部13は、所定の閾値を有しており、入力した音声の音圧が雑音によるものなど所定の閾値未満である場合、登録語彙に該当するか否か、及び話者の識別の判断を行わない構成となっている。 In addition, the
制御機器制御部14は、制御機器20の動作を制御するものである。制御機器制御部14は、例えば音声認識部13からテレビ23の電源をオフする旨の信号を受信した場合、テレビ23に対して電源をオフする制御信号を出力する。これにより、テレビ23の電源はオフすることとなる。 The control
また、制御機器制御部14は、音声認識部13により「ロック解除」などの登録語彙が特定の話者によって発話されたと識別された場合と、他の話者による発話されたと識別された場合とで、制御機器20への制御内容を異ならせる。なお、制御機器20への制御内容を異ならせるとは、制御信号の出力制御を異ならせるという意味であって、出力する制御信号の種類を異ならせる場合のみならず、制御信号の出力を禁止することも含む概念である。 In addition, the control
制御機器20への制御内容を異ならせる一例を説明する。例えば、制御機器制御部14は、音声認識部13により「ロック解除」の登録語彙が大人や高齢者によって発話されたと識別された場合、チャイルドロックによるロック状態を解除する制御信号を出力する。一方、制御機器制御部14は、「ロック解除」の登録語彙が特定の話者である子供によって発話されたと識別された場合、ロック状態の解除する制御信号を出力せず、ロック状態を維持し続ける。このように、制御機器制御部14は、登録語彙に基づく制御機器20に対する制御を異ならせて、子供にとって不適切な制御機器20の制御が可能となってしまう事態を防止する。なお、制御機器制御部14は、音声認識部13により「テレビ電源オン」などの他の登録語彙が子供によって発話されたと識別された場合、テレビ23等の制御機器の操作に不慣れな子供のために、テレビ23の電源オンと同時に、子供向けアニメ等の番組をつけることなどをしてもよい。 An example in which the control content to the
さらに、制御機器制御部14は、子供による発話の場合のみ、制御機器20への制御内容を異ならせるわけでなく、高齢者による発話によっても、制御機器20への制御内容を異ならせてもよい。例えば、制御機器制御部14は、音声認識部13により「テレビ電源オン」の登録語彙が子供や大人によって発話されたと識別された場合、単にテレビ23の電源をオンさせる制御信号を出力する。一方、制御機器制御部14は、「テレビ電源オン」の登録語彙が特定の話者である高齢者によって発話されたと識別された場合、テレビ23の電源をオンさせると共に、テレビ23が字幕等のデータを受信している場合には、字幕を大きくして、高齢者向けの制御を行う制御信号を出力する。これにより、高齢者向けの制御ができ、制御機器20より適切に制御することとなる。 Furthermore, the control
装置制御部15は、操作ボタン11bによって入力された入力内容を認識して、その旨の信号を制御機器制御部14に出力するものである。例えばふろ自動ボタン11b3が操作された場合、装置制御部15は、自動に湯をはる旨の信号を制御機器制御部14に出力する。これにより、制御機器制御部14は、設定温度及び設定湯量で湯をはる旨の制御信号を浴室装置21に出力する。そして、浴室装置21は、設定温度及び設定湯量で湯をはることとなる。 The
次に、本実施形態に係る音声認識装置10の動作の概略を説明する。まず、ユーザが操作ボタン11bを操作して音声認識装置10をボタン操作入力モードから音声入力モードに移行させる。これにより、ユーザは、発話によって制御機器20を制御可能となる。 Next, an outline of the operation of the
そして、大人や高齢者により「ロック解除」と発話されたとする。この場合、音声認識部13は、大人や高齢者によって「ロック解除」と発話されたと判断し、その登録語彙の情報と話者(大人や高齢者)の情報とを制御機器制御部14に送信する。これにより、制御機器制御部14は、制御機器20のロック状態を解除することとなる。 Then, it is assumed that “unlocked” is spoken by an adult or an elderly person. In this case, the
また、子供により「ロック解除」と発話されたとする。この場合、音声認識部13は、子供によって「ロック解除」と発話されたと判断し、その登録語彙の情報と話者(子供)の情報とを制御機器制御部14に送信する。これにより、制御機器制御部14は、大人や高齢者によって「ロック解除」と発話された場合と制御を異ならせることとなる。すなわち、制御機器制御部14は、制御機器20のロック状態を解除せず、ロック状態を維持することとなる。 Also, suppose that the child has spoken “unlocked”. In this case, the
さらに、大人により「テレビ電源オン」と発話されたとする。この場合、音声認識部13は、大人によって「テレビ電源オン」と発話されたと判断し、その登録語彙の情報と話者(子供や大人)の情報とを制御機器制御部14に送信する。これにより、制御機器制御部14は、テレビ23の電源をオンさせることとなる。 Furthermore, suppose that an adult says “TV power on”. In this case, the
また、子供により「テレビ電源オン」と発話されたとする。この場合、音声認識部13は、子供によって「テレビ電源オン」と発話されたと判断し、その登録語彙の情報と話者(子供)の情報とを制御機器制御部14に送信する。これにより、制御機器制御部14は、大人によって「テレビ電源オン」と発話された場合と制御を異ならせることとなる。すなわち、制御機器制御部14は、単にテレビ23の電源をオンするだけでなく、テレビ23を子供向けの番組をつけ、子供向けの制御をすることとなる。 Also, suppose that a child says “TV power on”. In this case, the
また、高齢者により「テレビ電源オン」と発話されたとする。この場合、音声認識部13は、高齢者によって「テレビ電源オン」と発話されたと判断し、その登録語彙の情報と話者(高齢者)の情報とを制御機器制御部14に送信する。これにより、制御機器制御部14は、子供や大人によって「テレビ電源オン」と発話された場合と制御を異ならせることとなる。すなわち、制御機器制御部14は、単にテレビ23の電源をオンするだけでなく、テレビ23の字幕を大きくして、高齢者向けの制御をすることとなる。 Also, suppose that an elderly person says “TV power on”. In this case, the
次に、本実施形態に係る音声認識装置10の詳細動作を説明する。図5は、図1に示した音声認識装置10の動作の詳細を示すフローチャートである。なお、図5に示す処理は音声認識装置10の電源がオフされるまで繰り返される。 Next, detailed operation of the
図5に示すように、まず、音声認識部13は、ユーザからの発話音声を入力したか否かを判断する(S1)。この際、音声認識部13は、入力した音声の音圧と所定の閾値とに基づいて発話音声が入力したか否かを判断する。ユーザからの発話音声を入力しなかったと判断した場合(S1:NO)、すなわち、所定の閾値未満の音圧を有する音声が入力した場合、処理はステップS1の処理を繰り返すこととなる。 As shown in FIG. 5, first, the
一方、ユーザからの発話音声を入力したと判断した場合(S1:YES)、すなわち、所定の閾値以上の音圧を有する音声が入力した場合、音声認識部13は、音声認識処理を実行する(S2)。この音声認識処理において、ユーザからの発話音声は、どの登録語彙に該当するか、並びに、話者は子供、大人、及び高齢者のいずれかであったかが判断されることとなる。 On the other hand, when it is determined that the speech voice from the user is input (S1: YES), that is, when a voice having a sound pressure equal to or higher than a predetermined threshold is input, the
その後、音声認識部13は、ユーザからの発話音声が登録語彙に該当したか否かを判断する(S3)。ユーザからの発話音声が登録語彙に該当しなかったと判断した場合(S3:NO)、処理はステップS1に移行する。一方、ユーザからの発話音声が登録語彙に該当したと判断した場合(S3:YES)、音声認識部13は、話者が子供であったか否かを判断する(S4)。すなわち、音声認識部13は、子供音声モデルにより発話音声が認識されたか否かを判断することとなる。 After that, the
子供音声モデルにより発話音声が認識された場合(S4:YES)、制御機器制御部14は、子供向けの制御を行う(S6)。例えば、「ロック解除」の登録語彙が認識されたとしても、ロックを解除する旨の制御信号を制御機器20に出力することなく、子供にとって適切な制御を行う。その後、図5に示す処理は終了する。 When the speech voice is recognized by the child voice model (S4: YES), the control
一方、子供音声モデルにより発話音声が認識されなかった場合(S4:NO)、音声認識部13は、話者が高齢者であったか否かを判断する(S5)。すなわち、音声認識部13は、高齢者音声モデルにより発話音声が認識されたか否かを判断することとなる。 On the other hand, when the utterance voice is not recognized by the child voice model (S4: NO), the
高齢者音声モデルにより発話音声が認識された場合(S5:YES)、制御機器制御部14は、高齢者向けの制御を行う(S6)。例えば、「テレビ電源オン」の登録語彙が認識された場合に、テレビ23の電源をオンするだけでなく、字幕等の文字を大きく表示するなど、テレビ23に出力する制御信号の内容を変更して、高齢者にとって適切な制御を行う。その後、図5に示す処理は終了する。 When the speech voice is recognized by the elderly person voice model (S5: YES), the control
一方、高齢者音声モデルにより発話音声が認識されなかった場合(S5:NO)、登録語彙は、大人音声モデル又は一般音声モデルによって認識されたこととなる。このため、制御機器制御部14は、通常の制御を行う(S7)。その後、図5に示す処理は終了する。 On the other hand, when the utterance speech is not recognized by the elderly speech model (S5: NO), the registered vocabulary is recognized by the adult speech model or the general speech model. For this reason, the control
このようにして、本実施形態に係る音声認識装置10によれば、複数の音声モデルに基づいて話者を識別し、登録語彙が特定の話者によって発話された場合と、他の話者による発話であると識別された場合とで制御機器20への制御内容を異ならせる。このため、話者に応じて制御信号を異ならせることとなり、話者に応じて制御機器20を制御することができ、制御機器20を話者に応じて適切に制御することができる。さらに、複数の音声モデルにより話者を識別する手法は、従来の音声認識装置に対して処理量の大幅な増加やハードウェアの追加をする必要性がない。従って、処理負荷やコストの大幅な増大を招くことなく、制御機器20をより適切に制御することができる。 In this way, according to the
また、子供音声モデルを記憶し、登録語彙が子供によって発話されたと識別した場合と、他の話者によって発話されたと識別した場合とで、制御機器20への制御内容を異ならせる。このため、子供用の制御を行うことが可能となり、制御機器20がテレビ23であってテレビ23の電源をオンする登録語彙が認識された場合に子供向けアニメ等の番組をつけることなどができる。従って、例えば、制御機器20の操作が不慣れな子供に対して利便性を向上させることができる。 Also, the child voice model is stored, and the control content to the
また、登録語彙が子供によって発話されたと識別された場合に制御信号の出力をせず、登録語彙が子供を除く他の話者によって発話されたと識別された場合に制御信号を出力する。このため、制御機器20が浴室装置21である場合に湯温の設定を禁止したり、制御機器20がパーソナルコンピュータ等のインターネット接続が可能な機器である場合に成人向けコンテンツへの接続を禁止したりなど、不用意に制御機器20を動かしてしまいがちな子供に対して制御機器20をより適切に制御することができる。 Further, when the registered vocabulary is identified as uttered by a child, no control signal is output, and when the registered vocabulary is identified as uttered by another speaker other than the child, a control signal is output. For this reason, when the
また、ロック解除語彙を登録語彙として記憶し、ロック解除語彙が子供によって発話された識別した場合、子供による制御機器20の制御を許可しない。このため、子供によってチャイルドロックが解除されてしまい、子供にとって不適切な制御内容が制御可能となってしまう事態を防止することができる。 Further, when the unlocked vocabulary is stored as a registered vocabulary and the unlocked vocabulary is identified as uttered by a child, the control of the
また、高齢者音声モデルを記憶し、登録語彙が高齢者によって発話された識別した場合、制御機器20に対して、予め登録された高齢者向けの制御をする。このため、制御機器20がパーソナルコンピュータ等の文字を表示するものであって、高齢者からの発話により電源がオンされた場合に、文字を大きく表示することや、制御機器20がマッサージ機である場合に、強くマッサージし過ぎないようにすることができる。従って、高齢者向けの制御が可能となって、制御機器20をより適切に制御することができる。 In addition, when the elderly speech model is stored and the registered vocabulary is identified as spoken by the elderly, the
また、特定の登録語彙に対してのみ、複数の音声モデルを記憶しているため、話者を識別する必要がない語彙について、話者の識別処理を省略して処理負荷の軽減を図ることができる。 In addition, since a plurality of speech models are stored only for a specific registered vocabulary, it is possible to reduce the processing load by omitting the speaker identification process for a vocabulary that does not need to identify the speaker. it can.
以上、本発明に係る音声認識装置を実施形態に基づいて説明したが、本発明はこれに限定されるものではなく、本発明の趣旨を逸脱しない範囲で、変更を加えてもよい。 As described above, the speech recognition apparatus according to the present invention has been described based on the embodiment. However, the present invention is not limited to this, and modifications may be made without departing from the spirit of the present invention.
例えば、本実施形態では、テレビ23の字幕を大きくすることを高齢者向けの制御の一例として説明したが、高齢者向けの制御はこれに限られるものではない。例えば、「テレビ電源オン」の登録語彙を高齢者音声モデルにより認識した場合、テレビ23の電源をオンすることにあわせて、テレビ23の音量を大きくするようにしてもよい。また、制御機器20がパーソナルコンピュータである場合にも同様に、文字等のフォントを大きくしたり、音量を大きくしたりしてもよい。また、制御機器20が、パーソナルコンピュータ等の音声ガイダンスを流す機器である場合、ガイダンス音声を比較的ゆっくりと流すようにしてもよい。さらに、制御機器20がマッサージ機である場合、強くマッサージし過ぎないようにしてもよい。 For example, in this embodiment, increasing the subtitles of the
また、本実施形態では、「ロック解除」を子供音声モデルにより認識した場合、ロックを解除しないこと等を、子供向けの制御として説明したが、子供向けの制御は、これに限られるものではない。例えば、テレビ23やパーソナルコンピュータ等によって、子供が成人向けの番組やコンテンツを視聴しようとした場合に、視聴を禁止するように制御を行ってもよいし、子供がウェブブラウザや動画検索サイトにおいて検索を行った場合に、検索結果から成人向けコンテンツを取り除くフィルタを機能させるようにしてもよい。 Further, in the present embodiment, when “unlock” is recognized by the child voice model, the description that the lock is not released is described as the control for the child, but the control for the child is not limited to this. . For example, when a child tries to watch an adult-oriented program or content on the
また、本実施形態では、大人、子供及び高齢者を識別する例を説明したが、これに限らず、例えば男性や女性、AさんやBさんなどの特定人を識別するようにされていてもよい。この場合、制御機器20を男性向けにカスタマイズしたり、女性用にカスタマイズしたりすることができる。同様に、制御機器20が音響機器であって、Aさんの発話により電源がオンされた場合に、Aさんが好み重低音を大きくすることなどできる。 In the present embodiment, an example of identifying an adult, a child, and an elderly person has been described. However, the present invention is not limited to this. For example, a specific person such as a male or female, Mr. A or Mr. B may be identified. Good. In this case, the
また、本実施形態では、操作ボタン11bを操作することにより音声入力モードとボタン操作入力モードと切り替え可能となっているが、これに限らず、音声入力モード中には、発話によりボタン操作入力モードへ移行させるようにしてもよい。 Further, in the present embodiment, the voice input mode and the button operation input mode can be switched by operating the
1 音声認識システム
10 音声認識装置
11 コントローラ
11a 音声入力部
11b 操作ボタン
11c 表示部
11d LEDランプ
12 記憶部
12a 登録語彙記憶部
12b 音声モデル記憶部
13 音声認識部
14 制御機器制御部
15 装置制御部
20 制御機器
21 浴室装置
22 換気扇
23 テレビDESCRIPTION OF
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2007277232AJP2009104020A (en) | 2007-10-25 | 2007-10-25 | Voice recognition device |
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2007277232AJP2009104020A (en) | 2007-10-25 | 2007-10-25 | Voice recognition device |
| Publication Number | Publication Date |
|---|---|
| JP2009104020Atrue JP2009104020A (en) | 2009-05-14 |
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2007277232APendingJP2009104020A (en) | 2007-10-25 | 2007-10-25 | Voice recognition device |
| Country | Link |
|---|---|
| JP (1) | JP2009104020A (en) |
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN102192172A (en)* | 2010-03-08 | 2011-09-21 | 艾美特电器(深圳)有限公司 | Voice control electric fan |
| JP2011248020A (en)* | 2010-05-25 | 2011-12-08 | Sony Corp | Search device, search method, and program |
| WO2015029379A1 (en)* | 2013-08-29 | 2015-03-05 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | Device control method, display control method, and purchase payment method |
| JP2017517027A (en)* | 2014-07-18 | 2017-06-22 | グーグル インコーポレイテッド | Speaker verification using collocation information |
| JP2018146898A (en)* | 2017-03-08 | 2018-09-20 | パナソニックIpマネジメント株式会社 | Apparatus, robot, method, and program |
| US10134398B2 (en) | 2014-10-09 | 2018-11-20 | Google Llc | Hotword detection on multiple devices |
| CN109545213A (en)* | 2018-12-24 | 2019-03-29 | 珠海格力电器股份有限公司 | Equipment control method and device, storage medium and air conditioner |
| CN110097885A (en)* | 2018-01-31 | 2019-08-06 | 深圳市锐吉电子科技有限公司 | A kind of sound control method and system |
| WO2019204252A1 (en)* | 2018-04-16 | 2019-10-24 | Google Llc | Automated assistants that accommodate multiple age groups and/or vocabulary levels |
| WO2019202666A1 (en)* | 2018-04-17 | 2019-10-24 | 三菱電機株式会社 | Apparatus control system and apparatus control method |
| US10497364B2 (en) | 2017-04-20 | 2019-12-03 | Google Llc | Multi-user authentication on a device |
| CN114974216A (en)* | 2022-05-12 | 2022-08-30 | 北京探境科技有限公司 | Speech recognition model, method, device and storage medium with children sound discrimination |
| US11676608B2 (en) | 2021-04-02 | 2023-06-13 | Google Llc | Speaker verification using co-location information |
| US11942095B2 (en) | 2014-07-18 | 2024-03-26 | Google Llc | Speaker verification using co-location information |
| US12046241B2 (en) | 2014-10-09 | 2024-07-23 | Google Llc | Device leadership negotiation among voice interface devices |
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS6148897A (en)* | 1984-08-16 | 1986-03-10 | 松下電器産業株式会社 | Voice recognition equipment |
| JPH1165587A (en)* | 1997-08-18 | 1999-03-09 | Honda Motor Co Ltd | Voice input device for vehicles |
| JP2000089783A (en)* | 1999-09-13 | 2000-03-31 | Seiko Epson Corp | Speech recognition method, speech recognition device, and recording medium recording speech recognition processing program |
| JP2001005487A (en)* | 1999-06-18 | 2001-01-12 | Mitsubishi Electric Corp | Voice recognition device |
| JP2002267252A (en)* | 2001-03-12 | 2002-09-18 | Rinnai Corp | Hot water supply system |
| JP2003337593A (en)* | 2002-05-17 | 2003-11-28 | Victor Co Of Japan Ltd | Remote controller and electronic equipment |
| JP2004184715A (en)* | 2002-12-04 | 2004-07-02 | Nissan Motor Co Ltd | Voice recognition device |
| JP2005180786A (en)* | 2003-12-19 | 2005-07-07 | Noritz Corp | Hot water system |
| JP2006078791A (en)* | 2004-09-09 | 2006-03-23 | Denso Corp | Voice recognition device |
| JP2007057805A (en)* | 2005-08-24 | 2007-03-08 | Denso Corp | Information processing apparatus for vehicle |
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS6148897A (en)* | 1984-08-16 | 1986-03-10 | 松下電器産業株式会社 | Voice recognition equipment |
| JPH1165587A (en)* | 1997-08-18 | 1999-03-09 | Honda Motor Co Ltd | Voice input device for vehicles |
| JP2001005487A (en)* | 1999-06-18 | 2001-01-12 | Mitsubishi Electric Corp | Voice recognition device |
| JP2000089783A (en)* | 1999-09-13 | 2000-03-31 | Seiko Epson Corp | Speech recognition method, speech recognition device, and recording medium recording speech recognition processing program |
| JP2002267252A (en)* | 2001-03-12 | 2002-09-18 | Rinnai Corp | Hot water supply system |
| JP2003337593A (en)* | 2002-05-17 | 2003-11-28 | Victor Co Of Japan Ltd | Remote controller and electronic equipment |
| JP2004184715A (en)* | 2002-12-04 | 2004-07-02 | Nissan Motor Co Ltd | Voice recognition device |
| JP2005180786A (en)* | 2003-12-19 | 2005-07-07 | Noritz Corp | Hot water system |
| JP2006078791A (en)* | 2004-09-09 | 2006-03-23 | Denso Corp | Voice recognition device |
| JP2007057805A (en)* | 2005-08-24 | 2007-03-08 | Denso Corp | Information processing apparatus for vehicle |
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN102192172A (en)* | 2010-03-08 | 2011-09-21 | 艾美特电器(深圳)有限公司 | Voice control electric fan |
| JP2011248020A (en)* | 2010-05-25 | 2011-12-08 | Sony Corp | Search device, search method, and program |
| US10152976B2 (en) | 2013-08-29 | 2018-12-11 | Panasonic Intellectual Property Corporation Of America | Device control method, display control method, and purchase settlement method |
| WO2015029379A1 (en)* | 2013-08-29 | 2015-03-05 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | Device control method, display control method, and purchase payment method |
| JPWO2015029379A1 (en)* | 2013-08-29 | 2017-03-02 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | Device control method, display control method, and purchase settlement method |
| JP2017517027A (en)* | 2014-07-18 | 2017-06-22 | グーグル インコーポレイテッド | Speaker verification using collocation information |
| JP2019152867A (en)* | 2014-07-18 | 2019-09-12 | グーグル エルエルシー | Speaker verification using co-location information |
| US10147429B2 (en) | 2014-07-18 | 2018-12-04 | Google Llc | Speaker verification using co-location information |
| JP2021193466A (en)* | 2014-07-18 | 2021-12-23 | グーグル エルエルシーGoogle LLC | Speaker verification using co-location information |
| JP7384877B2 (en) | 2014-07-18 | 2023-11-21 | グーグル エルエルシー | Speaker matching using collocation information |
| US11942095B2 (en) | 2014-07-18 | 2024-03-26 | Google Llc | Speaker verification using co-location information |
| US12254884B2 (en) | 2014-10-09 | 2025-03-18 | Google Llc | Hotword detection on multiple devices |
| US12046241B2 (en) | 2014-10-09 | 2024-07-23 | Google Llc | Device leadership negotiation among voice interface devices |
| US11915706B2 (en) | 2014-10-09 | 2024-02-27 | Google Llc | Hotword detection on multiple devices |
| US10134398B2 (en) | 2014-10-09 | 2018-11-20 | Google Llc | Hotword detection on multiple devices |
| US10909987B2 (en) | 2014-10-09 | 2021-02-02 | Google Llc | Hotword detection on multiple devices |
| US11557299B2 (en) | 2014-10-09 | 2023-01-17 | Google Llc | Hotword detection on multiple devices |
| US10593330B2 (en) | 2014-10-09 | 2020-03-17 | Google Llc | Hotword detection on multiple devices |
| JP2018146898A (en)* | 2017-03-08 | 2018-09-20 | パナソニックIpマネジメント株式会社 | Apparatus, robot, method, and program |
| US11721326B2 (en) | 2017-04-20 | 2023-08-08 | Google Llc | Multi-user authentication on a device |
| US10522137B2 (en) | 2017-04-20 | 2019-12-31 | Google Llc | Multi-user authentication on a device |
| US10497364B2 (en) | 2017-04-20 | 2019-12-03 | Google Llc | Multi-user authentication on a device |
| US11087743B2 (en) | 2017-04-20 | 2021-08-10 | Google Llc | Multi-user authentication on a device |
| US11727918B2 (en) | 2017-04-20 | 2023-08-15 | Google Llc | Multi-user authentication on a device |
| US11238848B2 (en) | 2017-04-20 | 2022-02-01 | Google Llc | Multi-user authentication on a device |
| CN110097885A (en)* | 2018-01-31 | 2019-08-06 | 深圳市锐吉电子科技有限公司 | A kind of sound control method and system |
| KR20240013280A (en)* | 2018-04-16 | 2024-01-30 | 구글 엘엘씨 | Automated assistants that accommodate multiple age groups and/or vocabulary levels |
| CN112119454B (en)* | 2018-04-16 | 2024-05-14 | 谷歌有限责任公司 | Automatic assistant adapted to multiple age groups and/or vocabulary levels |
| KR20220133312A (en)* | 2018-04-16 | 2022-10-04 | 구글 엘엘씨 | Automated assistants that accommodate multiple age groups and/or vocabulary levels |
| US11495217B2 (en) | 2018-04-16 | 2022-11-08 | Google Llc | Automated assistants that accommodate multiple age groups and/or vocabulary levels |
| KR102768530B1 (en) | 2018-04-16 | 2025-02-17 | 구글 엘엘씨 | Automated assistants that accommodate multiple age groups and/or vocabulary levels |
| US10573298B2 (en) | 2018-04-16 | 2020-02-25 | Google Llc | Automated assistants that accommodate multiple age groups and/or vocabulary levels |
| CN118471216A (en)* | 2018-04-16 | 2024-08-09 | 谷歌有限责任公司 | Automatic assistant adapted to multiple age groups and/or vocabulary levels |
| JP7064018B2 (en) | 2018-04-16 | 2022-05-09 | グーグル エルエルシー | Automated assistant dealing with multiple age groups and / or vocabulary levels |
| WO2019204252A1 (en)* | 2018-04-16 | 2019-10-24 | Google Llc | Automated assistants that accommodate multiple age groups and/or vocabulary levels |
| US11756537B2 (en) | 2018-04-16 | 2023-09-12 | Google Llc | Automated assistants that accommodate multiple age groups and/or vocabulary levels |
| JP2021513119A (en)* | 2018-04-16 | 2021-05-20 | グーグル エルエルシーGoogle LLC | Automated assistants dealing with multiple age groups and / or vocabulary levels |
| KR102627948B1 (en) | 2018-04-16 | 2024-01-23 | 구글 엘엘씨 | Automated assistants that accommodate multiple age groups and/or vocabulary levels |
| CN112119454A (en)* | 2018-04-16 | 2020-12-22 | 谷歌有限责任公司 | Automated assistant that accommodates multiple age groups and/or vocabulary levels |
| EP4296846A3 (en)* | 2018-04-16 | 2024-03-20 | Google LLC | Automated assistants that accommodate multiple age groups and/or vocabulary levels |
| WO2019202666A1 (en)* | 2018-04-17 | 2019-10-24 | 三菱電機株式会社 | Apparatus control system and apparatus control method |
| CN111936981A (en)* | 2018-04-17 | 2020-11-13 | 三菱电机株式会社 | Device control system and device control method |
| JPWO2019202666A1 (en)* | 2018-04-17 | 2020-12-03 | 三菱電機株式会社 | Equipment control system and equipment control method |
| US11533191B2 (en) | 2018-04-17 | 2022-12-20 | Mitsubishi Electric Corporation | Apparatus control system and apparatus control method |
| CN109545213A (en)* | 2018-12-24 | 2019-03-29 | 珠海格力电器股份有限公司 | Equipment control method and device, storage medium and air conditioner |
| US11676608B2 (en) | 2021-04-02 | 2023-06-13 | Google Llc | Speaker verification using co-location information |
| CN114974216A (en)* | 2022-05-12 | 2022-08-30 | 北京探境科技有限公司 | Speech recognition model, method, device and storage medium with children sound discrimination |
| Publication | Publication Date | Title |
|---|---|---|
| JP2009104020A (en) | Voice recognition device | |
| JP2009109587A (en) | Voice recognition control device | |
| US7765045B2 (en) | Manual operation system | |
| JPWO2019013316A1 (en) | Equipment control system | |
| WO2015128960A1 (en) | In-vehicle control apparatus and in-vehicle control method | |
| JP2003114698A (en) | Command acceptance device and program | |
| JP4872241B2 (en) | TV receiver | |
| WO2016031405A1 (en) | Device for supporting everyday life of patients with cerebral dysfunction | |
| JP2021032906A (en) | Receiving device | |
| JP2009104025A (en) | Voice recognition control device | |
| JP2009109536A (en) | Speech recognition system and speech recognition apparatus | |
| JP4915665B2 (en) | Controller with voice recognition function | |
| JP2009080183A (en) | Voice recognition control device | |
| JP4760477B2 (en) | Bathroom device and voice operation system used therefor | |
| JPH07104962A (en) | Dialogue system | |
| JP2006058641A (en) | Voice recognition device | |
| JP2005180786A (en) | Hot water system | |
| JP2009109535A (en) | Voice recognition device | |
| JP3805324B2 (en) | Surveillance / control method and video camera apparatus using the same | |
| JP2007264327A (en) | Bathroom apparatus and voice operation device used therefor | |
| JP6748535B2 (en) | Personal identification system | |
| JP7471923B2 (en) | Automatic door device, guidance system, guidance device, and guidance method | |
| JP2010060628A (en) | Karaoke device | |
| JP2008210056A (en) | Load control unit | |
| JP2006061679A (en) | System and method for providing help information in medical ultrasound equipment |
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination | Free format text:JAPANESE INTERMEDIATE CODE: A621 Effective date:20100419 | |
| A977 | Report on retrieval | Free format text:JAPANESE INTERMEDIATE CODE: A971007 Effective date:20110831 | |
| A131 | Notification of reasons for refusal | Free format text:JAPANESE INTERMEDIATE CODE: A131 Effective date:20110913 | |
| A521 | Request for written amendment filed | Free format text:JAPANESE INTERMEDIATE CODE: A523 Effective date:20111109 | |
| A711 | Notification of change in applicant | Free format text:JAPANESE INTERMEDIATE CODE: A712 Effective date:20120111 | |
| A02 | Decision of refusal | Free format text:JAPANESE INTERMEDIATE CODE: A02 Effective date:20120306 |