Movatterモバイル変換


[0]ホーム

URL:


DE19615437C1 - Video recorder programming method - Google Patents

Video recorder programming method

Info

Publication number
DE19615437C1
DE19615437C1DE1996115437DE19615437ADE19615437C1DE 19615437 C1DE19615437 C1DE 19615437C1DE 1996115437DE1996115437DE 1996115437DE 19615437 ADE19615437 ADE 19615437ADE 19615437 C1DE19615437 C1DE 19615437C1
Authority
DE
Germany
Prior art keywords
video recorder
speech
program
database
programming
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
DE1996115437
Other languages
German (de)
Inventor
Alexander Prof Dr Waibel
Ivica Rogina
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Karlsruher Institut fuer Technologie KIT
Original Assignee
Universitaet Karlsruhe
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Universitaet KarlsruhefiledCriticalUniversitaet Karlsruhe
Priority to DE1996115437priorityCriticalpatent/DE19615437C1/en
Application grantedgrantedCritical
Publication of DE19615437C1publicationCriticalpatent/DE19615437C1/en
Anticipated expirationlegal-statusCritical
Expired - Fee Relatedlegal-statusCriticalCurrent

Links

Classifications

Landscapes

Abstract

The method involves generating the video recorder (1) programming information from the external speech and an internal database. The control signals are natural, spontaneously spoken speech signals received by a continuous speech detector. A parser operated in conjunction with the detector to analyse, extract and categorise the speech signals into case frames. The internal database is dynamically determined. A dialogue is conducted to resolve the ambiguities and repetitions, and to perform modifications. The dynamic determination of the database involves dynamically updating the television programme.

Description

Translated fromGerman

Die Erfindung betrifft ein Verfahren und eine Einrichtung zur Programmierung eines Videorecorders.The invention relates to a method and a device for programminga VCR.

Eine der häufigsten Klagen von Videorecorderbesitzern ist diejenige, daß es sehr schwierig ist, zu verstehen, wie ein Videorecorder zu programmieren ist. Die Problematik wird auch dadurch sichtbar, daß Methoden, die das Programmieren erleichtern, gesucht werden. Durchgesetzt hat sich zum Beispiel das SHOWVIEW Verfahren, das das Programmieren einer Sendung auf das Abtippen einer Ziffernfolge aus einer Fernsehzeitschrift beschränkt. Alternative Varianten dieser Methode bieten die Möglichkeit, mit Hilfe eines Handscanners sog. Barcodes aus Fernsehzeitschriften einzulesen. Das Verfahren hat allerdings die Nachteile, daß eine Fernsehzeitschrift mit SHOWVIEW Codes vorhanden sein muß, und daß in naher Zukunft, wenn hunderte von Sendern verfügbar sein werden, keine Zeitschrift mehr alle benötigten SHOWVIEW Codes enthalten wird. Außerdem hat sich SHOWVIEW in anderen Ländern außer Deutschland noch nicht durchgesetzt. Ein weiterer Nachteil dieser Methode ist die mangelnde Flexibilität bei unvorhergesehenen Programmänderungen. So ist es schwierig, den SHOWVIEW Code für eine gerade ins Programm auf genommene Sondersendung zu erhalten.One of the most common complaints from VCR ownersis that it's very difficult to understandhow to program a video recorder. TheThe problem also becomes apparent when methods,that make programming easier.For example, the SHOWVIEW has prevailedProcedure for programming a program on theTyping a sequence of digits from aTV magazine limited. Alternative variantsthis method offer the possibility of using aHand scanners so-called barcodes from television magazinesread in. However, the process has the disadvantagesthat a television magazine with SHOWVIEW codesmust exist, and that in the near future, ifhundreds of channels will be available, noneMagazine more all required SHOWVIEW codesis included. Besides, SHOWVIEW has been in othersCountries other than Germany have not yet been implemented. OnAnother disadvantage of this method is the lack of itFlexibility in the event of unforeseen program changes.So it is difficult to get the SHOWVIEW code straightto receive a special program recorded in the program. 

Es besteht auch bereits die Möglichkeit, Fernsteuerungen per Sprache zu bedienen. So sind z. B. aus der AT-PS 376 538 Fernsteuerungen bekannt, die mit Sprachanalysatoren gekoppelt sind und bestimmte Worte als Steuerbefehle erkennen und entsprechend umsetzen können. Bei diesen Sprachanalysatoren handelt es sich jedoch um 1 : 1-Einzelworterkenner, die ausschließlich die ihnen bekannten (zuvor eingespeisten) Worte aufnehmen und umsetzen, unabhängig davon, in welchem Zusammenhang sie gesprochen wurden. Das hat unter anderem den Nachteil, daß Steuerbefehle ausgelöst werden können, ohne daß dies vom Benutzer beabsichtigt war, allein deshalb, weil in einem beliebigen Gespräch, das im Empfangsbereich des Sprachanalysators stattgefunden hat, ein entsprechendes Wort gefallen. Zur Beseitigung dieses Nachteils wird in der AT-PS 376 538 vorgeschlagen, den Sprachanalysator mit einem Mikrophon zu koppeln, das eine sehr eng begrenzte Reichweite hat und praktisch nur solche Worte aufnimmt, die gezielt in das Mikrophon hineingesprochen werden.There is also the possibilityOperate remote controls by voice. So z. B.known from AT-PS 376 538 remote controls withSpeech analyzers are coupled and certain wordsrecognize them as control commands and implement them accordinglycan. These are speech analyzershowever, by 1: 1 single word recognizers, the onlythe words known to them (previously fed in)record and implement, regardless of whichContext they were spoken to. That has underanother disadvantage that control commands are triggeredcan be done without the user's intentionwas simply because in any conversation,that in the reception area of the speech analyzera corresponding word has been given.To eliminate this disadvantage is in theAT-PS 376 538 proposed using the speech analyzerto pair a microphone that is a very narrowly limitedHas reach and practically only takes up such wordsthat are specifically spoken into the microphone.

Die EP 0 496 492 A1 beschreibt ebenfalls einen Videorecorder, der durch Sprachsignale gesteuert wird, wobei auch hier als Sprachsignal nicht die natürliche, spontan gesprochene Umgangssprache verwendet werden kann, sondern konkrete, vorbestimmte Einzelwort-Instruktionen wie z. B.: "no", "yes", "return" oder "stop" gegeben werden müssen. Unklare oder falsche Sprachsignale werden nicht verstanden und im Zweifel ignoriert.EP 0 496 492 A1 also describes oneVCR controlled by voice signalsalthough the natural,spontaneously spoken slang can be usedcan, but concrete, predetermined single-wordInstructions such as For example: "no", "yes", "return" ormust be given "stop". Unclear or wrongSpeech signals are not understood and in doubtignored.

Alle diese sprachgesteuerten Fernsteuerungen haben den Nachteil, daß der mit ihnen gekoppelte Sprachanalysator keine kontinuierliche Sprache erkennt, und daß überhaupt nur solche Einzelworte bzw. -sprachsignale erkannt werden, die zuvor in eine konstante Datenbank eingespeist wurden.All of these voice-operated remote controls have thatDisadvantage that the speech analyzer coupled with themdoes not recognize continuous speech, and thatonly such single words or speech signals at all be recognized previously in a constant databasewere fed.

Der vorliegenden Erfindung liegt die Aufgabe zugrunde, ein Verfahren zur Programmierung eines Videorecorders bereitzustellen, das möglichst ergonomisch ist und mit dem die genannten Nachteile der im Stand der Technik bekannten Verfahren vermieden sind.The present invention is based on the objecta method of programming a VCRprovide that is as ergonomic as possible and withwhich the disadvantages mentioned in the prior artknown methods are avoided.

Eine Lösung dieser Aufgabe besteht in einem Verfahren der eingangs genannten Art, bei dem die Programmierinformation auf der Grundlage eines externen Sprachsignals und einer internen Datenbasis (Datenvorrat) generiert wird, wobei die Steuersignale natürliche, spontan gesprochene Sprachsignale sind, die von einem Kontinuierliche-Sprache-Erkenner und einem damit zusammenwirkenden Parser aufgenommen, analysiert, extrahiert und in "case-frames" kategorisiert werden,wobei die interne Datenbasis (der Datenvorrat) dynamisch festgelegt wird, wobei eine Dialogführung zur Auflösung von Ambiquitäten, Widersprüchen und für Modifikationsvorschläge vorgesehen ist, und wobei die dynamische Festlegung der Datenbasis durch die dynamische Aktualisierung des Fernsehprogramms erfolgt.One solution to this problem is a procedureof the type mentioned, in which theProgramming information based on an externalVoice signal and an internal database(Data pool) is generated, the control signalsare natural, spontaneously spoken speech signals thatof a continuous language recognizer and onethe parser interacting with it was recorded, analyzed,extracted and categorized into "case frames"the internal database (the data pool)is determined dynamically, with a dialog guide toResolution of ambiquities, contradictions and forModification proposals are provided, and thedynamic definition of the database by thedynamic update of the television program takes place.

Mit diesem Verfahren ist es erstmals möglich, einen Videorecorder dadurch zu programmieren, daß ihm der entsprechende Programmwunsch bzw. Befehl einfach mittels Sprachsignalen gesagt wird, z. B. mit natürlicher Sprache und zwar in der Art: "Nimm die Tagesschau im Ersten auf". Insbesondere Menschen die mit den technischen Erfordernissen der herkömmlichen Programmierverfahren überfordert sind, wie z. B. alte Menschen, kranke Menschen und Kinder, können so mit Hilfe des erfindungsgemäßen Verfahrens ohne irgendwelche technischen Vorkenntnisse und ohne besondere Einarbeitung einen Videorecorder zur Aufnahme von Fernsehsendungen beliebig programmieren. Es ist keine Tastatur mehr erforderlich, auch keine Zeitschrift mit ShowView Codes und auch kein Trainieren eines Einzelkommandoerkenners.With this procedure it is possible for the first time toTo program VCRs that thecorresponding program request or command simplyis said by means of voice signals, e.g. B. withnatural language in the way: "Take thatTagesschau in the first on ". Especially people whowith the technical requirements of conventionalProgramming methods are overwhelmed, such. B. oldPeople, sick people and children can do soHelp of the method according to the invention withoutany previous technical knowledge and without special training to record a video recorderprogram TV programs as you like. It isno more keyboard needed, neitherMagazine with ShowView codes and no traininga single command recognizer.

Das Spracherkennungsvokabular wird dynamisch festgelegt, und zwar im Fall der Programmierung für die Aufzeichnung von Fernsehsendungen beispielsweise durch die Fernsehprogrammdatenbasis.The speech recognition vocabulary is becoming dynamicset, in the case of programming for theRecording of television programs, for example, bythe television program database. 

Die Erfindung betrifft auch eine Einrichtung zur Programmierung eines über eine Fernbedienung bedienbaren Videorecorder auf der Grundlage des vorgenannten erfindungsgemäßen Verfahrens. Diese Einrichtung umfaßt einen Prozessor (Datenverarbeitungs­einrichtung) zur Bereitstellung der internen Datenbasis, einen Sprach-Erkenner, der mit dem Prozessor gekoppelt ist und der über ein Mikrophon gesteuert werden kann, und eine Steuerkarte, die einerseits ebenfalls mit dem Prozessor und andererseits unmittelbar mit der Fernbedienung und mittelbar mit dem Videorecorder so verbunden ist, daß Sprachsignale, die über den Sprach-Decoder zugeleitet werden, im Prozessor den entsprechenden Programmsignalen zugeordnet und ausgelesen werden, und die dann ihrerseits über die Fernbedienung den Videorecorder entsprechend pro­grammieren.The invention also relates to a device forProgramming one using a remote controloperable video recorder based on theaforementioned method according to the invention. ThisDevice comprises a processor (data processingfacility) to provide internalDatabase, a speech recognizer that works with theProcessor is coupled and via a microphonecan be controlled, and a control card thaton the one hand also with the processor and on the other handdirectly with the remote control and indirectly with theVCR is connected so that voice signals thatare passed through the voice decoder in the processorassigned to the corresponding program signals andbe read out, and then in turn via theRemote control the video recorder accordingly programming.

Mit dieser Einrichtung ist es möglich, Programmierdialoge direkt mit dem Videorecorder zu führen. Der Videorecorder erhält die notwendigen Informationen bezüglich des aktuell zur Verfügung stehenden Fernsehprogramms entweder von Videotexten von Disketten oder von CD-Rom-Disks oder über ein Modem aus einer Mailbox oder dem Internet mit Hilfe des Prozessors, der vorzugsweise in einem PC (Personalcomputer) oder in einem (gegebenenfalls reduzierten) Notebook-PC installiert ist. Im Fall von Videotexten als Informationsquelle sollte der Videorecorder mit dem Prozessor über einen Videotext-Umwandler funktional verbunden sein. Es ist ferner möglich mit einem Standard-Videorecorder (ohne integriertem Notebook) mittels programmierbarer Fernbedienung zu arbeiten.With this facility it is possibleProgramming dialogs directly with the video recorderto lead. The video recorder receives the necessary onesInformation regarding the currently availablestanding television program either from teletext byDiskettes or from CD-Rom discs or via a modema mailbox or the Internet using theProcessor, preferably in a PC(Personal computer) or in one (if applicablereduced) Notebook PC is installed. In case ofTeletext as a source of information shouldVCR with the processor via a teletextConverter be functionally connected. It is furtherpossible with a standard video recorder (withoutintegrated notebook) by means of programmableRemote control to work. 

Aus dem erhaltenen Informationsvorrat werden die von dem gesprochenen Befehl bzw. Wunsch betroffenen Daten herausgesucht und zur Programmierung eingesetzt.The information received from thethe spoken command or request affected dataselected and used for programming.

Um gegebenenfalls unklare Befehlseingaben klarzustellen, ist bei einer bevorzugten Ausführungsform der Erfindung vorgesehen, den Sprach-Erkenner zusätzlich mit einem Lautsprecher zu koppeln, so daß aufgetretene Unklarheiten vom Prozessor in eine entsprechende Frage umgewandelt werden können, die dann über den Lautsprecher in Form einer gesprochenen Rückfrage angegeben wird.To possibly unclear command inputsClarifying is one of the preferred onesEmbodiment of the invention provided theSpeech recognizer additionally with a loudspeakercouple so that any ambiguities from the processorcan be converted into a corresponding questionwhich then over the speaker in the form of aspoken query is specified.

Die Erfindung wird im folgenden anhand von in der Zeichnung dargestellten Ausführungsbeispielen und anhand von Funktionsbeispielen näher erläutert. Es zeigt:The invention is described below with reference to in theDrawing illustrated embodiments andexplained in more detail using functional examples. Itshows:

Fig. 1 einen funktionalen Schemaaufbau einer erfindungsgemäßen Einrichtung zum Programmieren eines Videorecorders, undFig. 1 is a functional schematic construction of a device according to the invention for programming a video recorder, and

Fig. 2 eine etwas detailliertere bzw. integrierte Funktionsdarstellung der Einrichtung zum Programmieren eines Videorecorders nachFig. 1FIG. 2 shows a somewhat more detailed or integrated functional representation of the device for programming a video recorder according toFIG. 1

Die inFig. 1 dargestellte Einrichtung umfaßt einen handelsüblichen Notebook-PC6 mit mindestens drei Schnittstellen5,9,11, und einer Hauptplatine, die mit einem ausreichend starken Prozessor, beispielsweise einem 486 DX-Prozessor, und einem RAM-Arbeitsspeicher (mit mindestens 8 MB) ausgerüstet ist. Der Notebook-PC6 umfaßt ferner einen Festplattenspeicher mit einer Speicherkapazität von beispielsweise 40 MB, eine Soundkarte (Sprach-Ausgabe)12 mit einem Auflösevermögen von beispielsweise 8 Bit oder 16 Bit einschließlich einem dazugehörigen Softwaretreiber und Meß-Steuer-/Regelkarte(n)3 einschließlich zugehöriger Treiber zum Bedienen von mehreren (mindestens 15) Schalter (9 V, 100 mA). Als Steuer-/Regelkarte3 kann ein einfaches steuerbares Transistor-Array verwendet werden.The device shown inFig. 1 comprises a commercially available notebook PC6 with at least three interfaces5 ,9 ,11 , and a main board with a sufficiently strong processor, for example a 486 DX processor, and a RAM memory (with at least 8 MB). The notebook PC6 also includes a hard disk memory with a storage capacity of, for example, 40 MB, a sound card (voice output)12 with a resolution of, for example, 8 bits or 16 bits, including an associated software driver and measurement control / control card (s)3 including associated driver for operating several (at least 15) switches (9 V, 100 mA). A simple controllable transistor array can be used as the control card3 .

An die Soundkarte12 ist über Kabel13 ein Mikrophon14 angeschlossen, das die Sprachbefehle empfängt und weiterleitet.A microphone14 is connected to the sound card12 via cable13 and receives and forwards the voice commands.

In dem Notebook PC6 ist ein Spracherkennungsmodul implementiert. Zum Trainieren dieses Sprachmoduls kann ein semikontinuierliches "Hidden Markov Modell" verwendet werden, das auf Speicherverbrauch und Laufzeitverhalten optimiert ist. Das Vokabular sollte mindestens die Uhrzeiten und Datumsangaben, sowie die häufigsten Steuerwörter umfassen, und beispielsweise im Bereich zwischen 300 und 500 Wörtern liegen. Als Grammatik wird vorzugsweise eine Standard "Bigramm-Grammatik" eingesetzt. Die Trainingsdaten können zunächst beschränkt sein und die Erkennung kann sprecherabhängig erfolgen. Um eine sprecherunabhängige Erkennung zu erreichen, können Sprachaufnahmen von vielen verschiedenen Sprechern gesammelt und eingegeben werden. Die Funktionalität des Spracherkenners kann Off-Line (also ohne Anschluß an einen Videorecorder oder eine Fernsteuerung) ausgewertet und optimiert werden. Für den Anfang wird nur eine kleine abgelesene Datenbasis von einem Sprecher benötigt.A speech recognition module is implemented in the notebook PC6 . A semi-continuous "Hidden Markov Model" can be used to train this language module, which is optimized for memory consumption and runtime behavior. The vocabulary should include at least the times and dates, as well as the most common control words, and should be between 300 and 500 words, for example. A standard "bigram grammar" is preferably used as the grammar. The training data can initially be limited and the recognition can take place depending on the speaker. In order to achieve speaker-independent recognition, voice recordings from many different speakers can be collected and entered. The functionality of the speech recognizer can be evaluated and optimized off-line (i.e. without connection to a video recorder or remote control). To begin with, only a small, read database from a speaker is required.

In dem Notebook-PC6 ist außerdem ein einfacher Parser implementiert. Der Parser ist vorzugsweise semantisch basiert und in der Lage, aus einem gesprochenen Satz die Anfangs- und Endzeiten eines Aufnahmewunsches zu extrahieren. Außerdem erkennt er die häufigsten Recorderbedienungen (Bandspulen, Wiedergabe etc.). Die Ausgabe des Parsers erfolgt in einem Format, das von der Software, die die Steuer-/Regelkarte3 steuert, gelesen werden kann.A simple parser is also implemented in the notebook PC6 . The parser is preferably based on semantics and is able to extract the start and end times of a recording request from a spoken sentence. It also recognizes the most common recorder operations (reels, playback, etc.). The parser is output in a format that can be read by the software that controls the control card3 .

Die Software für die Steuerung der Steuer-/Regelkarte3 ist ebenfalls in dem Notebook-PC6 implementiert. Diese Software ist in der Lage, die Ausgaben des Parsers in Steuersignale für die Steuer-/Regelkarte3, die an die Fernbedienung2 angeschlossen ist, zu übersetzen. Sie ist von der Art des verwendeten Videorecorders1 bzw. von dessen Infrarot-Fernbedienung2 abhängig.The software for controlling the control card3 is also implemented in the notebook PC6 . This software is able to translate the outputs of the parser into control signals for the control card3 , which is connected to the remote control2 . It depends on the type of video recorder1 used or on its infrared remote control2 .

Das Notebook PC6 ist mit einer Infrarot-Fernbedienung2 eines handelsüblichen Videorecorders1 verbunden, indem die Schalter der einzelnen Tasten innerhalb des Fernbedienungsgehäuses mit Kabeln4 verbunden sind, die wiederum mit der Steuer-/Regelkarte3 verbunden sind. Auf diese Art ist es möglich, jede beliebige Tastenfolge auf der Fernbedienung2 auszulösen. Über die Software können nun die Funktionen des Videorecorders1 direkt angesprochen werden. (Die Bedienung des Videorecorders1 kann auch direkt über eine IR-Diode erfolgen).The notebook PC6 is connected to an infrared remote control2 of a commercially available video recorder1 by the switches of the individual buttons within the remote control housing being connected with cables4 , which in turn are connected to the control card3 . In this way it is possible to trigger any key sequence on the remote control2 . The functions of the video recorder1 can now be addressed directly via the software. (The video recorder1 can also be operated directly via an IR diode).

Das Gesamtsystem kann dadurch evaluiert und optimiert werden, daß Sätze zum Programmieren des Videorecorders1 in das Mikrophon14 gesprochen werden, wobei die Funktionalität und das Zusammenarbeiten aller Komponenten ausgewertet und eventuelle Schwachstellen behoben werden.The overall system can be evaluated and optimized in that sentences for programming the video recorder1 are spoken into the microphone14 , the functionality and the cooperation of all components being evaluated and any weak points being remedied.

An den Notebook-PC6 ist ein handelsüblicher Videotextdecoder7 angeschlossen, der über ein Koaxialkabel10 an den Ausgang8 des Videorecorders1 angeschlossen ist. So ist es möglich, Videotextseiten zu empfangen und auszulesen. Über die Fernbedienung2 kann der Tuner17 (Fig. 2) des Videorecorders1 auf verschiedene Programme geschaltet werden, so daß Videotextselten von verschiedenen Sendern empfangen werden können.A commercially available teletext decoder7 is connected to the notebook PC6 and is connected to the output8 of the video recorder1 via a coaxial cable10 . It is possible to receive and read teletext pages. Via the remote control2 , the tuner17 (Fig. 2) of the video recorder1 can be switched to different programs, so that teletext can be received by different stations.

In den Videorecorder1 wird die Software für das Auslesen der Videotextseiten implementiert. Die Software kann auf das Lesen von standardisierten Seiten der üblichen Fernsehkanäle, beispielsweise des ARD/ZDF Videotextes, beschränkt sein. Ebensogut kann diese Software (videotextgesteuert) modifizierbar und an sich verändernde Standards verschiedener Videotextanbieter anpaßbar sein.The software for reading out the teletext pages is implemented in the video recorder1 . The software can be limited to reading standardized pages of the usual television channels, for example the ARD / ZDF teletext. This software can also be modified (teletext controlled) and adapted to changing standards of different teletext providers.

In den Videorecorder1 wird außerdem ein sehr einfaches Datenbankmodul implementiert, das die aus dem Videotext ausgelesenen Sendungen und ihre Zeiten verwaltet. Die Software kann darauf beschränkt sein, nur die Start- und Endzeiten, das Programm, sowie den Titel der Sendung zu speichern. Ebensogut kann eine Software verwendet werden, die in der Lage ist, noch weitere Informationen zur Sendung zu speichern, wie z. B. Namen von Darstellern, Titel von Einzelthemen einer Reportage, oder ähnliche Daten, die sich gezielt aus dem Videotext herauslesen lassen. Als Ausblick sei hier angemerkt, daß viele Sender die Möglichkeit bieten, einzelne Videotextseiten für Werbezwecke zu mieten. Ein speziell für den sprachgesteuerten Videorecorder vorbereitetes und über Videotext gesendetes Programmagazin, in dem die benötigten Daten vereinheitlicht und leicht aus lesbar sind, würde sich als besonders geeignete Informationsquelle für die erfindungsgemäße Einrichtung anbieten.In the video recorder1 , a very simple database module is also implemented, which manages the programs read from the teletext and their times. The software can be limited to storing only the start and end times, the program and the title of the program. Software can also be used which is capable of storing further information about the program, such as. B. names of actors, titles of individual topics of a report, or similar data that can be read specifically from the teletext. As a view, it should be noted here that many broadcasters offer the possibility of renting individual teletext pages for advertising purposes. A program magazine specially prepared for the voice-controlled video recorder and sent via teletext, in which the required data is standardized and easily readable, would be a particularly suitable source of information for the device according to the invention.

Eine weitere, vorteilhafte Alternative wäre die Verteilung der Fernsehprogramminformationen über Computer-Disketten (oder auch CD-Rom Disks). Wie bereits erwähnt ist es auch möglich die Fernsehprogramminformationen von einer Mailbox oder vom Internet abzurufen. Das Lesegerät für das Programmagazin sollte Teil des Videorecorders1 sein, d. h. der Videorecorder1 wäre in diesem Fall mit einem Disketten- oder CD-Rom Laufwerk auszustatten (vergleicheFig. 2: Bezugszeichen21). Es ist aber auch möglich, die betreffenden Laufwerke in dem Notebook-PC6 zu installieren und über handelsübliche Schnittstellen mit dem Videorecorder1 zu koppeln.Another advantageous alternative would be the distribution of television program information via computer disks (or CD-Rom disks). As already mentioned, it is also possible to access the television program information from a mailbox or from the Internet. The reader for the program magazine should be part of the video recorder1 , ie the video recorder1 would in this case be equipped with a diskette or CD-ROM drive (seeFIG. 2: reference number21 ). However, it is also possible to install the relevant drives in the notebook PC6 and to couple them to the video recorder1 via commercially available interfaces.

Die aus den Videotextseiten entnommenen Informationen bzw. Daten können direkt auf der Festplatte des Notebook-PC6 abgelegt und von dort gelesen werden.The information or data taken from the teletext pages can be stored directly on the hard disk of the notebook PC6 and read from there.

Um die zur Programmierung benötigten Kommandos aus den Videotextseiten zu lesen und um die Parameter des Erkenners zu modifizieren ist ein Videotext­steuerinterface zwischen Spracherkenner und der Videotextlesesoftware implementiert. Das Interface bzw. diese Software kann auf die Anpassung des Vokabulars und der Bigramm-Grammatik beschränkt sein. Ebensogut kann eine Software verwendet werden, die alle anderen Parameter beeinflussen kann oder sogar den gesamten Erkenner durch eine neuere verbesserte Version austauschen kann - beispielsweise nach Art der Softwareverteilung über Videotext in Form des VIDEODAT Verfahrens.In order to use the commands required for programming from theTo read teletext pages and to adjust the parameters of theModifying recognizer is a teletextcontrol interface between speech recognizer and theTeletext reading software implemented. The interfaceor this software can be adapted to theVocabulary and bigram grammar may be limited.Software can be used just as well, allcan affect other parameters or even theentire recognizer through a newer improved versioncan exchange - for example by the type ofSoftware distribution via teletext in the form of VIDEODATProcedure.

Das Gesamtsystem kann dadurch evaluiert und optimiert werden, daß ein Tester Kommandos spricht, zu deren Ausführung es nötig ist, die videotexterzeugte Datenbank zu befragen und dann Programmiersequenzen (zum Beispiel über die Fernbedienung2) an den Videorecorder1 zu schicken, und daß anschließend alle Komponenten und ihre Zusammenarbeit ausgewertet und gegebenenfalls verändert werden. Es ist auch denkbar die Programmiersequenzen direkt über eine IR(Infrarot)-Diode an den Videorecorder1 zu schicken.The overall system can be evaluated and optimized in that a tester speaks commands, for the execution of which it is necessary to consult the teletext-generated database and then to send programming sequences (for example via the remote control2 ) to the video recorder1 , and then all components and their cooperation will be evaluated and changed if necessary. It is also conceivable to send the programming sequences directly to the video recorder1 via an IR (infrared) diode.

Um dem Benutzer zu bestätigen, daß sein Kommando korrekt verstanden wurde, und um ihm gegebenenfalls Gelegenheit zu geben, ein Mißverständnis aufzulösen und das falsch verstandene Kommando zu wiederholen, ist eine Feedback-Anzeige, entweder optisch über ein Display oder akustisch über eine Sprachausgabe vermittels Sprachsyntheseprogramm und Lautsprecher16 vorgesehen. Im Fall der Erfindungsvariante mit Sprachausgabe ist auf dem Notebook PC6 ein Sprachsyntheseprogramme installiert und der Ausgang der Soundkarte12 ist mit einem einfachen Lautsprecher16 verbunden. In dem Notebook-PC6 kann zusätzlich ein Dialogmodul implementiert sein, das eine einfache Dialogführung zwischen Benutzer und Videorecorder ermöglicht, beispielsweise eine Bestätigung der verstandenen Kommandos, d. h. eine Ausgabe der Art: "Ich werde die Sendung im ersten Programm von 20:15 Uhr bis 21:00 Uhr aufzeichnen" oder auch kompliziertere Dialoge, in deren Verlauf Unklarheiten ("Welche Tagesschau meinen Sie?") im Dialog mit dem Benutzer aufgelöst werden, Fehlprogrammierungen erkannt werden ("Morgen kommt kein Western."), Vorschläge gemacht werden ("Sie sollten dafür eine Kassette mit längerer Spieldauer einlegen."), und so weiter.In order to confirm to the user that his command has been understood correctly and, if necessary, to give him the opportunity to resolve a misunderstanding and to repeat the misunderstood command, there is a feedback display, either optically via a display or acoustically via a speech output using the speech synthesis program and speakers16 are provided. In the case of the variant of the invention with speech output, a speech synthesis program is installed on the notebook PC6 and the output of the sound card12 is connected to a simple loudspeaker16 . A dialog module can also be implemented in the notebook PC6 , which enables simple dialog guidance between the user and the video recorder, for example a confirmation of the commands understood, ie an output of the type: "I will start the program in the first program from 8:15 pm to 21:00 o'clock record "or more complicated dialogues, in the course of which ambiguities (" Which day show do you mean? ") Are resolved in the dialog with the user, incorrect programming is recognized (" Tomorrow no Western. "), Suggestions are made For this you should insert a cassette with a longer playing time. "), And so on.

Das Interface zwischen der Videotexteinheit und dem restlichen Programm kann eine einfache Standard-Kommandooberfläche (Shell) umfassen oder auch erweitert sein, wobei im Prinzip die gesamte Software verändert werden kann.The interface between the teletext unit and theremaining program can be a simple standardCommand surface (shell) include or expanded be, in principle, the entire software changescan be.

Zur Erweiterung der Dialogführung ist das Datenbankmodul so aufzubauen bzw. zu programmieren, daß es in den Anfragen Unklarheiten und Fehler erkennt und diese im Dialog mit dem Benutzer beseitigt. Die Bigramm-Grammatik wird entsprechend dem aktuellen Dialogzustand adaptiert, d. h. die aktuell zu erwartenden Worte des Benutzers werden mit einer höheren Wahrscheinlichkeit erkannt als die nicht zu erwartenden.This is to expand the dialogue managementTo set up or program the database modulethat it recognizes ambiguities and errors in the requestsand eliminated them in dialog with the user. TheBigram grammar is updated according to the current oneDialog state adapted, d. H. the currently tooexpected words of the user are marked with arecognized higher probability than that notexpecting.

Zum Aufbau einer Datensammlung für eine sprecherunabhängige Erkennung werden sog. Trainingsdaten gesammelt, d. h. Sprechproben von zahlreichen (unter Umständen mehreren hundert) verschiedenen Personen, um eine ausreichende Bandbreite von verschiedenen Stimmen und Sprechstilen zusammenzutragen. Die Sprechproben sollten die Form von Programmieranweisungen für einen Videorecorder zum Aufzeichnen von Fernsehsendungen haben.To build a data collection for aspeaker-independent recognition are so-calledTraining data collected, d. H. Speech samples fromnumerous (possibly several hundred)different people to have a sufficient rangeof different voices and speaking stylesto collect. The speech samples should take the form ofProgramming instructions for a video recorder forHave recordings of television programs.

Die somit erhaltenen Sprechproben werden transkribiert, d. h. der genaue Inhalt des Gesagten wird in eine geeignete Computersprache übersetzt, und ein sprecherunabhängiger Spracherkenner wird mit diesen Daten trainiert. Es wird eine solche Worterkennungsrate anzustreben sein, daß der Erkenner stets versteht, was gesagt wurde um den Videorecorder korrekt anzusteuern.The speech samples thus obtained are transcribed,d. H. the exact content of what is said isappropriate computer language translated, and aspeaker-independent speech recognizer becomes with theseData trained. There will be such a word recognition rateto be striven for so that the recognizer always understands whatwas said to control the video recorder correctly.

Die inFig. 1 beschriebene prototyp-ähnliche Einrichtung kann unter Umständen auch als externes Zusatzgerät ausgeführt werden.The prototype-like device described inFIG. 1 can also be designed as an external additional device under certain circumstances.

InFig. 2 ist eine Variante der erfindungsgemäßen Einrichtung dargestellt, bei der der Notebook-PC6, der Videotext-Decoder7 und der Videorecorder1 zu einer baulichen Einheit in einem einzigen Gehäuse15 zusammengefaßt sind.InFIG. 2 a variant of the device according to the invention is shown in which the notebook PC6, the teletext decoder7 and the video recorder1 are combined to form a structural unit in a single housing15.

Das Gehäuse15 enthält einen modifizierten reduzierten Notebook-PC6′ (ohne Display, Gehäuse, Tastatur und Akku) mit Hauptplatine inklusive Prozessor, Festspeicherplatte RAM Arbeitsspeicher und Schnittstellen5,9,11,20. Außerdem kann ein Diskettenlaufwerk (Floppy-Drive)21 vorgesehen sein. Dieser Notebook-PC6′ ist über eine Schnittstelle11 mit einer Soundkarte12 verbunden. An die Soundkarte12 ist ein Mikrophon14 zum Empfang von akustischen Sprachsignalen, ein Lautsprecher16 zur Ausgabe von Sprachsynthesen und ein Infrarot-Sprachsignalempfänger29 zum Empfang von Sprachsignalen einer Fernbedienung2 angeschlossen.The housing15 contains a modified reduced notebook PC6 '(without display, housing, keyboard and battery) with the main board including processor, hard disk RAM working memory and interfaces5 ,9 ,11 ,20th In addition, a floppy drive21 can be provided. This notebook PC6 'is connected via an interface11 to a sound card12 . A microphone14 for receiving acoustic voice signals, a loudspeaker16 for outputting voice synthesis and an infrared voice signal receiver29 for receiving voice signals from a remote control2 are connected to the sound card12 .

Über eine zweite Schnittstelle5 ist der Notebook-PC6′ mit einer Steuer-/Regelkarte3, beispielsweise in Form eines einfachen Transistor-Schaltarrays zur Erzeugung der Signale für einen Videorecorder­steuereinheit22 verbunden. Die Signale werden über die Anschlußkabel24 von der Steuer-/Regelkarte3 an die Videorecorder-Steuereinheit22 geleitet. An die Videorecorder-Steuereinheit22 ist ein Videorecorder-Fernsehtuner17 angeschlossen, der wiederum über den Tunerausgang18 und Anschlußkabel10 mit einem Videotext-Decoder7 gekoppelt ist. Der Videotext-Decoder7 ist über die Schnittstelle9 mit dem Notebook-PC6′ verbunden.Via a second interface5 , the notebook PC6 'is connected to a control / regulating card3 , for example in the form of a simple transistor switching array for generating the signals for a video recorder control unit22 . The signals are routed via the connecting cable24 from the control card3 to the video recorder control unit22 . A video recorder television tuner17 is connected to the video recorder control unit22 , which in turn is coupled to a teletext decoder7 via the tuner output18 and connecting cable10 . The teletext decoder7 is connected via the interface9 to the notebook PC6 '.

Über einen Recorderausgang8 kann die erfindungsgemäße Einrichtung an ein Fernsehgerät angeschlossen werden.The device according to the invention can be connected to a television set via a recorder output8 .

Um die Videorecorder-Steuereinheit22 über Infrarotsignale von Ferne zu bedienen, ist zum einen ein Infrarotsteuersignalempfänger28 vorgesehen, der über Verbindungskabel23 an die Videorecorder­steuereinheit22 angeschlossen ist, und zum anderen ein Infrarotsprachsignalempfänger29, der mit der Soundkarte12 verbunden ist.In order to operate the video recorder control unit22 remotely via infrared signals, an infrared control signal receiver28 is provided on the one hand, which is connected to the video recorder control unit22 via connecting cable23 , and on the other hand an infrared voice signal receiver29 which is connected to the sound card12 .

Die Fernbedienung2 umfaßt gemäßFig. 2 vorzugsweise ein Mikrophon30 zum Empfang von Sprachsignalen, eine Sprachübertragungseinheit27, sowie einen Infrarot-Sprachsignalsender25 und einen Infrarot-Steuersignalsender26, die die empfangenen und weitergeleiteten Signale an den Sprachsignalempfänger29 der Soundkarte12 bzw. an den Steuersignalempfänger28 der Videorecorder-Steuereinheit22 senden. Mit dieser Fernbedienung2 ist es möglich, die Sprache, die in das Mikrophon30 gesprochen wird, ähnlich wie bei kabellosen Kopfhörern bzw. Lautsprechern per Infrarotsignal an den Videorecorder zu schicken, von dem sie empfangen und so behandelt wird, als käme sie aus dem am Videorecorder1 angebauten Mikrophon14. Ggf. ist eine leicht modifizierte Signalvorverarbeitung nötig, um die unterschiedlichen Kanaleigenschaften der Mikrophone14,30 zu berücksichtigen.The remote control2 includes asshown inFIG. 2, preferably a microphone30 for receiving speech signals, a voice transmission unit27, and an infrared voice signal transmitter25 and an infrared control signal transmitter26, the received and relayed signals to the voice signal receiver29 of the sound card12 and to send the control signal receiver28 of the video recorder control unit22 . With this remote control2 , it is possible to send the speech that is spoken into the microphone30 , similar to wireless headphones or loudspeakers, to the video recorder via infrared signal, from which it is received and treated as if it came from the Video recorder1 attached microphone14 . Possibly. a slightly modified signal preprocessing is necessary to take into account the different channel properties of the microphones14 ,30 .

An dem Notebook-PC6′ ist eine serielle Schnittstelle19, vorgesehen, die an einen Schnittstellenanschluß20 aus dem Gehäuse15 herausführt. Über diese Schnittstelle20 ist es möglich, den Notebook-PC6 direkt zu bedienen, beispielsweise im Zuge einer Wartung oder Reparatur, oder um weitere Geräte daran anzuschließen, beispielsweise einen Haushaltssteuercomputer, der in natürlicher Sprache per Telefon bedienbar ist.On the notebook PC6 ', a serial interface19 is provided, which leads out of the housing15 to an interface connection20 . Via this interface20 it is possible to operate the notebook PC6 directly, for example in the course of maintenance or repair, or to connect further devices to it, for example a household control computer which can be operated in natural language by telephone.

Das Diskettenlaufwerk21 bietet dem Benutzer die Möglichkeit, selbst Software-Updates (auch ohne Videotext) durchzuführen. Unter der Voraussetzung, daß eine "Fernsehzeitschrift" für sprachprogrammierbare Videorecorder auf Diskette existiert, könnte auf den Videotextteil verzichtet werden, was insbesondere dort von Vorteil ist, wo kein einheitlicher Videotext gesendet wird (wie z. B. in den USA).The floppy disk drive21 offers the user the possibility to carry out software updates themselves (even without teletext). Provided that there is a "television magazine" for voice programmable video recorders on diskette, the teletext part could be dispensed with, which is particularly advantageous where no uniform teletext is broadcast (such as in the USA).

Die vorgesehene Software für die erfindungsgemäße Einrichtung umfaßt die folgenden Komponenten:The software provided for the inventionSetup includes the following components:

  • - Das Spracherkennungsmodul zur Echtzeiterkennung kontinuierlicher sprecherunabhängiger Sprache, basierend auf "Hidden Markov"-Modellen und einer Bigramm-Grammatik und einem semantischen Parser.- The voice recognition module for real-time recognitioncontinuous speaker-independent language,based on "Hidden Markov" models and oneBigram grammar and a semantic parser.
  • - Ein Datenbankmodul, das das aktuelle Fernsehprogramm verwaltet. Das Fernsehprogramm kann von einer Diskette oder über Videotext bezogen werden. Bei der Datenbank handelt es sich natürlich nicht um eine generische Datenbank mit eigenem Programmiergerüst. Es ist nur eine einfache Verwaltung einer relativ kleinen Menge an Daten vorgesehen.- A database module that shows the current television programmanaged. The television program can be from oneDiskette or teletext. In theOf course, the database is not onegeneric database with its own programming framework.It's just a simple management of a relativesmall amount of data.
  • - Ein Videotextlesemodul zum "Verstehen" der Videotextseiten. Die Regeln, wie Videotextseiten zu verstehen sind, können über selbst erstellte Seiten zusammen mit anderen Kommandos an das gesamte Gerät verschickt werden.- A teletext reading module to "understand" theTeletext pages. The rules of how to view teletext pagescan understand through self-made pagestogether with other commands to the entire devicebe sent.
  • - Ein Steuerprogramm für das Schalterarray, das an die Architektur und die vorhandenen Fähigkeiten des Videorecorders angepaßt ist, beziehungsweise für den Fall, daß ein handelsüblicher Videorecorder über Fernbedienung bedient wird, ein Programm zur Steuerung dieser Fernbedienung.- A control program for the switch array that is sent to theArchitecture and the existing skills of VCR is adapted, or for theCase that a commercially available VCR overRemote control is operated, a program forControl this remote.
  • - Ein Quasi-Betriebssystem, also ein Programm, das dafür zuständig ist, Kommandos von Videotextseiten oder vom Diskettenlaufwerk (Floppy-Disk) oder von der herausgeführten Seriellen Schnittstelle zu verstehen und auszuführen. Über dieses Betriebssystem ist es möglich, Einfluß auf die gesamte Software und die gespeicherten Daten (Parameter des Spracherkenners) Einfluß zu nehmen.- A quasi operating system, that is, a program thatis responsible for commands from teletext pagesor from the floppy disk drive or fromto the serial interfaceunderstand and execute. About thisIt is possible to influence the operating systementire software and the stored data(Parameters of the speech recognizer).
Funktionsbeispiel 1Function example 1

Der Benutzer spricht seinen Programmierwunsch, z. B. "Ich möchte die Tagesschau aufgenommen haben", in ein Mikrophon, das z. B. in einer Fernbedienung für den Videorecorder1 eingebaut ist. Die Sprachsignale werden über den Infrarotsender25 der Fernbedienung2 zum Videorecorder1 übertragen. Dort werden sie empfangen und von einer Soundkarte12 digitalisiert. Die Soundkarte12 ist mit der Hauptplatine eines (gegebenenfalls reduzierten) Notebook-PC6 verbunden. Der Notebook-PC6 umfaßt im allgemeinen eine kleine Festplatte zur Speicherung der Spracherkennungs-/Datenbank- und Programmiersoftware, einen Prozessor, einen RAM Hauptspeicher, ein Diskettenlaufwerk21 und einen Videotext-Decoder7; er kann außerdem mit einer Tastatur, einem Bildschirm, und einer eigenen Energieversorgung ausgestattet sein. Im vorliegenden Fall ist davon auszugehen, daß in der bevorzugten Ausbaustufe alle Teile im Notebook-PC6 integriert sind.The user speaks his programming request, e.g. B. "I would like to have the Tagesschau", in a microphone that z. B. is installed in a remote control for the VCR1 . The voice signals are transmitted to the video recorder1 via the infrared transmitter25 of the remote control2 . There they are received and digitized by a sound card12 . The sound card12 is connected to the main board of a (possibly reduced) notebook PC6 . The notebook PC6 generally comprises a small hard disk for storing the speech recognition / database and programming software, a processor, a RAM main memory, a floppy disk drive21 and a teletext decoder7 ; it can also be equipped with a keyboard, a screen and its own power supply. In the present case it can be assumed that all parts are integrated in the notebook PC6 in the preferred configuration.

Auf dem Notebook-PC6 läuft ständig ein Spracherkennungsprogramm das die über die Soundkarte12 ankommenden Sprachsignale erkennt und übersetzt (transkribiert).A speech recognition program which recognizes and translates (transcribed) the speech signals arriving via the sound card12 is constantly running on the notebook PC6 .

Dieses Erkennungsprogramm kann nur Worte erkennen, die in seinem Vokabular gespeichert sind.This recognition program can only recognize words thatare stored in his vocabulary.

Dieses Vokabular besteht aus einem permanent vorhandenen Wortschatz solcher Wörter, die regelmäßig im Alltag verwendet werden und die für die Programmierung eines Videorecorders1 von Bedeutung sind, sowie einem dynamischen Wortschatz, der zusätzliche Wörter enthält, die aus dem jeweils aktuellen Fernsehprogramm entnommen werden.This vocabulary consists of a permanently available vocabulary of such words that are used regularly in everyday life and that are important for programming a video recorder1 , and a dynamic vocabulary that contains additional words that are taken from the current television program.

Das Vokabular beider Wortschätze kann dadurch erweitert werden, daß das gewünschte Wort zusammen mit seiner phonetischen Umschreibung in das Aussprachelexikon des Spracherkenners eingetragen wird. Ebensogut können nicht mehr benötigte Wörter aus dem Vokabular entfernt werden.This can expand the vocabulary of both vocabularythat the word you want along with hisphonetic description in the pronunciation dictionary of theSpeech recognizer is entered. Can as wellWords no longer required removed from the vocabularywill.

Das Spracherkennungsprogramm erzeugt eine Hypothese, d. h. eine Folge von Wörtern, die in dem Sprachsignal erkannt wird, und liefert diese Hypothese an ein semantisches Parsermodul, d. h. ein Programm, das eine lexikalische Analyse durchführt und aus der erkannten Wortsequenz die zum Programmieren relevante Information extrahiert. Zusätzlich zur Hypothese können auch eine oder mehrere Alternativhypothesen ausgegeben werden, die dann in Erwägung gezogen werden, wenn die erste Hypothese nicht verwertbar ist, beispielsweise weil die Benutzeranweisung nicht korrekt war oder weil der Wunsch des Benutzers nicht korrekt erfüllt werden kann.The speech recognition program creates a hypothesisd. H. a sequence of words in the speech signalis recognized, and delivers this hypothesis tosemantic parser module, d. H. a program that acarries out lexical analysis and from the recognizedWord sequence the information relevant for programmingextracted. In addition to the hypothesis, aor several alternative hypotheses are output,which will be considered when the firstHypothesis is not usable, for example because the User instruction was incorrect or because ofThe user's request cannot be fulfilled correctly.

Die vom Parsermodul extrahierten Informationen können Fragen zum Fernsehprogramm sein, Fragen zum Zustand des Videorecorders, Aufforderungen zur Aufnahme einer oder mehrerer Sendungen, Kommandos zum Steuern der Bandfunktionen. Der Parser erkennt, um was für eine Art von Information es sich handelt und füllt sog. semantische "Case-Frames" mit den entsprechenden Wörtern aus der Hypothese.The information extracted by the parser module canQuestions about the television program, questions about the state of theVCRs, prompts to record one orseveral programs, commands to control theBand functions. The parser recognizes what typeof information it is about and fills so-calledsemantic "case frames" with the corresponding onesWords from the hypothesis.

Aus den gefüllten "Case-Frames" wird ein Zugriffskommando auf das Datenbankmodul, das das aktuelle Fernsehprogramm verwaltet, generiert. Mit diesem Zugriffskommando wird beispielsweise angefragt, wie der vollständige Titel der betreffenden Sendung lautet, wann sie beginnt und endet, und in welchem Programm sie gesendet wird.The filled "case frames" become oneAccess command to the database module that thecurrent television program managed, generated. Withthis access command is requested, for example,like the full title of the show in questionis when it starts and ends, and in whichProgram it is sent.

Wenn die Anfrage bei der Datenbank ergibt, daß die gegebene Information zur Programmierung ausreicht, wird dem Benutzer mit Hilfe einer Sprachsyntheseeinheit über den eingebauten Lautsprecher eine Bestätigung der Art "Ich nehme die Tagesschau von 20:00 Uhr bis 20:15 in der ARD auf" gegeben.If the query to the database shows that thegiven information is sufficient for programming,becomes the user with the help of a speech synthesis unitA confirmation of theArt "I take the daily news from 8:00 p.m. to 8:15 p.m.given in the ARD on ".

Ergibt die Anfrage jedoch, daß die gegebene Information nicht ausreicht oder unzulässig ist, kann eine Art Dialog geführt werden, indem eine Ausgabe der Art "Heute kommt keine Tagesschau" oder "Welche Tagesschau meinen Sie, die um 20:00 Uhr oder die um 22:00 Uhr" erzeugt wird.However, the request reveals that the information givenis insufficient or inadmissible, a kindDialogue is carried out by an edition of Art"There is no daily news today" or "Which daily newsdo you mean those at 8:00 p.m. or those at 10:00 p.m. "is produced.

In der Datenbank liegen die Daten zu einer Sendung bereits in einem maschinenlesbaren Format vor, d. h. der Prozessor kann die betreffenden Daten übernehmen und die zum Programmieren des Videorecorders1 benötigten Signale direkt daraus berechnen. Die eigentliche Programmierung erfolgt über eine Steuer-/Regelkarte3, deren Funktionalität vom verwendeten Videorecorder1 abhängt. In den allermeisten Fällen wird ein Transistor-Schaltarray, das an die Steuerleitungen des Videorecorders1 angeschlossen ist, genügen, um Steuersignale direkt an die Steuereinheit des Videorecorders1 zu schicken. Die Software für die Bedienung der Steuer-/Regelkarte3 ist ebenfalls vom verwendeten Videorecorder1 abhängig.The data for a program are already available in the database in a machine-readable format, ie the processor can take over the relevant data and calculate the signals required for programming the video recorder1 directly therefrom. The actual programming takes place via a control card3 , the functionality of which depends on the video recorder1 used . In the vast majority of cases, a transistor switching array which is connected to the control lines of the video recorder1 will suffice to send control signals directly to the control unit of the video recorder1 . The software for operating the control card3 is also dependent on the video recorder1 used .

In der Datenbank sind zu jeder Sendung die wichtigsten Informationen gespeichert. Dazu gehören Anfangs- und Endzeiten, Fernsehkanalnummern, Titel, Namen der Hauptdarsteller oder Regisseure etc., Stichworte über den Inhalt der Sendung, Bezeichnung der Art der Sendung (Nachrichten, Krimi, etc.).The most important for each shipment are in the databaseInformation saved. This includes initial andEnd times, TV channel numbers, titles, names of theLeading actors or directors etc., keywords aboutthe content of the shipment, description of the type of shipment(News, crime, etc.).

Die Datenbank wird ständig aktualisiert, so daß das aktuelle Fernsehprogramm und das der folgenden Tage oder Wochen vorhanden ist. Die Aktualisierung erfolgt entweder durch das Lesen einer Floppy-Disk, die der Benutzer z. B. am Kiosk oder im Zeitschriftenhandel kaufen kann, oder automatisch über Videotext.The database is constantly updated so that thecurrent television program and that of the following daysor weeks. The update takes placeeither by reading a floppy disk that theUser z. B. at the kiosk or in newsagentscan buy, or automatically via teletext.

Im Fall einer Aktualisierung über Videotext wird der Tuner des Videorecorders1 auf das Programm eingestellt, auf dem die benötigten Videotextseiten, aus denen herausgelesen werden soll, gesendet werden. Der Videotext-Decoder7 wandelt die Videotextseiten in maschinenlesbare Texte um, entnimmt Informationen über das aktuelle Fernsehprogramm und führt diese Daten der betreffenden Datenbank zur Speicherung zu. Dabei wird der dynamische Wortschatz (Vokabular und Bigramm- Grammatik) des Spracherkenners modifiziert und aktualisiert, so daß Programmierkommandos wie beispielsweise "nimm den Hitchcock auf" erkannt werden, ohne daß sich das Wort "Hitchcock" im permanenten Wortschatz des Spracherkennungsprogramms befinden muß.In the case of an update via teletext, the tuner of the video recorder1 is set to the program on which the required teletext pages from which information is to be read are sent. The teletext decoder7 converts the teletext pages into machine-readable texts, takes information about the current television program and feeds this data to the relevant database for storage. The dynamic vocabulary (vocabulary and bigram grammar) of the speech recognizer is modified and updated so that programming commands such as "record the Hitchcock" are recognized without the word "Hitchcock" having to be in the permanent vocabulary of the speech recognition program.

Prinzipiell ist es möglich, über Videotext jeden Teil der Software auszutauschen oder zu aktualisieren.In principle, it is possible to teletext every partreplace or update the software.

BezugszeichenlisteReference list

1 Videorecorder
2 Fernbedienung
3 Steuer- und Regelkarte
4 Kabelverbindung Steuerkarte-Fernbedienung
5 Schnittstelle Regelkarte
6 Notebook PC
7 Videotext-Decoder
8 Videoausgang des Recorders
9 Schnittstelle Decoder
10 Koaxialkabel
11 Schnitt stelle Soundkarte
12 Soundkarte
13 Kabel zum Mikrophon
14 Mikrophon
15 Gehäuse
16 Lautsprecher
17 Fernsehtuner des Videorecorders
18 Tunerausgang des Videotextdecoder
19 Serielle Schnittstelle des Notebooks
20 Schnittstellenanschluß
21 Diskettenlaufwerk
22 Steuereinheit des Videorecorders
23 Verbindungskabel
24 Anschluß der Regelkarte
25 Infrarot Sprachsignalsender
26 Infrarot Steuersignalsender
27 Sprachübertragungseinheit
28 Infrarot-Steuersignalempfänger
29 Infrarot-Sprachsignalempfänger
30 Mikrophon
1 video recorder
2 remote control
3 control card
4 Control card-remote control cable connection
5 Control card interface
6 notebook PC
7 Teletext decoders
8 Video output of the recorder
9 Interface decoder
10 coaxial cables
11 Interface sound card
12 sound card
13 cables to the microphone
14 microphone
15 housing
16 speakers
17 VCR TV tuner
18 Tuner output of the teletext decoder
19 Serial interface of the notebook
20 interface connection
21 floppy disk drive
22 Control unit of the video recorder
23 connecting cables
24 Connection of the control card
25 infrared voice signal transmitter
26 Infrared control signal transmitter
27 voice transmission unit
28 Infrared control signal receiver
29 Infrared voice signal receivers
30 microphone

Claims (6)

Translated fromGerman
1. Verfahren zur Programmierung eines Videorecorders, bei dem die Programmierinformation auf der Grundlage eines externen Sprachsignals und einer internen Datenbasis (Datenvorrat) generiert wird, wobei die Steuersignale natürliche, spontan gesprochene Sprachsignale sind, die von einem Kontinuierliche-Sprache-Erkenner und einem damit zusammenwirkenden Parser aufgenommen, analysiert, extrahiert und in "case-frames" kategorisiert werden, wobei die interne Datenbasis (der Datenvorrat) dynamisch festgelegt wird, wobei eine Dialogführung zur Auflösung von Ambiquitäten, Widersprüchen und für Modifikationsvorschläge vorgesehen ist, und wobei die dynamische Festlegung der Datenbasis durch die dynamische Aktualisierung des Fernsehprogramms erfolgt.1. procedure for programming a video recorder,where the programming information on theBasis of an external speech signal and oneinternal database (data supply) is generated,the control signals being natural, spontaneousspoken speech signals are from oneContinuous language recognizer and one with itinteracting parser recorded, analyzed,extracted and categorized into "case frames"will,where the internal database (the data pool)is determined dynamically, with a dialogto resolve ambiquities, contradictions andis provided for modification proposals, andbeing the dynamic definition of the databaseby dynamically updating theTV program takes place.2. Einrichtung zur Programmierung eines Videorecorders auf der Grundlage des Verfahrens nach Anspruch 1, dadurch gekennzeichnet,
daß zur Bereitstellung der internen Datenbasis ein Prozessor (Datenverarbeitungseinrichtung) vorgese­hen ist, der einerseits mit einem über ein Mikrophon steuerbaren kontinuierlichen Sprach-Erkenner gekoppelt ist, und der andererseits über eine Steuer-/Regelkarte mit dem Videorecorder verbunden ist,
so daß den über den kontinuierlichen Sprach-Erkenner zugeleiteten Sprachsignalen diesen zugeordnete Programmsignale im Prozessor ausgelesen werden, die ihrerseits den Videorecorder entsprechend programmieren.
2. Device for programming a video recorder on the basis of the method according to claim 1, characterized in that
that to provide the internal database, a processor (data processing device) is provided which, on the one hand, is coupled to a continuous speech recognizer that can be controlled by a microphone, and, on the other hand, is connected to the video recorder via a control card,
so that the speech signals supplied via the continuous speech recognizer are read out in the processor associated program signals which in turn program the video recorder accordingly.
3. Einrichtung nach Anspruch 2, dadurch gekennzeichnet, daß eine Anzeige von Informationen über die Programmdatenbasis und andere Statusinformationen auf dem TV-Gerät des Videorecorders vorgesehen ist.3. Device according to claim 2,characterized,that display information about theProgram database and other status informationis provided on the TV of the video recorder.4. Einrichtung nach Anspruch 2 oder 3, dadurch gekennzeichnet, daß der Sprach-Erkenner zusätzlich mit einem Laut­sprecher gekoppelt ist.4. Device according to claim 2 or 3,characterized,that the speech recognizer additionally with a soundspeaker is coupled.5. Einrichtung nach einem der Ansprüche 2 bis 4, dadurch gekennzeichnet, daß der Videorecorder und der Prozessor über einen Videotext-Umwandler funktional miteinander verbunden sind.5. Device according to one of claims 2 to 4,characterized,that the VCR and the processor have oneTeletext converters functionally with each otherare connected.6. Einrichtung nach einem der Ansprüche 2 bis 5, gekennzeichnet durch ihre Verwendung in Verbindung mit einem über eine Fernbedienung bedienbaren Videorecorder.6. Device according to one of claims 2 to 5,characterized by their use in conjunctionwith a remote controlVCR.
DE19961154371996-04-191996-04-19Video recorder programming methodExpired - Fee RelatedDE19615437C1 (en)

Priority Applications (1)

Application NumberPriority DateFiling DateTitle
DE1996115437DE19615437C1 (en)1996-04-191996-04-19Video recorder programming method

Applications Claiming Priority (1)

Application NumberPriority DateFiling DateTitle
DE1996115437DE19615437C1 (en)1996-04-191996-04-19Video recorder programming method

Publications (1)

Publication NumberPublication Date
DE19615437C1true DE19615437C1 (en)1997-07-31

Family

ID=7791708

Family Applications (1)

Application NumberTitlePriority DateFiling Date
DE1996115437Expired - Fee RelatedDE19615437C1 (en)1996-04-191996-04-19Video recorder programming method

Country Status (1)

CountryLink
DE (1)DE19615437C1 (en)

Cited By (17)

* Cited by examiner, † Cited by third party
Publication numberPriority datePublication dateAssigneeTitle
DE19801746A1 (en)*1998-01-201999-07-22T Angewandte System Technik MaSystem for control or operation of sensors and switches or appliances using acoustic or modulated signals with at least one microphone for reception and further communication of acoustic and/or spoken commands
DE19937490A1 (en)*1999-08-072001-04-19Volkswagen AgInput of control commands to a road vehicle system has a speech recognition system linked to a data base
DE10030713A1 (en)*2000-06-232002-01-03Deutsche Telekom Ag Procedure for setting parameters of function calls in dialog systems
DE10050360A1 (en)*2000-10-112002-04-25Siemens AgAdministering/establishing services in switched system involves defined vocabulary specified in additional network dialog device for recognizing voice input originating in user station
DE10051794A1 (en)*2000-10-182002-05-02S O S Systems Gmbh Method for uniquely assigning a command and method for voice control
WO2002037472A3 (en)*2000-10-302002-08-15Koninkl Philips Electronics NvUser interface for the administration of an external database
EP1037463A3 (en)*1999-03-152002-09-25Matsushita Electric Industrial Co., Ltd.Voice activated controller for recording and retrieving audio/video programs
DE10136953B4 (en)*2001-07-282004-02-05Loewe Opta Gmbh Device for checking the settings, default settings and / or status messages of a device component in a multi-part audio / video system
EP1196748A4 (en)*1999-07-232004-06-23Intervoice LpSystem and method to facilitate speech enabled user interfaces
DE19740079B4 (en)*1997-09-122004-07-01Ciburski, Guido Method for remote control of video recorders from the Internet
EP1079371B1 (en)*1999-08-262005-11-02Matsushita Electric Industrial Co., Ltd.Speech based remote control
US9021538B2 (en)1998-07-142015-04-28Rovi Guides, Inc.Client-server based interactive guide with server recording
US9071872B2 (en)2003-01-302015-06-30Rovi Guides, Inc.Interactive television systems with digital video recording and adjustable reminders
US9100686B2 (en)1998-09-172015-08-04Rovi Guides, Inc.Electronic program guide with digital storage
US9125169B2 (en)2011-12-232015-09-01Rovi Guides, Inc.Methods and systems for performing actions based on location-based rules
US9294799B2 (en)2000-10-112016-03-22Rovi Guides, Inc.Systems and methods for providing storage of data on servers in an on-demand media delivery system
US10063934B2 (en)2008-11-252018-08-28Rovi Technologies CorporationReducing unicast session duration with restart TV

Citations (2)

* Cited by examiner, † Cited by third party
Publication numberPriority datePublication dateAssigneeTitle
AT376538B (en)*1977-12-141984-11-26Ruppertsberg Siegfried R REMOTE CONTROL FOR CONTROLLING, SWITCHING ON AND SWITCHING VARIABLES AND FIXED DEVICE FUNCTIONS AND FUNCTION SIZES IN MESSAGE TECHNICAL DEVICES
EP0496492A1 (en)*1991-01-121992-07-29Sony CorporationControl apparatus for electronic equipment

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication numberPriority datePublication dateAssigneeTitle
AT376538B (en)*1977-12-141984-11-26Ruppertsberg Siegfried R REMOTE CONTROL FOR CONTROLLING, SWITCHING ON AND SWITCHING VARIABLES AND FIXED DEVICE FUNCTIONS AND FUNCTION SIZES IN MESSAGE TECHNICAL DEVICES
EP0496492A1 (en)*1991-01-121992-07-29Sony CorporationControl apparatus for electronic equipment

Non-Patent Citations (8)

* Cited by examiner, † Cited by third party
Title
DELLER, John R.*
ENGESSER, Hermann (Hrsg.), CLAUS, Volker, SCHWILL,Andreas (Bearb.): Duden "Informatik", Mannheim, Dudenverlag, 1988, S.73 u. 589-591 ISBN 3-411- 02421-6*
GUMM, Heinz-Peter, SOMMER, Manfred: Einführung in die Informatik, 1.Aufl., Bonn, Addison-Wesley (Deutschland) GmbH, 1994, S.413-415 ISBN 3-89319- 574-2*
HANSEN, John H.L.: Discrete-Time Processing of Speech Signals*
In: Funkschau, 1993, H. 24, S. 28 u. 29*
New York, Macmillan Publishing Company, 1993, S. 601-622 ISBN 0-02-328301-7*
Philips Voice Commander*
PROAKIS, John G.*

Cited By (34)

* Cited by examiner, † Cited by third party
Publication numberPriority datePublication dateAssigneeTitle
DE19740079B4 (en)*1997-09-122004-07-01Ciburski, Guido Method for remote control of video recorders from the Internet
DE19801746A1 (en)*1998-01-201999-07-22T Angewandte System Technik MaSystem for control or operation of sensors and switches or appliances using acoustic or modulated signals with at least one microphone for reception and further communication of acoustic and/or spoken commands
US9226006B2 (en)1998-07-142015-12-29Rovi Guides, Inc.Client-server based interactive guide with server recording
US9118948B2 (en)1998-07-142015-08-25Rovi Guides, Inc.Client-server based interactive guide with server recording
US10075746B2 (en)1998-07-142018-09-11Rovi Guides, Inc.Client-server based interactive television guide with server recording
US9021538B2 (en)1998-07-142015-04-28Rovi Guides, Inc.Client-server based interactive guide with server recording
US9055318B2 (en)1998-07-142015-06-09Rovi Guides, Inc.Client-server based interactive guide with server storage
US9154843B2 (en)1998-07-142015-10-06Rovi Guides, Inc.Client-server based interactive guide with server recording
US9232254B2 (en)1998-07-142016-01-05Rovi Guides, Inc.Client-server based interactive television guide with server recording
US9055319B2 (en)1998-07-142015-06-09Rovi Guides, Inc.Interactive guide with recording
US9237371B2 (en)1998-09-172016-01-12Rovi Guides, Inc.Electronic program guide with digital storage
US9100686B2 (en)1998-09-172015-08-04Rovi Guides, Inc.Electronic program guide with digital storage
US9106947B2 (en)1998-09-172015-08-11Rovi Guides, Inc.Electronic program guide with digital storage
US9363553B2 (en)1998-09-172016-06-07Rovi Guides, Inc.Electronic program guide with digital storage
EP1037463A3 (en)*1999-03-152002-09-25Matsushita Electric Industrial Co., Ltd.Voice activated controller for recording and retrieving audio/video programs
EP1196748A4 (en)*1999-07-232004-06-23Intervoice LpSystem and method to facilitate speech enabled user interfaces
DE19937490A1 (en)*1999-08-072001-04-19Volkswagen AgInput of control commands to a road vehicle system has a speech recognition system linked to a data base
DE19937490B4 (en)1999-08-072018-11-29Volkswagen Ag Method and device for inputting control commands for comfort devices, in particular in motor vehicles
EP1079371B1 (en)*1999-08-262005-11-02Matsushita Electric Industrial Co., Ltd.Speech based remote control
DE10030713A1 (en)*2000-06-232002-01-03Deutsche Telekom Ag Procedure for setting parameters of function calls in dialog systems
WO2001098855A3 (en)*2000-06-232002-12-05Deutsche Telekom AgMethod for adjusting the parameters of function references in dialog systems
DE10050360A1 (en)*2000-10-112002-04-25Siemens AgAdministering/establishing services in switched system involves defined vocabulary specified in additional network dialog device for recognizing voice input originating in user station
DE10050360B4 (en)*2000-10-112004-12-09Siemens Ag Method activation and / or deactivation of services in a switching system
US9294799B2 (en)2000-10-112016-03-22Rovi Guides, Inc.Systems and methods for providing storage of data on servers in an on-demand media delivery system
DE10051794C2 (en)*2000-10-182003-04-17Saymore Speech Operated System Method for uniquely assigning a command and method for voice control
EP1199706A3 (en)*2000-10-182004-01-07Saymore Speech Operated Systems GmbHMethod for unambiguous analysis of a spoken command
DE10051794A1 (en)*2000-10-182002-05-02S O S Systems Gmbh Method for uniquely assigning a command and method for voice control
WO2002037472A3 (en)*2000-10-302002-08-15Koninkl Philips Electronics NvUser interface for the administration of an external database
DE10136953B4 (en)*2001-07-282004-02-05Loewe Opta Gmbh Device for checking the settings, default settings and / or status messages of a device component in a multi-part audio / video system
US9071872B2 (en)2003-01-302015-06-30Rovi Guides, Inc.Interactive television systems with digital video recording and adjustable reminders
US9369741B2 (en)2003-01-302016-06-14Rovi Guides, Inc.Interactive television systems with digital video recording and adjustable reminders
US10063934B2 (en)2008-11-252018-08-28Rovi Technologies CorporationReducing unicast session duration with restart TV
USRE50355E1 (en)2008-11-252025-03-25Adeia Technologies Inc.Reducing unicast session duration with restart TV
US9125169B2 (en)2011-12-232015-09-01Rovi Guides, Inc.Methods and systems for performing actions based on location-based rules

Similar Documents

PublicationPublication DateTitle
DE19615437C1 (en)Video recorder programming method
DE60005422T2 (en) Automatically search for audio channels by comparing user-spoken words in subtitle text or audio content for interactive television
DE69923379T2 (en) Non-interactive registration for speech recognition
DE69834553T2 (en) ADVANCED VOICE RECOGNITION SYSTEM WITH AN AUDIO FEEDBACK
DE68928097T2 (en) Speech recognition system
DE60222093T2 (en) METHOD, MODULE, DEVICE AND VOICE RECOGNITION SERVER
DE60217579T2 (en) Automatic control of domestic appliances by means of natural language recognition
DE60012065T2 (en) Method and apparatus for television channel selection using speech understanding
DE60318544T2 (en) Language model for speech recognition
DE69822296T2 (en) PATTERN RECOGNITION IN A DISTRIBUTED SYSTEM
DE69914131T2 (en) Position handling in speech recognition
DE60015531T2 (en) CLIENT SERVER VOICE RECOGNITION SYSTEM
DE69712485T2 (en) Voice interface for a home network
DE3910467C2 (en) Method and device for generating reports
DE69317510T2 (en) Text / speech conversion control
DE69814589T2 (en) VOICE RECOGNITION USING MULTIPLE VOICE KNOWLEDGE
EP1282112B1 (en)Method of supporting proofreading of a recognized text in a speech to text system with playback speed adapted to confidence of recognition
DE60125397T2 (en) LANGUAGE-DEPENDENT VOTING BASED USER INTERFACE
DE69923191T2 (en) INTERACTIVE USER INTERFACE WITH LANGUAGE RECOGNITION AND NATURAL LANGUAGE PROCESSING SYSTEM
DE602005001125T2 (en) Learn the pronunciation of new words using a pronunciation graph
DE69632517T2 (en) Recognition of continuous speech
DE19510083C2 (en) Method and arrangement for speech recognition in languages containing word composites
DE69618503T2 (en) Speech recognition for audio languages
DE10040214A1 (en)Intelligent correction of dictated speech entered into a computer system uses comparison with word lists
DE60316912T2 (en) Method for speech recognition

Legal Events

DateCodeTitleDescription
8100Publication of the examined application without publication of unexamined application
D1Grant (no unexamined application published) patent law 81
8364No opposition during term of opposition
8339Ceased/non-payment of the annual fee

[8]ページ先頭

©2009-2025 Movatter.jp