


Die Erfindung betrifft ein Verfahren und Anordnungen zur Audiosignalkodierung. Insbesondere betrifft die Erfindung ein Verfahren und einen Anregungssignalgenerator zum Bilden eines Anregungssignals zum Anregen eines Audiosynthesefilters sowie einen Audiosignalenkodierer und einen Audiosignaldekodierer.The invention relates to a method and arrangements for audio signal coding. In particular, the invention relates to a method and an excitation signal generator for forming an excitation signal for exciting an audio synthesis filter and an audio signal encoder and an audio signal decoder.
In vielen zeitgemäßen Kommunikationssystemen und insbesondere in mobilen Kommunikationssystemen stehen für Echtzeit-Audioübertragungen, wie z.B. Sprach- oder Musikübertraguwgen, nur begrenzte Übettragungsbandbreiten zur Verfügung. Um über eine Übertragungsstrecke mit begrenzter Bandbreite, wie z.B. über ein Funknetz, möglichst viele Audio- oder Sprachkanäle in Echtzeit zu übertragen, ist deshalb häufig vorgesehen, die zu übertragenden Audiosignale durch echtzeit- oder quasiechtzeitfähige Audio-Kodierungsverfahren zu komprimieren.In many contemporary communication systems, and in particular in mobile communication systems, real-time audio transmissions such Voice or music transmissions, only limited transmission bandwidths available. To transmit over a limited bandwidth transmission link, such as e.g. It is therefore frequently provided via a radio network to transmit as many audio or voice channels in real time as possible to compress the audio signals to be transmitted by real-time or quasi-real-time capable audio coding methods.
Bei derartigen Audio-Kodierungsverfahren wird in der Regel angestrebt, die zu übertragende Datenmenge und damit die Übertragungsrate möglichst zu reduzieren ohne den subjektiven Höreindruck bzw. bei Sprachübertragungen die Verständlichkeit, zu sehr zu beinträchtigen.In such audio coding method is usually sought to reduce the amount of data to be transmitted and thus the transmission rate as possible without the subjective hearing or voice transmission in the intelligibility to affect too much.
Eine effiziente Komprimierung von Audiosignalen ist auch im Zusammenhang mit einer Speicherung oder Archivierung von Audiosignalen ein wesentlicher Gesichtspunkt.Efficient compression of audio signals is also an important consideration in the context of storage or archival of audio signals.
Als besonders effizient erweisen sich Kodierungsverfahren, bei denen ein zu übertragendes Audiosignal zeitrahmenweise an ein durch ein Audiosynthesefilter synthetisiertes Audiosignal durch Optimierung von Filterparametern angeglichen wird. Eine derartige Verfahrensweise wird häufig auch als Analysis-bySynthesis bezeichnet. Das Audiosynthesefilter wird dabei durch ein vorzugsweise ebenfalls zu optimierendes Anregungssignal angeregt. Die Filterung wird häufig auch als FormantSynthese bezeichnet. Als Filterparameter können z.B. sog. LPC-Koeffizienten (LPC:Linear Predictive Coding) und/oder Parameter, die eine spektrale und/oder zeitliche Einhüllende des Audiosignals spezifizieren, verwendet werden. Die optimierten Filterparameter sowie das Anregungssignal spezifizierende Parameter werden dann zeitrahmenweise zum Empfänger übertragen, um dort mittels eines empfängerseitig vorgesehenen Audiosynthesefilters ein synthetisches Audiosignal zu formen, das dem ursprünglichen Audiosignal hinsichtlich des subjektiven Höreindrucks möglichst ähnlich ist.Coding methods in which an audio signal to be transmitted is adjusted on a time-frame basis to an audio signal synthesized by an audio synthesis filter by optimization of filter parameters prove to be particularly efficient. A Such a procedure is often referred to as analysis-by-synthesis. The audio synthesis filter is excited by a preferably also to be optimized excitation signal. Filtering is often referred to as formant synthesis. For example, so-called LPC coefficients (LPC: Linear Predictive Coding) and / or parameters specifying a spectral and / or temporal envelope of the audio signal can be used as filter parameters. The optimized filter parameters as well as the parameters specifying the excitation signal are then transmitted to the receiver on a timely basis in order to form a synthetic audio signal there by means of an audio synthesis filter provided on the receiver side, which is as similar as possible to the original audio signal with regard to the subjective auditory impression.
Ein.derartiges Audio-Kodierungsverfahren ist aus der ITU-T Empfehlung G.729 bekannt. Mittels des dort beschriebenen Audio-Kodierungsverfahren kann ein Echtzeit-Audiosignal mit einer Bandbreite von 4 kHz auf eine Übertragungsrate von 8 kbit/s reduziert werden. Gemäß der G.729-Empfehlung wird das Anregungssignal mittels eines sog. adaptiven Kodebuchs im Zusammenwirken mit einem sog. fixen Kodebuch erzeugt. Im fixen Kodebuch ist eine Vielzahl von vorbestimmten Anregungssignalsequenzen fest gespeichert, die anhand eines Kodebuchindexes abrufbar sind. Dagegen werden im adaptiven Kodebuch bereits erzeugte Anregungssignalsequenzen gespeichert. Eine jeweilige Sequenz des Anregungssignals wird durch Mischen einer Sequenz aus dem adaptiven Kodebuch mit einer Sequenz aus dem fixen Kodebuch erzeugt. Zur Optimierung des Anregungssignals werden für jeden Zeitrahmen sowohl das fixe als auch das adaptive Kodebuch nach Anregungssignalsequenzen durchsucht, die eine möglichst gute Angleichung des synthetischen Audiosignals an das zu übertragende Audiosignal erlauben. Als das Anregungssignal spezifizierende Parameter werden schließlich Zugriffsinformationen auf die als optimal gefundenen Sequenzen aus dem fixen und dem adaptiven Kodebuch zum Empfänger übertragen. Beim Empfänger werden diese Parameter dazu genutzt, um mittels eines fixen und eines adaptiven Kodebuchs des Empfängers ein Anregungssignal zu rekonstruieren.Such an audio coding method is known from ITU-T Recommendation G.729. By means of the audio coding method described there, a real-time audio signal with a bandwidth of 4 kHz can be reduced to a transmission rate of 8 kbit / s. According to the G.729 recommendation, the excitation signal is generated by means of a so-called adaptive codebook in cooperation with a so-called fixed codebook. In the fixed codebook a plurality of predetermined excitation signal sequences are permanently stored, which are retrievable on the basis of a codebook index. By contrast, already generated excitation signal sequences are stored in the adaptive codebook. A respective sequence of the excitation signal is generated by mixing a sequence from the adaptive codebook with a sequence from the fixed codebook. To optimize the excitation signal, both the fixed and the adaptive codebook are searched for excitation signal sequences for each time frame, which allow the best possible approximation of the synthetic audio signal to the audio signal to be transmitted. Finally, parameters specifying the excitation signal become access information transferred to the sequences found to be optimal from the fixed and the adaptive codebook to the receiver. At the receiver these parameters are used to reconstruct an excitation signal by means of a fixed and an adaptive codebook of the receiver.
Das gemäß der G.729-Empfehlung für jeden Zeitrahmen in Echtzeit auszuführende Durchsuchen zweier Kodebücher bedingt jedoch einen erheblichen Rechenaufwand, der aufwändige Prozessoren erfordert.However, the search of two codebooks to be performed in real-time for each time frame according to the G.729 recommendation requires a considerable amount of computation, which requires expensive processors.
In
Darüber hinaus wird derzeit angestrebt, ein zu übertragendes Audiosignal zur Verbesserung des Höreindrucks mit höherer Bandbreite zu synthetisieren. Bei der gegenwärtig diskutierten Erweiterung G.729EV der G.792-Empfehlung wird versucht, die Audio-Bandbreite von 4 kHz auf 8 kHz zu erweitern.In addition, it is currently desired to synthesize an audio signal to be transmitted to improve the audio experience with higher bandwidth. In the currently discussed G.729EV extension of the G.792 Recommendation, an attempt is made to extend the audio bandwidth from 4 kHz to 8 kHz.
Eine derartige Bandbreitenerweiterung des synthetisierten Audiosignals kann dadurch erzielt werden, dass aus einem schmalbandigen Anregungssignal, z.B. mit einer Bandbreite von 4 kHz, ein geeignetes Anregungssignal höherer Bandbreite, beispielsweise 8 kHz Bandbreite, konstruiert wird, um den Audiosynthesefilter breitbandig anzuregen. In diesem Zusammenhang werden gegenwärtig verschiedene Verfahrensweisen zum Bilden eines solchen breitbandigen Anregungssignals diskutiert. Danach kann das breitbandige Anregungssignal durch Quadrieren des schmalbandigen Anregungssignals im Zeitbereich oder durch Erzeugen eines Erweiterungsbandes durch Verschieben oder Spiegeln des Frequenzspektrums des schmalbandigen Anregungssignals erzeugt werden. Durch die genannten Verfahrensweisen wird jedoch das Spektrum des Anregungssignals anharmonisch verzerrt und/oder es wird ein erheblicher, hörbarer Phasenfehler im Spektrum verursacht.Such a bandwidth extension of the synthesized audio signal can be achieved by constructing from a narrow-band excitation signal, eg with a bandwidth of 4 kHz, a suitable excitation signal of higher bandwidth, for example 8 kHz bandwidth, in order to excite the audio synthesis filter in a broadband manner. In this connection, various methods for forming such a broadband excitation signal are currently being discussed. Thereafter, the broadband excitation signal can be generated by squaring the narrow-band excitation signal in the time domain or by generating an enhancement band by shifting or mirroring the frequency spectrum of the narrow-band excitation signal. However, the methods mentioned above distort the spectrum of the excitation signal anharmonically and / or cause a considerable, audible phase error in the spectrum.
Es ist Aufgabe der vorliegenden Erfindung ein Verfahren zum Bilden eines Anregungssignals für ein Audiosynthesefilter anzugeben, das bei Audiosignalübertragungen eine weitere Verringerung der Übertragungsrate und/oder eine Verbesserung des Höreindrucks sowie eine Verringerung des zur Audiokodierung erforderlichen Rechenaufwandes erlaubt. Es ist weiterhin Aufgabe der Erfindung einen Anregungssignalgenerator zur Durchführung des Verfahrens sowie einen Audiosignalenkodierer und einen Audiosignaldekodierer anzugeben.It is an object of the present invention to provide a method for forming an excitation signal for an audio synthesis filter, which allows a further reduction of the transmission rate and / or an improvement of the audio impression in audio signal transmissions and a reduction of the computational effort required for audio coding. It is a further object of the invention to provide an excitation signal generator for carrying out the method as well as an audio signal encoder and an audio signal decoder.
Gelöst wird diese Aufgabe durch ein Verfahren mit den Merkmalen des Patenanspruchs 1, einen Anregungssignalgenerator mit den Merkmalen des Patentanspruchs 7, einen Audiosignalenkodierer mit den Merkmalen des Patentanspruchs 9 sowie einen Audiosignaldekodierer mit den Merkmalen des Patentanspruchs 10.This object is achieved by a method having the features of patent claim 1, an excitation signal generator having the features of patent claim 7, an audio signal encoder having the features of patent claim 9 and an audio signal decoder having the features of patent claim 10.
Vorteilhafte Ausführungsformen und Weiterbildungen der Erfindung sind in den abhängigen Ansprüchen angegeben.Advantageous embodiments and further developments of the invention are specified in the dependent claims.
Beim erfindungsgemäßen Verfahren zum Bilden eines Anregungssignals zum Anregen eines Audiosynthesefilters wird das Anregungssignal als Folge von Anregungs-Abtastwerten gebildet. Bereits gebildete Anregungs-Abtastwerte werden hierbei zeitlich fortlaufend in einem adaptiven Kodebuch gespeichert. Weiterhin ist ein Rauschgenerator vorgesehen, durch den fortlaufend Zufalls-Abtastwerte generiert werden. Aus dem adaptiven Kodebuch wird eine Sequenz der gespeicherten Anregungs-Abtastwerte an Hand eines zugeführten Audiogrundfrequenzparameters ausgewählt, durch den ein Zeitabstand der auszuwählenden Sequenz zum aktuellen Zeitbezug vorgegeben wird. Falls der Audiogrundfrequenzparameter einen Zeitabstand vorgibt, der kein ganzzahliges Vielfaches eines vorgegebenen Abtastabstandes eines separat zu generierenden, schmalbandigen Anregungssignals ist, werden zwischen die Anregungs-Abtastwerte und/oder zwischen die Zufalls-Abtastwerte abhängig vom Audiogrundfrequenzparameter Zwischen-Abtastwerte derart eingefügt, dass ein Abtastabstand der Abtastwerte geringer ist als der Abtastabstand des schmalbandigen Anregungssignals, wodurch das Anregungssignal gegenüber dem schmalbandigen Anregungssignal zusätzliche Frequenzkomponenten eines Erweiterungsbandes aufweist. Das Anregungssignal wird durch Mischen der ausgewählten Sequenz mit einer aktuelle Zufalls-Abtastwerte des Rauschgenerators umfassenden Zufalls-Sequenz gebildet.In the method according to the invention for forming an excitation signal for exciting an audio synthesis filter, the excitation signal is formed as a consequence of excitation samples. Already formed excitation samples are stored temporally consecutively in an adaptive codebook. Furthermore, a noise generator is provided by which random sampling values are generated continuously. From the adaptive codebook, a sequence of the stored excitation samples is selected based on an input audio fundamental frequency parameter, by which a time interval of the sequence to be selected is specified for the current time reference. If the audio basic frequency parameter specifies a time interval which is not an integer multiple of a predetermined sampling interval of a narrow-band excitation signal to be generated separately is interpolated between the excitation samples and / or between the random samples dependent on the audio fundamental frequency parameter such that a sample spacing of the samples is less than the sample interval of the narrowband excitation signal, whereby the excitation signal is additional frequency components of an extension band to the narrowband excitation signal having. The excitation signal is formed by mixing the selected sequence with a random sequence comprising current random samples of the noise generator.
Durch die Verwendung des Rauschgenerators als Quelle von Zufalls-Abtastwerten kann auf ein fixes Kodebuch zum Befüllen des adaptiven Kodebuchs verzichtet werden. Dementsprechend ist es nicht erforderlich, Kodebuch-Indizes zum Auswählen von vorgegebenen in einem fixen Kodebuch gespeicherten Abtastwertsequenzen bereitzustellen oder zu übertragen. Da derartige Kodebuch-Indizes für ein fixes Kodebuch bei bekannten Verfahren einen erheblichen Anteil an den zu übertragenden Audiodaten einnehmen, kann durch die Erfindung die Übertragungsrate in der Regel erheblich verringert werden. Die eingesparte Übertragungsbandbreite kann entsprechend für andere Zwecke oder zur Erhöhung der Übertragungsqualität genutzt werden.By using the noise generator as a source of random samples, a fixed codebook for filling the adaptive codebook can be dispensed with. Accordingly, it is not necessary to provide or transmit codebook indices for selecting predetermined sample sequences stored in a fixed codebook. Since such codebook indices for a fixed codebook occupy a considerable proportion of the audio data to be transmitted in known methods, the transmission rate can generally be considerably reduced by the invention. The saved transmission bandwidth can be used accordingly for other purposes or to increase the transmission quality.
Durch den Rauschgenerator, der vorzugsweise ein im Wesentlichen weißes, spektral flaches Rauschen erzeugt, kann ein in Audiosignalen oder Sprachsignalen enthaltener Rauschanteil in der Regel besser modelliert werden, als mittels eines fixen Kodebuchs, das nur fest vorgegebene Abtastwertsequenzen enthält. Eine harmonische Feinstruktur der Audio- oder Sprachsignale kann dagegen durch die vom Audiogrundfrequenzparameter abhängige Auswahl einer Abtastwertsequenz aus dem adaptiven Kodebuch gut nachgebildet werden.Due to the noise generator, which preferably generates a substantially white, spectrally flat noise, a noise component contained in audio signals or speech signals can generally be better modeled than by means of a fixed code book containing only fixed predetermined sample sequences. By contrast, a harmonic fine structure of the audio or speech signals can be well reproduced from the adaptive codebook by the selection of a sample sequence dependent on the audio basic frequency parameter.
Da ein Rauschgenerator naturgemäß gut auf unterschiedliche Frequenzbereiche skalierbar ist, lassen sich Bandbreitenerweiterungen mit geringem Aufwand realisieren. Zudem lässt sich durch die Erfindung vermeidet, dass ein Kodierungsrestfehler bei einer Bandbreitenerweiterung in ein Erweiterungsband übertragen wird.Since a noise generator is naturally well scalable to different frequency ranges, bandwidth extensions can be realized with little effort. In addition, it can be avoided by the invention that a coding residual error is transmitted in a bandwidth extension in an extension band.
Erfindungsgemäß ist für den Fall, dass der Audiogrundfrequenzparameter einen Zeitabstand vorgibt, der kein ganzzahliges Vielfaches eines vorgegebenen Abtastabstandes eines separat zu generierenden, schmalbandigen Anregungssignals ist, vorgesehen, zwischen die Anregungs-Abtastwerte und/oder zwischen die Zufalls-Abtastwerte abhängig vom Audiogrundfrequenzparameter Zwischen-Abtastwerte einzufügen. Die Einfügung erfolgt vorzugsweise so, dass ein Abtastabstand der resultierenden Abtastwerte geringer ist als der Abtastabstand des schmalbandigen Anregungssignals. Auf diese Weise kann ein Anregungssignal erzeugt werden, das gegenüber einem schmalbandigen Anregungssignal, z.B. im Frequenzbereich von 0-4 kHz, zusätzliche Frequenzkomponenten eines Erweiterungsbandes, z.B. von 4-8 kHz, aufweist. Das so erzeugte Anregungssignal weist anders als durch bekannte Bandbreiten-Erweiterungsverfahren erzeugte Anregungssignale keine wesentlichen anharmonischen Verzerrungen auf.According to the invention, in the event that the audio basic frequency parameter specifies a time interval, that is not an integral multiple of a predetermined sampling interval of a separate to be generated, narrow-band excitation signal is provided to insert intermediate samples between the excitation samples and / or between the random samples depending on the audio basic frequency parameter. The insertion is preferably such that a sampling interval of the resulting samples is less than the sampling interval of the narrow-band excitation signal. In this way, an excitation signal can be generated which, compared to a narrow-band excitation signal, eg in the frequency range of 0-4 kHz, has additional frequency components of an extension band, eg of 4-8 kHz. The excitation signal thus generated has no significant anharmonic distortions unlike excitation signals generated by known bandwidth expansion methods.
Die Erfindung ist sowohl beim Enkodieren als auch bei Dekodieren eines Audiosignals vorteilhaft einsetzbar. Bei einem Audiosignalenkodierer kann durch einen erfindungsgemäßen Anregungssignalgenerator ein Audiosynthesefilter angeregt werden, dessen Ausgangs-Audiosignal mit einem jeweils aktuellen Rahmen des zu übertragenden Audiosignals verglichen wird. Der Vergleich des aktuellen Rahmens wird vorzugsweise für unterschiedliche Auswahlen von im adaptiven Kodebuch gespeicherten Sequenzen von früheren Anregungs-Abtastwerten durchgeführt. Die zeitliche Position derjenigen Abtastwertsequenz innerhalb des adaptiven Kodebuchs, bei der der Vergleich eine optimale Übereinstimmung anzeigt, kann durch einen entsprechenden Audiogrundfrequenzparameter ausgedrückt werden, der dann zu einem Empfänger übertragen werden kann. Eine Durchsuchung eines weiteren, fixen Kodebuchs sowie eine zusätzliche Übertragung von Kodebuchindizes sind nicht erforderlich.The invention can be advantageously used both in the encoding and in the decoding of an audio signal. At a Audio signal encoder can be excited by an excitation signal generator according to the invention an audio synthesis filter whose output audio signal is compared with a respective current frame of the audio signal to be transmitted. The comparison of the current frame is preferably performed for different selections of sequences stored in the adaptive codebook from previous excitation samples. The timing of the sample sequence within the adaptive codebook where the comparison indicates optimal match may be expressed by a corresponding audio ground frequency parameter, which may then be transmitted to a receiver. A search of another, fixed codebook and an additional transmission of codebook indices are not required.
Bei einem Audiosignaldekodierer kann durch einen jeweils empfangenen Audiogrundfrequenzparameter ein erfindungsgemäßer Anregungssignalgenerator so gesteuert werden, dass er ein dem Audiogrundfrequenzparameter harmonisch entsprechendes Anregungssignal erzeugt, ohne auf zusätzlich zu übertragende Kodebuchindizes angewiesen zu sein. Durch das so erzeugte Anregungssignal kann ein Audiosynthesefilter angeregt werden, um ein synthetisches Audiosignal zu erzeugen, dass dem ursprünglichen Audiosignal hinsichtlich des Höreindrucks sehr ähnelt.In an audio signal decoder, an audio stimulus signal generator according to the invention can be controlled by a respective received audio basic frequency parameter so that it generates an excitation signal which harmonically corresponds to the audio fundamental frequency parameter, without having to rely on codebook indices to be transmitted additionally. The excitation signal thus generated can be used to excite an audio synthesis filter in order to produce a synthetic audio signal which is very similar to the original audio signal in terms of the audio impression.
Damit verringern sich sowohl der erforderliche Rechenaufwand beim Audiosignalenkodierer als auch die erforderliche Übertragungsrate. Entsprechend kann bei gleich bleibender Übertragungsrate in der Regel eine höhere Übertragungsqualität und damit ein verbesserter Höreindruck erzielt werden.This reduces both the computation required for the audio signal encoder and the required transmission rate. Accordingly, with a constant transmission rate, a higher transmission quality and thus an improved listening impression can generally be achieved.
Die Audiosynthesefilter beim Audiosignalenkodierer und/oder Audiosignaldekodierer können z.B. als LPC-Filter, Wiener FIR-Filter, als Filter zur Formung eine zeitlichen oder spektralen Einhüllenden des Audiosignals oder als eine Kombination dieser Filter realisiert werden.The audio synthesis filters in the audio signal encoder and / or audio signal decoder can be used, for example, as an LPC filter, Wiener FIR filter, as a filter for shaping a temporal or spectral Envelopes of the audio signal or as a combination of these filters can be realized.
Das erfindungsgemäße Verfahren kann vorzugsweise durch einen Signalprozessor ausgeführt werden.The method according to the invention can preferably be carried out by a signal processor.
Nach einer vorteilhaften Ausführungsform der Erfindung können die Anregungs-Abtastwerte und/oder die Zufalls-Abtastwerte zeitrahmenweise verarbeitet werden, wobei die Länge der ausgewählten Sequenz und/oder die Länge der Zufalls-Sequenz einer vorgegebenen Länge eines Zeitrahmens entsprechen.According to an advantageous embodiment of the invention, the excitation samples and / or the random samples may be processed on a time frame basis, the length of the selected sequence and / or the length of the random sequence corresponding to a predetermined length of a time frame.
Gemäß einer weiteren Ausführungsform der Erfindung können beim Mischen die ausgewählte Sequenz gemäß einem ersten Intensitätsparameter und/oder die Zufalls-Sequenz gemäß einem zweiten Intensitätsparameter verstärkt werden. Der erste und der zweite Intensitätsparameter, wie auch der Audiogrundfrequenzparameter, können vorzugsweise zeitrahmenweise, aus dem zu übertragenden Audiosignal abgeleitet und übertragen werden.According to a further embodiment of the invention, during mixing, the selected sequence may be selected according to a first intensity parameter and / or the random sequence according to a first intensity parameter second intensity parameters are amplified. The first and the second intensity parameters, as well as the audio basic frequency parameters, can preferably be derived and transmitted on a timely basis from the audio signal to be transmitted.
Weiterhin kann das Anregungssignal mit einem gegenüber einem separat zu generierenden, schmalbandigen-Anregungssignal geringeren Abtastabstand gebildet werden, wodurch das Anregungssignal gegenüber dem schmalbandigen Anregungssignal züsätzliche Frequenzkomponenten eines Erweiterungsbandes aufweist. In diesem Fall kann der Audiogrundfrequenzparameter sowie der erste und/oder zweite Intensitätsparameter aus Audiosynthese-Parametern abgeleitet werden, die eigentlich zur Generierung des schmalbandigen Anregungssignals vorgesehen sind. Analog dazu können der Audiogrundfrequenzparameter sowie der erste und/oder der zweite Intensitätsparameter aus einem Schmalbandanteil eines zu übertragenden Audiosignals abgeleitet werden.Furthermore, the excitation signal can be formed with a smaller sampling interval compared with a narrow-band excitation signal to be generated separately, as a result of which the excitation signal has subtractive frequency components of an extension band relative to the narrow-band excitation signal. In this case, the audio basic frequency parameter and the first and / or second intensity parameter can be derived from audio synthesis parameters which are actually intended to generate the narrow-band excitation signal. Analogously, the audio basic frequency parameter as well as the first and / or the second intensity parameter can be derived from a narrowband component of an audio signal to be transmitted.
Der Audiogrundfrequenzparameter sowie der erste und/oder der zweite Interisitätsparameter können mithin aus Schmalband-Audioparametern abgeleitet, aber auf das Erweiterungsband angewandt werden. Dies ist insofern vorteilhaft, da zur Bandbreitenerweiterung des Anregungssignals außer den zur Generierung des schmalbandigen Anregungssignals vorgesehenen Audiosyntheseparametern keine zusätzlichen Audiosynthese-Parameter erforderlich sind. Die zur Generierung des schmalbandigen Anregungssignals vorgesehenen Audiosynthese-Parameter können in der Regel von bestehenden, schmalbandigen Audiocodecs, wie z.B. gemäß G.729-Empfehlung bereitgestellt werden.The audio base frequency parameter as well as the first and / or second parameters of interest can thus be derived from narrowband audio parameters, but applied to the extension band. This is advantageous in that no additional audio synthesis parameters are required for the bandwidth expansion of the excitation signal except for the audio synthesis parameters provided for generating the narrow-band excitation signal. The intended for generating the narrow-band excitation signal audio synthesis parameters can be provided by existing narrow-band audio codecs, such as, for example, according to G.729 recommendation.
Bei bekannten Schmalband-Übertragungsverfahren, wie z.B. gemäß G.729-Empfehlung, wird der Audiogrundfrequenzparameter häufig genauer ermittelt, als dem Abtastabstand des schmalbandigen Anregungssighals entspricht. Häufig ist eine Genauigkeit von z.B. einem halben oder drittel Abtastabstand vorgesehen.,Somit kann der für das schmalbandige Anregungssignal vorgesehene Audiogrundfrequenzparameter in der Regel direkt bzw. im Wesentlichen unverändert zur Erzeugung des bandbreitenerweiterten Anregungssignals verwendet werden.In known narrowband transmission methods, such as e.g. According to G.729 recommendation, the audio basic frequency parameter is often more accurately determined than the sampling interval of the narrow-band excitation signal. Frequently, an accuracy of e.g. Thus, the audio basic frequency parameter provided for the narrow-band excitation signal can generally be used directly or substantially unchanged for generating the bandwidth-expanded excitation signal.
Der erste und/oder der zweite Intensitätsparameter kann jeweils durch Anwendung einer vorgegebenen Funktion aus den entsprechenden schmalbandigen Intensitätsparametern abgeleitet werden, um z.B. einen Rauschanteil gegenüber einem harmonischen Anteil im Erweiterüngsband eines Audiosignals zu betonen.The first and / or the second intensity parameter may each be derived from the corresponding narrowband intensity parameters by applying a predetermined function, e.g. emphasize a noise component versus a harmonic component in the extension band of an audio signal.
Vorzugsweise kann ein auf das Erweigerungsband entfallender Anteil des Anregungssignals mit dem separat generierten, schmalbandigen Anregungssignal kombiniert werden, um ein breitbandiges Anregungssignal, z.B. im Frequenzbereich von 0 bis 8 kHz, zur Anregung des Audiosynthesefilters zu erzeugern.Preferably, a portion of the excitation signal attributable to the denial band may be combined with the separately generated narrow-band excitation signal to produce a broadband excitation signal, e.g. in the frequency range from 0 to 8 kHz, to excite the audio synthesis filter.
Ein Ausführungsbeispiel der Erfindung wird nachfolgend anhand der Zeichnung näher erläutert.An embodiment of the invention will be explained in more detail with reference to the drawing.
Dabei zeigen jeweils in schematischer Darstellung:
Die obere Teilfigur veranschaulicht das mit einer.Abtastrate von beispielhaft 8 kHz abgetastete Audiosignal. Die Abtastrate von 8 kHz entspricht einem Abtastabstand DT1 von 1/8000 s. Durch die mit einer Abtastrate von 8 kHz abgetasteten Abtastwerte können nach einem fundamentalen Abtasttheorem Audiosignale im Wesentlichen bis zu einer Frequenz von 4 kHz dargestellt werden. Dieser Frequenzbereich wird im Folgenden als schmalbandig bezeichnet.The upper part of the figure illustrates the audio signal sampled at a sample rate of, for example, 8 kHz. The sampling rate of 8 kHz corresponds to a sampling interval DT1 of 1/8000 s. By sampling at a sampling rate of 8 kHz, audio signals can essentially be represented up to a frequency of 4 kHz according to a fundamental sampling theorem. This frequency range is referred to below as narrowband.
Die untere Teilfigur veranschaulicht das mit einer Abtastrate von 16 kHz abgetastete Audiosignal. Entsprechend der gegenüber der oberen Teilfigur verdoppelten Abtastrate beträgt der Abtastabstand DT2 in der unteren Teilfigur die Hälfte des Abtastabstandes DT1, d.h. hier 1/16000 s. Durch die mit einer Abtastrate von 16 kHz abgetasteten Abtastwerte kann ein Audiosignal im Wesentlichen bis zu einer Frequenz von 8 kHz dargestellt werden. Der vorstehende Frequenzbereich wird im Folgenden auch als breitbandig bezeichnet. Es versteht sich, dass die Begriffe schmalbandig und breitbandig nicht auf die nur beispielhaft genannten Frequenzbereiche beschränkt sind, sondern auf beliebige Frequenzbereiche insoweit verallgemeinerbar sind, als der Begriff breitbandig einen größeren Frequenzbereich spezifizieren soll, als der Begriff schmalbandig.The lower part of the figure shows the audio signal sampled at a sampling rate of 16 kHz. Corresponding to the doubling compared to the upper part of the sample rate, the sampling distance DT2 in the lower part of the figure is half of the sampling distance DT1, ie here 1/16000 s. By sampling at a sampling rate of 16kHz, an audio signal can be represented substantially up to a frequency of 8kHz. The above frequency range is also referred to as broadband in the following. It goes without saying that the terms narrow-band and broad-band are not limited to the frequency ranges only by way of example, but are generalizable to arbitrary frequency ranges insofar as the term broadband is to specify a larger frequency range than the term narrow-band.
Die
Vorzugsweise weist ein durch die Zufalls-Abtastwerte gebildetes Rauschsignal ein im Wesentlichen weißes bzw. flaches Frequenzspektrum auf.Preferably, a noise signal formed by the random samples has a substantially white or flat frequency spectrum.
Im Folgenden wird zunächst das in
Während der Rauschgenerator NOISE fortlaufend Zufalls-Sequenzen EXC_N, d.h. Zeitrahmen mit Zufalls-Abtastwerten erzeugt, gibt das adaptive Kodebuch ACB fortlaufend Sequenzen d.h. Zeitrahmen EXC_P von gespeicherten Anregungs-Abtastwerten aus. Die Zufalls-Sequenzen EXC_N und die vom adaptiven Kodebuch ACB ausgegebenen Sequenzen EXC_P werden der Mischeinrichtung MIX zugeleitet, der auch Intensitätsparameter G_N zur Pegelsteuerung der Zufalls-Sequenzen EXC_N sowie Intensitätsparameter G_P zur Pegelsteuerung der vom adaptiven Kodebuch ACB kommenden Sequenzen EXC_P zeitrahmenweise zugeleitet werden. In der Mischeinrichtung MIX werden die Zufalls-Abtastwerte einer jeweiligen Zufalls-Sequenz EXC_N mit einem jeweiligen Intensitätsparameter G_N und die Abtastwerte einer jeweiligen vom adaptiven Kodebuch ACB ausgegebenen Sequenz EXC_P mit einem jeweiligen Intensitätsparameter G_P zeitrahmenweise multipliziert, d.h. verstärkt. Die Multiplekationen sind in
Hinsichtlich des Anregungssignals EXC wirkt das adaptive Kodebuch ACB ähnlich wie ein Schieberegister, in das aktuell gebildete Sequenzen des Anregungssignals EXC eingespeichert werden und dabei früher gebildete Sequenzen des Anregungssignals unter Wahrung der zeitlichen Reihenfolge sukzessive nach hinten verschieben.With regard to the excitation signal EXC, the adaptive codebook ACB acts in a similar way as a shift register in which currently formed sequences of the excitation signal EXC are stored, successively shifting backwards previously formed sequences of the excitation signal while maintaining the chronological order.
Die Ausgabe der Sequenzen EXC_P von gespeicherten Anregungs-Abtastwerten wird durch dem adaptiven Kodebuch ACB zeitrahmenweise zugeführte Audiogrundfrequenzparameter PITCH gesteuert. An Hand der Audiogrundfrequenzparameter PITCH werden die vom adaptiven Kodebuch ACB auszugebenden Sequenzen EXP aus den gespeicherten Anregungs-Abtastwerten ausgewählt. Die Auswahl erfolgt mittels einer Auswahleinrichtung SEL des adaptiven Kodebuchs ACB. Ein derartiger Audiogrundfrequenzparameter PITCH wird in der Fachwelt häufig auch als "pitch lag" bezeichnet.The output of the sequences EXC_P of stored excitation samples is controlled by the adaptive codebook ACB in timed audio basic frequency parameters PITCH. On the basis of the audio basic frequency parameters PITCH, the sequences EXP to be output by the adaptive codebook ACB are selected from the stored excitation sample values. The selection is made by means of a selector SEL of the adaptive codebook ACB. Such an audio basic frequency parameter PITCH is often referred to in the art as "pitch lag".
Es sei im Folgenden angenommen, dass die Audiogrundfrequenzparameter PITCH jeweils in Einheiten eines schmalbandigen Abtastabstandes, hier z.B. 1/8000 s bei einer schmalbandigen Abtastrate von 8 kHz, vorgegeben sind. Durch die Audiogrundfrequenzparameter PITCH wird jeweils zeitrahmenweise eine Periode einer Grundfrequenz des zu übertragenden oder zu synthetisierenden Audiosignals spezifiziert. Bei zeitgemäßen Audiokodierverfahren, z.B. gemäß der G.729-Empfehlung, werden die Grundfrequenz-Perioden eines Audiosignals häufig mit höherer Auflösung gemessen oder bereitgestellt, als einem jeweils verwendeten Abtastabstand entspricht. Ein solcher, bis auf Bruchteile, von Abtastabständen genauer Audiogrundfrequenzparameter kann also in Einheiten des Abtastabstandes auch nicht-ganzzahlige Werte annehmen. Eine solcher nichtganzzahliger Audiogrundfrequenzparameter PITCH enthält Infomationen über höhere Frequenzanteile, als dem Abtastabstand eigentlich entspricht. Während solche höheren Frequenzanteile bei bekannten Audiokodierern, z.B. gemäß der G.729-Empfehlung herausgefiltert werden, kann die Information über die höheren Frequenzanteile bei erfindungsgemäßen Audiosignalgeneratoren auf einfache Weise zur Verbesserung der Audiosynthesequalität genutzt werden.It is assumed below that the audio basic frequency parameters PITCH are each given in units of a narrow-band sampling interval, here for example 1/8000 s at a narrow-band sampling rate of 8 kHz. The audio basic frequency parameters PITCH each time frame, a period a fundamental frequency of the audio signal to be transmitted or synthesized. In contemporary audio coding methods, eg according to the G.729 recommendation, the fundamental frequency periods of an audio signal are often measured or provided at a higher resolution than corresponds to a sampling interval used in each case. Such, apart from fractions of sample intervals, precise audio basic frequency parameters can thus also assume non-integer values in units of the sampling interval. Such a non-integer audio basic frequency parameter PITCH contains information about higher frequency components than actually corresponds to the sampling interval. While such higher frequency components are filtered out in known audio encoders, eg according to the G.729 recommendation, the information about the higher frequency components in audio signal generators according to the invention can be used in a simple way to improve the quality of the audio synthesis.
Ein aktueller Zeitbezug T0 wird in
Aus dem adaptiven Kodebuch ACB wird diejenige Sequenz EXC_P von gespeicherten Anregungs-Abtastwerten zur Ausgabe ausgewählt, deren Beginn einen dem Audiogrundfrequenzparameter PITCH entsprechenden Zeitabstand vom aktuellen Zeitbezug T0 aufweist und deren Länge der vorgegebenen Länge eines Zeitrahmens entspricht. Der Zeitabstand wird hierbei vom aktuellen Zeitbezug T0 aus zeitlich rückwärts gerechnet. Es seit darauf hingewiesen, dass der Beginn der ausgewählten Sequenz EXC_P nicht auf eine Zeitrahmengrenze fallen muss, sondern ggf. innerhalb vorgegebener Grenzen auf einen beliebigen gespeicherten Anregungs-Abtastwert fallen kann.From the adaptive codebook ACB that sequence EXC_P of stored excitation samples is selected for output, the beginning of which has a time interval corresponding to the audio basic frequency parameter PITCH from the current time reference T0 and whose length corresponds to the predetermined length of a time frame. The time interval is calculated backwards from the current time reference T0. It has since been pointed out that the beginning of the selected sequence EXC_P need not fall on a time frame boundary, but may possibly fall within given limits to any stored excitation sample.
In
Beim Einschalten des Anregunssignalgenerators ist das adaptive Kodebuch ACB zunächst leer, um dann sukzessive mit gebildeten Anregungs-Abtastwerten des ausgegebenen Anregungssignals EXC gefüllt zu werden. Da das adaptive Kodebuch ACB zu Beginn leer ist, wird das Anregungssignal EXC zunächst nur durch den Rauschgenerator NOISE als einziger Signalquelle gespeist. Dies bedeutet, dass das adaptive Kodebruch ACB zunächst mit nicht-periodischen Zufalls-Abtastwerten befüllt wird. In diesem Szenario stellt sich die Frage, wie sich mittels des adaptiven Kodebuchs ACB periodische Signalkomponenten gewinnen lassen, da als originäre Signalquelle lediglich ein nicht-periodischer Rauschgenerator NOISE zur Verfügung steht. Tatsächlich wurde nach bisherigen Vorstellungen für nötig erachtet, neben einem adaptiven Kodebuch, auch ein fixes Kodebuch vorzusehen, um das adaptive Kodebuch ACB mit determinierten, im fixen Kodebuch gespeicherten Signalsequenzen, zu befüllen.When the excitation signal generator is switched on, the adaptive code book ACB is initially empty, in order then to be filled successively with generated excitation sample values of the output excitation signal EXC. Since the adaptive codebook ACB is initially empty, the excitation signal EXC initially fed only by the noise generator NOISE as the only signal source. This means that the adaptive code break ACB is first filled with non-periodic random samples. In this scenario, the question arises as to how ACB can obtain periodic signal components by means of the adaptive codebook, since only a non-periodic noise generator NOISE is available as the original signal source. In fact, according to previous ideas, it was considered necessary, in addition to an adaptive codebook, also to provide a fixed codebook in order to fill the adaptive codebook ACB with deterministic signal sequences stored in the fixed codebook.
Gemäß einer Untersuchung der Erfinder ist ein derartiges fixes Kodebuch jedoch nicht erforderlich. Tatsächlich kann auch ohne fixes Kodebuch ein Anregungssignal mir harmonischer Feinstruktur durch fortlaufende geeignete Auswahl von Abtastwertsequenzen EXC_P aus dem adaptiven Kodebuch ACB erzeugt werden. Zur Verdeutlichung des zugrunde liegenden Wirkungsprinzips sei ein Fall betrachtet, bei dem der Audiogrundfrequenzparameter PITCH über mehrere Zeitrahmen hinweg konstant bleibt. In einem solchen Fall wird aus dem adaptiven Kodebuch ACB mehrmals hintereinander ein Zeitrahmen mit der gleichen Zeitlage relativ zu T0 aus dem adaptiven Kodebuch ACB ausgelesen, mit einer Zufalls-Sequenz EXC_N des Rauschgenerators NOISE gemischt und als aktueller Zeitrahmen des Anregungssignals EXC wieder im aktuellen Kodebuch ACB gespeichert. Der aktuelle Zeitrahmen wird dabei mit einem durch den Audiogrundfrequenzparameter PITCH spezifizierten Abstand zur vorher ausgegebenen Sequenz EXC_P gespeichert. Auf diese Weise bildet sich im adaptiven Kodebuch ACB sukzessive ein periodischer Signalanteil, dessen Periode durch den Audiogrundfrequenzparameter PITCH bestimmt wird. Der periodische Anteil am Gesamtanregungssignal EXC wird dabei durch die Intensitätsparameter G_N und G_P gesteuert.According to an investigation of the inventors, however, such a fixed codebook is not required. In fact, even without a fixed codebook, an excitation signal with a harmonic fine structure can be generated from the adaptive codebook ACB by continuously suitable selection of sample sequences EXC_P. To clarify the underlying principle of action, consider a case in which the audio basic frequency parameter PITCH remains constant over several time frames. In such a case, a time frame with the same timing relative to T0 is read from the adaptive codebook ACB several times in succession, mixed with a random sequence EXC_N of the noise generator NOISE and again as the current time frame of the excitation signal EXC in the current codebook ACB saved. The current time frame is stored with a specified by the audio basic frequency parameter PITCH distance to the previously issued sequence EXC_P. In this way, a periodic signal portion whose period is determined by the audio basic frequency parameter PITCH is successively formed in the adaptive codebook ACB. The periodic share of Total excitation signal EXC is controlled by the intensity parameters G_N and G_P.
Aufgrund der Verwendung des Rauschgenerators NOISE an Stelle eines fixen Kodebuchs kann eine Übertragung von Kodebuch-Indizes für ein fixes Kodebuch entfallen. Auf diese Weise kann die Übertragungsrate bzw. Bandbreite für die Übertragung von Audiosignalen erheblich reduziert werden. Zudem lässt sich durch die Verwendung des Rauschgenerators NOISE ein besserer Höreindruck, insbesondere bei einer Wiedergabe nicht harmonischer oder rauschartiger Audioanteile erzielen.Due to the use of the noise generator NOISE instead of a fixed codebook, transmission of codebook indices for a fixed codebook can be dispensed with. In this way, the transmission rate or bandwidth for the transmission of audio signals can be significantly reduced. In addition, by using the noise generator NOISE a better listening experience can be achieved, especially when playing non-harmonic or noisy audio components.
Anhand von
Es sei beispielhaft angenommen, dass der Bandbreitenerweiterungsfaktor N einen Wert von 2 aufweist, und dass bei einer schmalbandigen Abtastrate von 8 kHz die Abtastrate des auszugebenden Anregungssignals EXC entsprechend N x 8 kHz = 16 kHz beträgt.Assume, by way of example, that the bandwidth expansion factor N has a value of 2, and that at a narrow-band sampling rate of 8 kHz, the sampling rate of the excitation signal EXC to be output is N x 8 kHz = 16 kHz.
Während der Rauschgenerator NOISE Zufalls-Abtastwerte mit der schmalbandigen Abtastrate von 8 kHz ausgibt, verwenden das adaptive Kodebuch ACB und die Mischeinrichtung MIX die breitbandige Abtastrate von 16 kHz. Zur Anpassung der schmalbandigen Abtastrate des Rauschgenerators NOISE an die breitbandige Abtastrate der Mischeinrichtung MIX ist zwischen diese und dem Rauschgenerator NOISE ein Interpolator INT_N geschaltet. Der Interpolator INT_N empfängt die vom Rauschgenerator NOISE mit schmalbandiger Abtastrate ausgegebenen Zufalls-Abtastwerte und setzt zwischen jeweils zwei dieser Zufalls-Abtastwerte einen Zwischen-Abtastwert mit der Amplitude 0. Für andere Werte des Bandbreitenerweiterungsfaktors N werden analog dazu N-1 Zwischen-Abtastwerte, jeweils mit Amplitude 0, zwischen jeweils zwei Züfalls-Abtastwerten eingefügt. Auf diese Weise wird ein schmalbandiges weißes Rauschspektrum des Rauschgenerators NOISE auf ein breitbandiges weißes Spektrum umgesetzt.While the noise generator outputs NOISE random samples at the 8 kHz narrow-band sampling rate, the adaptive code book ACB and the mixer MIX use the 16 kHz wide-band sampling rate. To adapt the narrow-band sampling rate of the noise generator NOISE to the broadband sampling rate of the mixing device MIX, an interpolator INT_N is connected between these and the noise generator NOISE. The interpolator INT_N receives the noise generator NOISE For each of the values of the bandwidth expansion factor N, N-1 intermediate samples, each having an amplitude of 0, between each two instances, are analogously set to N-1 intermediate samples, each outputted at a narrow-band sampling rate -Sampled values inserted. In this way, a narrow-band white noise spectrum of the noise generator NOISE is converted to a broadband white spectrum.
Es sei angenommen, dass der Audiogrundfrequenzparameter PITCH in Einheiten des schmalbandigen Abtastabstandes zugeführt wird. Es sei weiterhin angenommen, dass der Audiogrundfrequenzparameter PITCH in diesen Einheiten bis mindestens auf einen Bruchteil 1/N genau, das heißt hier bis auf 1/2 genau bereitgestellt wird. Der nicht-ganzzahlige Audiogrundfrequenzparameter PITCH enthält Informationen über Frequenzanteile außerhalb des schmalbandigen Frequenzbereiches. Ein derartiger, nicht ganzzahliger Audiogrundfrequenzparameter PITCH wird häufig auch durch pitch = p + p_frac/N dargestellt, wobei p und p_frac ganzzahlige Parameter mit p_frac = 0,...,N - 1 sind. Da das adaptive Kodebuch ACB einen gegenüber dem schmalbandigen Abtastabstand halbierten, bzw. durch N geteilten, Abtastabstand verwendet, wird der Audiogrundfrequenzparameter PITCH zunächst mit N multipliziert. Das resultierende Produkt PITCH x N = p x N + p_frac wird dann zur Auswahl der gespeicherten Abtastwertsequenz EXC_P - wie schon im Zusammenhang mit
Durch den in
In
Die Erzeugung des breitbandigen Anregungssignals S_EXC ist in unterschiedliche Schichten, nämlich eine Schicht für den schmalbandigen Frequenzbereich, hier von 0 bis 4 kHz, und eine Schicht für das Erweiterungsband, hier von 4 bis 8 kHz, aufgeteilt. Der Audiosignaldekodierer weist zur Erzeugung eines schmalbandigen Anregungssignals N_EXC, hier im Frequenzbereich von 0 bis 4 kHz, einen schmalbandigen Anregungssignalsgenerator NBC und zur Erzeugung eines frequenzerweiterten Anregungssignals E_EXC, hier im Frequenzbereich von 4 bis 8 kHz, einen Anregungssignalgenerator EBC gemäß
Dem schmalbandigen Anregungssignalgenerator NBC werden zeitrahmenweise jeweils der Audiogrundfrequenzparameter PITCH sowie die Intensitätsparameter G_N und G_P zugeführt. An Stelle der Intensitätsparameter G_N und G_P können auch ein Summenparameter G_S+G_N und ein Verhältnisparameter G_S/G_N bzw. dessen Kehrwert zugeführt werden.The narrow-band excitation signal generator NBC is supplied with the audio basic frequency parameter PITCH as well as the intensity parameters G_N and G_P on a time frame basis. Instead of the intensity parameters G_N and G_P, a sum parameter G_S + G_N and a ratio parameter G_S / G_N or its reciprocal can also be supplied.
Der Audiogrundfrequenzparameter PITCH ist wie im Zusammenhang mit
Dem gemäß
Beim erfindungsgemäßen Audiosignaldekodierer werden zur Erzeugung des bandbreitenerweiterten Anregungssignäls E_EXC und damit zur Erzeugung des breitbandigen Anregungssignals S_EXC nur die Audioparameter PITCH, G_S und G_N benötigt, die zur Erzeugung des schmalbandigen Anregungssignals ohnehin übertragen werden oder von einem schmalbandigen Anregungssignalgenerator bereitgestellt werden. Die Audioparameter PITCH, G_N und G_P können also vorteilhafterweise aus dem schmalbandigen Frequenzbereich des zu übertragenden Audiosignals oder aus Parametern eines schmalbandigen Codecs abgeleitet werden, um dann auf ein hinzuzufügendes Erweiterungsband angewandt zu werden. Zur Erzeugung des breitbandigen Anregungssignals S_EXC sind gegenüber einer Erzeugung des schmalbandigen Anregungssignals N_EXC keine zusätzlichen Audioparameter zu übertragen. Durch den Verzicht auf ein fixes Kodebuch in den Anregungssignalgeneratoren EBC und/oder NBC kann darüber hinaus eine zusätzliche Übertragung von Kodebuch-Indizes entfallen. Zusatzinformationen über eine Audiostruktur im Erweiterungsband können durch die Parameter F_ENV und T_ENV übertragen werden.In the case of the audio signal decoder according to the invention, only the audio parameters PITCH, G_S and G_N are required to generate the bandwidth-expanded excitation signal E_EXC and thus to generate the broadband excitation signal S_EXC, which signals are transmitted anyway for generating the narrowband excitation signal or are provided by a narrowband excitation signal generator. The audio parameters PITCH, G_N and G_P can therefore advantageously be derived from the narrowband frequency range of the audio signal to be transmitted or from parameters of a narrowband codec in order then to be applied to an extension band to be added. In order to generate the broadband excitation signal S_EXC, no additional audio parameters are to be transmitted in comparison to generation of the narrowband excitation signal N_EXC. By not using a fixed codebook in the excitation signal generators EBC and / or NBC, an additional transmission of codebook indices can be dispensed with. Additional information about an audio structure in the extension band can be transmitted via the parameters F_ENV and T_ENV.
Der in
| Application Number | Priority Date | Filing Date | Title | 
|---|---|---|---|
| PCT/EP2006/000811WO2007087823A1 (en) | 2006-01-31 | 2006-01-31 | Method and arrangements for encoding audio signals | 
| Publication Number | Publication Date | 
|---|---|
| EP1979899A1 EP1979899A1 (en) | 2008-10-15 | 
| EP1979899B1true EP1979899B1 (en) | 2015-03-11 | 
| Application Number | Title | Priority Date | Filing Date | 
|---|---|---|---|
| EP06706507.8AActiveEP1979899B1 (en) | 2006-01-31 | 2006-01-31 | Method and arrangements for encoding audio signals | 
| Country | Link | 
|---|---|
| US (1) | US8135584B2 (en) | 
| EP (1) | EP1979899B1 (en) | 
| CN (1) | CN101336449B (en) | 
| WO (1) | WO2007087823A1 (en) | 
| Publication number | Priority date | Publication date | Assignee | Title | 
|---|---|---|---|---|
| EP1979899B1 (en)* | 2006-01-31 | 2015-03-11 | Unify GmbH & Co. KG | Method and arrangements for encoding audio signals | 
| US8190440B2 (en)* | 2008-02-29 | 2012-05-29 | Broadcom Corporation | Sub-band codec with native voice activity detection | 
| EP2313986A1 (en)* | 2008-08-13 | 2011-04-27 | Nokia Siemens Networks Oy | Method of generating a codebook | 
| CA2780971A1 (en)* | 2009-11-19 | 2011-05-26 | Telefonaktiebolaget L M Ericsson (Publ) | Improved excitation signal bandwidth extension | 
| FR2955187A1 (en)* | 2010-01-08 | 2011-07-15 | Centre Nat Rech Scient | Method for decomposing anharmonic periodic signal for e.g. analyzing physiological signals, involves determining phase expression based on parameters measuring anharmonic of signal, and determining morphology of signal | 
| CN104575507B (en)* | 2013-10-23 | 2018-06-01 | 中国移动通信集团公司 | Voice communication method and device | 
| EP2963646A1 (en) | 2014-07-01 | 2016-01-06 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Decoder and method for decoding an audio signal, encoder and method for encoding an audio signal | 
| US10200872B2 (en)* | 2014-10-08 | 2019-02-05 | Qualcomm Incorporated | DC subcarrier handling in narrowband devices | 
| DE102016119750B4 (en)* | 2015-10-26 | 2022-01-13 | Infineon Technologies Ag | Devices and methods for multi-channel scanning | 
| CN109003621B (en)* | 2018-09-06 | 2021-06-04 | 广州酷狗计算机科技有限公司 | Audio processing method and device and storage medium | 
| CN113643682B (en)* | 2021-10-13 | 2022-07-15 | 展讯通信(上海)有限公司 | Noise reduction method, chip module and equipment | 
| Publication number | Priority date | Publication date | Assignee | Title | 
|---|---|---|---|---|
| US5479559A (en)* | 1993-05-28 | 1995-12-26 | Motorola, Inc. | Excitation synchronous time encoding vocoder and method | 
| US6047254A (en)* | 1996-05-15 | 2000-04-04 | Advanced Micro Devices, Inc. | System and method for determining a first formant analysis filter and prefiltering a speech signal for improved pitch estimation | 
| EP0883107B9 (en)* | 1996-11-07 | 2005-01-26 | Matsushita Electric Industrial Co., Ltd | Sound source vector generator, voice encoder, and voice decoder | 
| WO1998035341A2 (en)* | 1997-02-10 | 1998-08-13 | Koninklijke Philips Electronics N.V. | Transmission system for transmitting speech signals | 
| JP4792613B2 (en) | 1999-09-29 | 2011-10-12 | ソニー株式会社 | Information processing apparatus and method, and recording medium | 
| EP1979899B1 (en)* | 2006-01-31 | 2015-03-11 | Unify GmbH & Co. KG | Method and arrangements for encoding audio signals | 
| Publication number | Publication date | 
|---|---|
| WO2007087823A1 (en) | 2007-08-09 | 
| CN101336449B (en) | 2011-10-19 | 
| US20090012782A1 (en) | 2009-01-08 | 
| US8135584B2 (en) | 2012-03-13 | 
| CN101336449A (en) | 2008-12-31 | 
| EP1979899A1 (en) | 2008-10-15 | 
| Publication | Publication Date | Title | 
|---|---|---|
| EP1979899B1 (en) | Method and arrangements for encoding audio signals | |
| EP1979901B1 (en) | Method and arrangements for audio signal encoding | |
| DE4237563C2 (en) | Method for synthesizing speech | |
| DE4492048C2 (en) | Vector quantization method | |
| DE69317958T2 (en) | Low delay audio signal encoder using analysis-by-synthesis techniques | |
| DE19604273C2 (en) | Method and device for performing a search in a code book with regard to the coding of a sound signal, cell communication system, cell network element and mobile cell transmitter / receiver unit | |
| DE60013785T2 (en) | IMPROVED SUBJECTIVE QUALITY OF SBR (SPECTRAL BAND REPLICATION) AND HFR (HIGH FREQUENCY RECONSTRUCTION) CODING PROCEDURES BY ADDING NOISE AND LIMITING NOISE REDUCTION | |
| DE102008015702B4 (en) | Apparatus and method for bandwidth expansion of an audio signal | |
| DE69916321T2 (en) | CODING OF AN IMPROVEMENT FEATURE FOR INCREASING PERFORMANCE IN THE CODING OF COMMUNICATION SIGNALS | |
| DE60319590T2 (en) | METHOD FOR CODING AND DECODING AUDIO AT A VARIABLE RATE | |
| DE69832358T2 (en) | Method for speech coding and decoding | |
| DE69328064T2 (en) | Time-frequency interpolation with low rate speech coding application | |
| DE69329569T2 (en) | Digital coding of speech signals | |
| DE69033510T2 (en) | NUMERIC LANGUAGE ENCODER WITH IMPROVED LONG-TERM FORECASTING BY SUBSAMPLE RESOLUTION | |
| DE60038279T2 (en) | Beitband speech coding with parametric coding of the high frequency component | |
| WO2006114368A1 (en) | Noise suppression process and device | |
| DE69828709T2 (en) | Increase the density of coded speech signals | |
| EP1023777B1 (en) | Method and device for limiting a stream of audio data with a scaleable bit rate | |
| DE69028434T2 (en) | System for encoding broadband audio signals | |
| DE60102975T2 (en) | Apparatus and method for broadband coding of speech signals | |
| DE602005003358T2 (en) | AUDIO CODING | |
| DE4033350B4 (en) | Method and device for speech processing | |
| DE68917552T2 (en) | Method and device for coding and decoding speech signals using multipulse excitation. | |
| DE60125491T2 (en) | Low-pass filtering of the excitation signal for speech coding | |
| DE3037276C2 (en) | Sound synthesizer | 
| Date | Code | Title | Description | 
|---|---|---|---|
| PUAI | Public reference made under article 153(3) epc to a published international application that has entered the european phase | Free format text:ORIGINAL CODE: 0009012 | |
| 17P | Request for examination filed | Effective date:20080609 | |
| AK | Designated contracting states | Kind code of ref document:A1 Designated state(s):DE FR GB IT SE | |
| DAX | Request for extension of the european patent (deleted) | ||
| RBV | Designated contracting states (corrected) | Designated state(s):DE FR GB IT SE | |
| 17Q | First examination report despatched | Effective date:20120525 | |
| RAP1 | Party data changed (applicant data changed or rights of an application transferred) | Owner name:UNIFY GMBH & CO. KG | |
| GRAP | Despatch of communication of intention to grant a patent | Free format text:ORIGINAL CODE: EPIDOSNIGR1 | |
| INTG | Intention to grant announced | Effective date:20141006 | |
| GRAS | Grant fee paid | Free format text:ORIGINAL CODE: EPIDOSNIGR3 | |
| GRAA | (expected) grant | Free format text:ORIGINAL CODE: 0009210 | |
| AK | Designated contracting states | Kind code of ref document:B1 Designated state(s):DE FR GB IT SE | |
| REG | Reference to a national code | Ref country code:GB Ref legal event code:FG4D Free format text:NOT ENGLISH | |
| REG | Reference to a national code | Ref country code:DE Ref legal event code:R096 Ref document number:502006014233 Country of ref document:DE Effective date:20150416 | |
| PG25 | Lapsed in a contracting state [announced via postgrant information from national office to epo] | Ref country code:SE Free format text:LAPSE BECAUSE OF FAILURE TO SUBMIT A TRANSLATION OF THE DESCRIPTION OR TO PAY THE FEE WITHIN THE PRESCRIBED TIME-LIMIT Effective date:20150311 | |
| REG | Reference to a national code | Ref country code:DE Ref legal event code:R097 Ref document number:502006014233 Country of ref document:DE | |
| PLBE | No opposition filed within time limit | Free format text:ORIGINAL CODE: 0009261 | |
| STAA | Information on the status of an ep patent application or granted ep patent | Free format text:STATUS: NO OPPOSITION FILED WITHIN TIME LIMIT | |
| REG | Reference to a national code | Ref country code:FR Ref legal event code:PLFP Year of fee payment:11 | |
| 26N | No opposition filed | Effective date:20151214 | |
| PGFP | Annual fee paid to national office [announced via postgrant information from national office to epo] | Ref country code:IT Payment date:20160122 Year of fee payment:11 | |
| REG | Reference to a national code | Ref country code:DE Ref legal event code:R082 Ref document number:502006014233 Country of ref document:DE Representative=s name:SCHAAFHAUSEN PATENTANWAELTE PARTNERSCHAFTSGESE, DE Ref country code:DE Ref legal event code:R082 Ref document number:502006014233 Country of ref document:DE Representative=s name:FRITZSCHE PATENTANWAELTE, DE Ref country code:DE Ref legal event code:R081 Ref document number:502006014233 Country of ref document:DE Owner name:UNIFY GMBH & CO. KG, DE Free format text:FORMER OWNER: UNIFY GMBH & CO. KG, 81379 MUENCHEN, DE | |
| REG | Reference to a national code | Ref country code:FR Ref legal event code:PLFP Year of fee payment:12 | |
| REG | Reference to a national code | Ref country code:FR Ref legal event code:PLFP Year of fee payment:13 | |
| PG25 | Lapsed in a contracting state [announced via postgrant information from national office to epo] | Ref country code:IT Free format text:LAPSE BECAUSE OF NON-PAYMENT OF DUE FEES Effective date:20170131 | |
| REG | Reference to a national code | Ref country code:DE Ref legal event code:R082 Ref document number:502006014233 Country of ref document:DE Representative=s name:SCHAAFHAUSEN PATENTANWAELTE PARTNERSCHAFTSGESE, DE | |
| REG | Reference to a national code | Ref country code:DE Ref legal event code:R081 Ref document number:502006014233 Country of ref document:DE Owner name:UNIFY BETEILIGUNGSVERWALTUNG GMBH & CO. KG, DE Free format text:FORMER OWNER: UNIFY GMBH & CO. KG, 80807 MUENCHEN, DE | |
| PGFP | Annual fee paid to national office [announced via postgrant information from national office to epo] | Ref country code:GB Payment date:20241212 Year of fee payment:20 | |
| PGFP | Annual fee paid to national office [announced via postgrant information from national office to epo] | Ref country code:FR Payment date:20241209 Year of fee payment:20 | |
| PGFP | Annual fee paid to national office [announced via postgrant information from national office to epo] | Ref country code:DE Payment date:20241203 Year of fee payment:20 | |
| REG | Reference to a national code | Ref country code:GB Ref legal event code:732E Free format text:REGISTERED BETWEEN 20250828 AND 20250903 |