Movatterモバイル変換


[0]ホーム

URL:


SU1674226A1 - Method and apparatus for detecting speech signals and their boundaries - Google Patents

Method and apparatus for detecting speech signals and their boundaries
Download PDF

Info

Publication number
SU1674226A1
SU1674226A1SU894655712ASU4655712ASU1674226A1SU 1674226 A1SU1674226 A1SU 1674226A1SU 894655712 ASU894655712 ASU 894655712ASU 4655712 ASU4655712 ASU 4655712ASU 1674226 A1SU1674226 A1SU 1674226A1
Authority
SU
USSR - Soviet Union
Prior art keywords
levels
signals
characteristic
input
signal
Prior art date
Application number
SU894655712A
Other languages
Russian (ru)
Inventor
Владимир Васильевич Александров
Алексей Викторович Исаев
Original Assignee
Предприятие П/Я Р-6052
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Предприятие П/Я Р-6052filedCriticalПредприятие П/Я Р-6052
Priority to SU894655712ApriorityCriticalpatent/SU1674226A1/en
Application grantedgrantedCritical
Publication of SU1674226A1publicationCriticalpatent/SU1674226A1/en

Links

Landscapes

Abstract

Translated fromRussian

Изобретение относитс  к технике речевой св зи и может быть использовано дл  выделени  высказываний одного диктора при конференц-св зи. Цель изобретени  - повышение надежности обнаружени  и точности его границ. Способ обнаружени  речевых сигналов и их границ предусматривает спектральный анализ входных данных с их последующим мультиплексированием, после которого оценивают спектральный фон по минимальным спектральным уровн м за 0,5 - 1 с, и по превышени м над фоном более 9 дБ и разност м в соседних полосах формируют характеристические сигналы, когда процент активных полос превышает порог, и, расширив их с учетом пауз в слитной речи, коммутируют соответственно задержанный входной сигнал. В устройство, реализующее способ, введены блоки формировани  порогов 6 и управл ющих сигналов 7 дл  электронного ключа 2, снабженного линией 1 задержки. 2 с.п. ф-лы, 1 ил.The invention relates to a voice communication technique and can be used to single out the statements of one speaker during a conference communication. The purpose of the invention is to increase the reliability of detection and the accuracy of its borders. The method of detecting speech signals and their boundaries provides for spectral analysis of input data with their subsequent multiplexing, after which the spectral background is estimated by the minimum spectral levels in 0.5-1 sec, and by elevations above the background more than 9 dB and differences in adjacent bands form the characteristic signals when the percentage of active bands exceeds the threshold, and, expanding them in view of the pauses in the continuous speech, switch the respective delayed input signal. Into a device that implements the method, blocks of forming thresholds 6 and control signals 7 for an electronic switch 2 equipped with a delay line 1 are entered. 2 sec. f-ly, 1 ill.

Description

Translated fromRussian

Изобретение относитс  к речевой информатике и может найти применение в технике речевой конференц-св зи и речевого управлени .The invention relates to voice informatics and can be used in the technology of voice conferencing and voice control.

Цель изобретени  - повышение точности и надежности обнаружени  границ речевых сообщений с выделением обнаруженных сообщений произвольного диктора при нестационарных и в том числе речевых помехах .The purpose of the invention is to improve the accuracy and reliability of the detection of the boundaries of voice messages, highlighting the detected messages of an arbitrary speaker during non-stationary and including speech disturbances.

Повышение точности и надежности достигаетс  введением спектрального представлена входного сообщени  мультиплексированием при последующем выделении минимальных уровней спектральных компонент за врем  не превышающее длительности коротких фраз речи, т.е. 0,5-1 с. линейным комбинированием спектральных уровней при вы влении формантных спектральных неоднородностей и расширением характеристических сигналов, сформированных при коррекции порогов выделенными минимальными уровн ми, при их логическом обьединении с учетом допустимых пауз в слитной речи дл  коммутации соответствующим образом задержанных входных сообщений.Improving the accuracy and reliability is achieved by introducing a spectral representation of the input message by multiplexing with the subsequent allocation of the minimum levels of spectral components for a time not exceeding the duration of short speech phrases, i.e. 0.5-1 s. linear combination of spectral levels in detecting formant spectral inhomogeneities and expansion of the characteristic signals formed when thresholds are corrected by selected minimum levels, when they are logically combined taking into account allowable pauses in continuous speech to switch appropriately delayed input messages.

На чертеже показана блок-схема устройства дл  обнаружени  речевых сигналов и их границ.The drawing shows a block diagram of an apparatus for detecting speech signals and their boundaries.

Устройство содержит св зывающие вход с его выходом линию 1 задержки и электронный ключ 2, соединенные последовательно. К входу устройства присоединен спектроана- лизатор 3, выход которогочерез мультиплексор 4 соединен с входами блока 5 формировани  первого и второго характеристических сигналов и блока 6 корректировки пороговых уровней. Управл ющий вход электронною ключа 2 соединен с выходами блока 5 формировани  первого и второго характеристических сигналов через блок 7 формировани  управл ющего сигнала.The device comprises a delay line 1 connecting the input with its output and an electronic switch 2 connected in series. A spectroanalyzer 3 is connected to the input of the device, the output of which is connected via multiplexer 4 to the inputs of the first and second characteristic signals forming unit 5 and the threshold levels adjustment unit 6. The control input of the electronic switch 2 is connected to the outputs of the unit 5 for generating the first and second characteristic signals through the unit 7 for generating the control signal.

Адаптивный характер формировани  первого и второго характеристических сигналов достигаетс  св зью пороговых элементов , вход щих в соответствующие блоки, с требовани ми поканальных превышений текущих спектральных уровней и их линейных комбинаций в форматных зонах не менее чем на 9дБ за теми минимальными (за врем  высказывани ) спектральными уровн ми , которыми оцениваетс  шумовой спектральный фон, и тех превышений числа активных каналов над подпороговыми, которыми характеризуетс  разговорна  слитна  речь. Введенный прием логической обработки характеристических сигналов с расширением управл ющих сигналов на интервалы, соответствующие допустимым паузам слитной речи, повышает количество звучани  выделенного сигнала коммутируемого электронным ключом.The adaptive nature of the formation of the first and second characteristic signals is achieved by the connection of the threshold elements included in the corresponding blocks, with the requirements of per channel exceedances of the current spectral levels and their linear combinations in the format zones by at least 9 dB beyond the minimum (during pronouncing) spectral levels mi, by which the noise spectral background is estimated, and those excess of the number of active channels over subliminal, which are characterized by colloquial speech. The input of the logical processing of the characteristic signals with the extension of the control signals at intervals corresponding to the permissible pauses of the continuous speech increases the number of sounds of the selected signal switched by the electronic key.

Использование опии,иных адаптивных приемов выделени  речевых сообщений на фоне нестационарных помех и схемотехники спектральной и логической обработки сигналов позволит повысить качество конференц-св зи , обеспечива  при этом простоту автоподстройки автоматов, коммутирующих переговорную сеть соответственно динамике активности участков переговоров.The use of opium and other adaptive methods for extracting voice messages against the background of non-stationary interference and circuitry of the spectral and logical signal processing will improve the quality of the conference connection, while ensuring the simplicity of automatic tuning of the machines that switch the negotiation network according to the dynamics of the activity of the negotiation sections.

Claims (2)

Translated fromRussian
1.Способ обнаружени  речевых сигна- лов и их границ, включающий формирование первого и второго характеристических сигналов путем пороговых сравнений уровней компонент сигналов с текущими уровн ми компонент фона, которые непрерывно1. A method for detecting speech signals and their boundaries, including the formation of the first and second characteristic signals by means of threshold comparisons of signal component levels with current background component levels that are continuouslyкорректируют, и логическое объединение результатов сравнений, отличающийс  тем, что, с целью повышени  надежности обнаружени  и точности его границ, характеристические сигналы формируют из совокупности спектрополосных уровней входного сигнала, а обнаруженный сигнал вывод т с запаздыванием на врем  задержки управлени  с конъюнкцией характеристических сигналов и расширением длительности вывода на врем  максимально длительных неозвученных фрагментов слитной речи, причем при формировании первого характеристического сигнала уровни фоновых спектрополосных помех оценивают какcorrect, and the logical combination of the results of comparisons, characterized in that, in order to increase the detection reliability and accuracy of its boundaries, characteristic signals are formed from a set of spectroband input signal levels, and the detected signal is output with a delay to the control delay time with conjunction of characteristic signals and extension the duration of the output at the time of the longest lasting unvoiced fragments of continuous speech, and when forming the first characteristic signal of the level spektropolosnyh background noise estimate asминимальные спектрополосные уровни в последние 0,5-1,0 превышени  спектрополосных уровней над соответствующими фоновыми , отмечают, когда превышени  составл ют не менее 9 дБ, первый характеристический сигнал генерирует, когда менее чем в четверти от общего числа спектральных полос отмечают превышени  спектрополосных уровней, при формировании второго характеристического сигнала линийным комбинированием спектрополосных уровней оценивают компоненты производной спектра и генерируют второй характеристический сигнал при наличии оценки компоненты производной спектраthe minimum spectroband levels in the last 0.5-1.0 spectral band exceedances over the corresponding background levels are noted, when the exceedances are not less than 9 dB, the first characteristic signal generates, when less than a quarter of the total number of spectral bands indicate spectroband levels, during the formation of the second characteristic signal by the line combination of the spectroband levels, the components of the spectrum derivative are estimated and the second characteristic signal is generated if there are estimates and components of the spectrum derivativeинтенсивностью не ниже 9 дБ и стабильности ее знака в течение минимальной длительности вокализации речи.intensity of not less than 9 dB and the stability of its sign for the minimum duration of vocalization of speech.2.Устройство дл  обнаружени  речевых сигналов и их границ, содержащее блок2. A device for detecting speech signals and their boundaries containing a blockформировани  первого и второго характеристических сигналов и блок корректировки пороговых уровней, входами св занные с входом устройства, отличающеес  тем, что, с целью повышени  надежностиthe formation of the first and second characteristic signals and the threshold level adjustment block, the inputs associated with the input of the device, characterized in that, in order to increase the reliabilityобнаружени , к входу устройства присоедиdetection, to the device inputнены последовательно соединенные вве-ристических сигналов и корректировки поденные лини  задержки и электронныйроговых уровней, а управл ющий вход ключ, выход которого соединен с выходомэлектронного ключа через введенный блок устройства, и последовательно соединен-формировани  управл ющего сигнала ные введенные спектроанализатор и муль-5 св зан с выходами блока формирова- типлексор, выходом св занный с блокамини  первого и второго характеристиче- формировани  первого и второго характе-ских сигналов.successively connected input signals and corrections of daytime delay lines and electronical levels, the control input key, the output of which is connected to the output key of the device through the input unit of the device, and serially connected-forming control signal input spectrum analyzer and multi-5 are connected with the outputs of the block, the formation of a typlexor associated with the block of the first and second characteristic formation of the first and second characteristic signals.
SU894655712A1989-02-271989-02-27Method and apparatus for detecting speech signals and their boundariesSU1674226A1 (en)

Priority Applications (1)

Application NumberPriority DateFiling DateTitle
SU894655712ASU1674226A1 (en)1989-02-271989-02-27Method and apparatus for detecting speech signals and their boundaries

Applications Claiming Priority (1)

Application NumberPriority DateFiling DateTitle
SU894655712ASU1674226A1 (en)1989-02-271989-02-27Method and apparatus for detecting speech signals and their boundaries

Publications (1)

Publication NumberPublication Date
SU1674226A1true SU1674226A1 (en)1991-08-30

Family

ID=21431066

Family Applications (1)

Application NumberTitlePriority DateFiling Date
SU894655712ASU1674226A1 (en)1989-02-271989-02-27Method and apparatus for detecting speech signals and their boundaries

Country Status (1)

CountryLink
SU (1)SU1674226A1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication numberPriority datePublication dateAssigneeTitle
RU2399103C2 (en)*2008-11-192010-09-10Государственное образовательное учреждение высшего профессионального образования "Белгородский государственный университет"Method of detecting pauses in speech signals and device for realising said method

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Патент US № 4158749, кл. 179-1, 1979. Авторское свидетельство СССР № 1597898, кл. G 10 L 9/06, 1985.*

Cited By (1)

* Cited by examiner, † Cited by third party
Publication numberPriority datePublication dateAssigneeTitle
RU2399103C2 (en)*2008-11-192010-09-10Государственное образовательное учреждение высшего профессионального образования "Белгородский государственный университет"Method of detecting pauses in speech signals and device for realising said method

Similar Documents

PublicationPublication DateTitle
HolmesThe JSRU channel vocoder
US4468804A (en)Speech enhancement techniques
US4672669A (en)Voice activity detection process and means for implementing said process
SE9500858D0 (en) Arrangement and method relating to speech transmission and a telecommunications system comprising such arrangement
PL337717A1 (en)Method of and apparatus for improving speech in a voice communication system
CA2148340C (en)Method and apparatus for automatically and reproducibly rating the transmission quality of a speech transmission system
KR19980080615A (en) Voice activity detection method and apparatus
JPS6216639A (en)Privacy telephone system
KR890702356A (en) Noise suppression system
ATE127303T1 (en) METHOD FOR IDENTIFYING VOICE AND CALL HISTORY SIGNALS.
US4688256A (en)Speech detector capable of avoiding an interruption by monitoring a variation of a spectrum of an input signal
HK7896A (en)Audio signal transmission method
EP1426926A2 (en)Apparatus and method for changing the playback rate of recorded speech
AU602436B2 (en)Method and apparatus for extracting isolated speech word
SU1674226A1 (en)Method and apparatus for detecting speech signals and their boundaries
US4219695A (en)Noise estimation system for use in speech analysis
US2799734A (en)Speech brighteners
GB978303A (en)Improvements in or relating to means for processing signals composed of components of different frequencies
Bloom et al.Evaluation of two-input speech dereverberation techniques
Grant et al.Auditory supplements to speechreading: Combining amplitude envelope cues from different spectral regions of speech
JP4500458B2 (en) Real-time quality analyzer for voice and audio signals
Wingfield et al.Word rate and intelligibility of alternated speech
US3381091A (en)Apparatus for determining the periodicity and aperiodicity of a complex wave
CA1147071A (en)Method of and apparatus for detecting speech in a voice channel signal
US3488446A (en)Apparatus for deriving pitch information from a speech wave

[8]ページ先頭

©2009-2025 Movatter.jp