Изобретение относитс к речевой информатике и может найти применение в технике речевой конференц-св зи и речевого управлени .The invention relates to voice informatics and can be used in the technology of voice conferencing and voice control.
Цель изобретени - повышение точности и надежности обнаружени границ речевых сообщений с выделением обнаруженных сообщений произвольного диктора при нестационарных и в том числе речевых помехах .The purpose of the invention is to improve the accuracy and reliability of the detection of the boundaries of voice messages, highlighting the detected messages of an arbitrary speaker during non-stationary and including speech disturbances.
Повышение точности и надежности достигаетс введением спектрального представлена входного сообщени мультиплексированием при последующем выделении минимальных уровней спектральных компонент за врем не превышающее длительности коротких фраз речи, т.е. 0,5-1 с. линейным комбинированием спектральных уровней при вы влении формантных спектральных неоднородностей и расширением характеристических сигналов, сформированных при коррекции порогов выделенными минимальными уровн ми, при их логическом обьединении с учетом допустимых пауз в слитной речи дл коммутации соответствующим образом задержанных входных сообщений.Improving the accuracy and reliability is achieved by introducing a spectral representation of the input message by multiplexing with the subsequent allocation of the minimum levels of spectral components for a time not exceeding the duration of short speech phrases, i.e. 0.5-1 s. linear combination of spectral levels in detecting formant spectral inhomogeneities and expansion of the characteristic signals formed when thresholds are corrected by selected minimum levels, when they are logically combined taking into account allowable pauses in continuous speech to switch appropriately delayed input messages.
На чертеже показана блок-схема устройства дл обнаружени речевых сигналов и их границ.The drawing shows a block diagram of an apparatus for detecting speech signals and their boundaries.
Устройство содержит св зывающие вход с его выходом линию 1 задержки и электронный ключ 2, соединенные последовательно. К входу устройства присоединен спектроана- лизатор 3, выход которогочерез мультиплексор 4 соединен с входами блока 5 формировани первого и второго характеристических сигналов и блока 6 корректировки пороговых уровней. Управл ющий вход электронною ключа 2 соединен с выходами блока 5 формировани первого и второго характеристических сигналов через блок 7 формировани управл ющего сигнала.The device comprises a delay line 1 connecting the input with its output and an electronic switch 2 connected in series. A spectroanalyzer 3 is connected to the input of the device, the output of which is connected via multiplexer 4 to the inputs of the first and second characteristic signals forming unit 5 and the threshold levels adjustment unit 6. The control input of the electronic switch 2 is connected to the outputs of the unit 5 for generating the first and second characteristic signals through the unit 7 for generating the control signal.
Адаптивный характер формировани первого и второго характеристических сигналов достигаетс св зью пороговых элементов , вход щих в соответствующие блоки, с требовани ми поканальных превышений текущих спектральных уровней и их линейных комбинаций в форматных зонах не менее чем на 9дБ за теми минимальными (за врем высказывани ) спектральными уровн ми , которыми оцениваетс шумовой спектральный фон, и тех превышений числа активных каналов над подпороговыми, которыми характеризуетс разговорна слитна речь. Введенный прием логической обработки характеристических сигналов с расширением управл ющих сигналов на интервалы, соответствующие допустимым паузам слитной речи, повышает количество звучани выделенного сигнала коммутируемого электронным ключом.The adaptive nature of the formation of the first and second characteristic signals is achieved by the connection of the threshold elements included in the corresponding blocks, with the requirements of per channel exceedances of the current spectral levels and their linear combinations in the format zones by at least 9 dB beyond the minimum (during pronouncing) spectral levels mi, by which the noise spectral background is estimated, and those excess of the number of active channels over subliminal, which are characterized by colloquial speech. The input of the logical processing of the characteristic signals with the extension of the control signals at intervals corresponding to the permissible pauses of the continuous speech increases the number of sounds of the selected signal switched by the electronic key.
Использование опии,иных адаптивных приемов выделени речевых сообщений на фоне нестационарных помех и схемотехники спектральной и логической обработки сигналов позволит повысить качество конференц-св зи , обеспечива при этом простоту автоподстройки автоматов, коммутирующих переговорную сеть соответственно динамике активности участков переговоров.The use of opium and other adaptive methods for extracting voice messages against the background of non-stationary interference and circuitry of the spectral and logical signal processing will improve the quality of the conference connection, while ensuring the simplicity of automatic tuning of the machines that switch the negotiation network according to the dynamics of the activity of the negotiation sections.