Программный комплекс для определения границ речи в задачах автоматической верификации диктора

350 руб

Журнал «Биомедицинская радиоэлектроника» №6 за 2012 г.

Статья в номере:

Ключевые слова: распознавание речи верификация диктора границы речи

Авторы:

Ю.Г. Спажакин, Л.Т. Сушкова

Аннотация:

Рассматривается метод определения границ речи на основе измерителя частоты основного тона. При определении границ речи в случае появления всплесков сигнала на выходе измерителя частоты основного тона ложно идентифицированных как вокализованная речь, происходит анализ данных сегментов по уровню энергии, частоте переходов через нуль, энтропии спектра, длительности анализируемого непрерывного фрагмента сигнала. Наиболее оптимальная гипотеза при коллективном принятии решения принимается как верная, и сегмент классифицируется в качестве границы голосовой команды, фрагмента интенсивного фонового шума или артефакта при звукозаписи.

Страницы: 68-77

Список источников

Карпов А.А. Робастный метод определения границ речи на основе спектральной энтропии // Искусственный интеллект. 2004. № 4. С. 607-613.
Спажакин Ю.Г., Сушкова Л.Т. Метод выделения информативного речевого фрагмента в задачах автоматической верификации диктора // 13-я междунар. конференция «Цифровая обработка сигналов и ее применение -DSPA-2011» М.: РНТОРЭС им. А.С. Попова 2011. С. 249-252.
DanMiller, SeniorAnalyst. Opusresearch // VoiceBiometricsConference. 2007. Washington.
GhulamMuhammad. Extendedaveragemagnitude difference function based pitch detection // The International Arab Journal of Information Technology. 2011. V. 8.№ 2.
Khurram Waheed, Kim Weaver and Fathi M. Salam. A robust algorithm for detecting speech segments using an entropy contrast // Proc. 45th IEEE International Midwest Symposium on Circuits and Systems MWSCAS-2002. Oklahoma (USA). 2002.
Rabiner L., Juang B. Fundamentals of speech Recognition. New Jersey: Prentice-Hall, Englewood Cliffs. USA. 1993.
Shen J.-L., Hung J.-W., Lee L.-S. Robust Entropy-based Endpoint Detection for Speech Recognition in Noisy Environments // Proc. Int. Conf. on Spoken Lang. ProcessingICSLP-98. Sydney (Australia). 1998.
Young-Hwan Song, Doo-Heon Kyun, Jong-Kuk Kim, Myung-Jin Bae. On SNR Estimation by the Likelhood of near Pitch for Speech Detection, World Academy of Science, Engineering and Technology 32. 2007.