Эталонная модель источника речевых сообщений на основе гауссовских смесей

350 руб

Журнал «Наукоемкие технологии» №8 за 2012 г.

Статья в номере:

Ключевые слова: низкоскоростные кодеры речи идентификация диктора модель гауссовских смесей коэффициент логарифмического отношения площадей линейное предсказание речи источник речевых сообщений

Авторы:

Д.Н. Чубатый

Аннотация:

Предложена эталонная модель источника речевых сообщений на основе Гауссовых смесей для идентификации личности в сетях сотовой связи стандарта GSM. Показано, что особенностью этой модели является использование вектора различительных признаков, сформированного из параметров, передаваемых в кадре низкоскоростного кодера речи RPE-LTP.

Страницы: 23-27

Список источников

Рабинер Л. Р., Шафер Р. В.Цифровая обработка речевых сигналов: / пер. с англ. / под ред. М. В. Назарова и Ю. Н. Прохорова. М.: Радио и связь. 1981.
Первушин Е. А.Обзор основных методов распознавания дикторов / под ред. А. К. Гуца// Математические структуры и моделирование: Сб. науч. трудов (Омск). Вып. 24. 2011. С. 41 - 54.
Campbell J. P. Speaker recognition // Proceedings of the IEEE. September 1997. V. 85. № 9. P. 1437 - 1462.
Тимофеев Д. И.Анализ современного состояния и перспектив применения речевых сигналов с низкоскоростным кодированием в цифровых системах передачи информации // Сборник рефератов депонированных рукописей. Сер. Б. Вып. 61.
М: ЦВНИМОРФ. 2002.
Reynolds D. A., Rose R. C. Robust text-independent speaker identification using Gaussian mixture speaker models // IEEE transaction on speech and audio progressing. January 1995. V. 3. № 1. P. 72 - 83.
Садыхов Р. Х., Ракуш В. В. МоделиГауссовых смесей для верификации диктора по произвольной речи // Докл. Белорусского государственного университета информатики и радиоэлектроники. Минск. 2003. С. 95 - 103.
Chow D., Abdulla W. H. Robust speaker identification based on perceptual log area ratio and Gaussian mixture models // INTERSPEECH 2004, 8th International Conference on Spoken Language Processing, Jeju Island, Korea., 4 - 8 October. 2004. P. 1761 - 1764.
Маркел Дж. Д., Грэй А. Х. Линейное предсказание речи: пер. с англ. / под ред. Ю. Н. Прохорова и В. С. Звездина. М.: Связь. 1980.
ETSI/TC SMG. Recommendation GSM 6.10. GSM full rate speech transcoding. February 1992.