350 руб
Журнал «Наукоемкие технологии» №8 за 2012 г.
Статья в номере:
Эталонная модель источника речевых сообщений на основе гауссовских смесей
Ключевые слова:
низкоскоростные кодеры речи
идентификация диктора
модель гауссовских смесей
коэффициент логарифмического отношения площадей
линейное предсказание речи
источник речевых сообщений
Авторы:
Д.Н. Чубатый
Аннотация:
Предложена эталонная модель источника речевых сообщений на основе Гауссовых смесей для идентификации личности в сетях сотовой связи стандарта GSM. Показано, что особенностью этой модели является использование вектора различительных признаков, сформированного из параметров, передаваемых в кадре низкоскоростного кодера речи RPE-LTP.
Страницы: 23-27
Список источников
- Рабинер Л. Р., Шафер Р. В.Цифровая обработка речевых сигналов: / пер. с англ. / под ред. М. В. Назарова и Ю. Н. Прохорова. М.: Радио и связь. 1981.
- Первушин Е. А.Обзор основных методов распознавания дикторов / под ред. А. К. Гуца// Математические структуры и моделирование: Сб. науч. трудов (Омск). Вып. 24. 2011. С. 41 - 54.
- Campbell J. P. Speaker recognition // Proceedings of the IEEE. September 1997. V. 85. № 9. P. 1437 - 1462.
- Тимофеев Д. И.Анализ современного состояния и перспектив применения речевых сигналов с низкоскоростным
кодированием в цифровых системах передачи информации // Сборник рефератов
депонированных рукописей. Сер.
Б. Вып. 61.
М: ЦВНИМОРФ. 2002. - Reynolds D. A., Rose R. C. Robust text-independent speaker identification using Gaussian mixture speaker models // IEEE transaction on speech and audio progressing. January 1995. V. 3. № 1. P. 72 - 83.
- Садыхов Р. Х., Ракуш В. В. МоделиГауссовых смесей для верификации диктора по произвольной речи // Докл. Белорусского государственного университета информатики и радиоэлектроники. Минск. 2003. С. 95 - 103.
- Chow D., Abdulla W. H. Robust speaker identification based on perceptual log area ratio and Gaussian mixture models // INTERSPEECH 2004, 8th International Conference on Spoken Language Processing, Jeju Island, Korea., 4 - 8 October. 2004. P. 1761 - 1764.
- Маркел Дж. Д., Грэй А. Х. Линейное предсказание речи: пер. с англ. / под ред. Ю. Н. Прохорова и В. С. Звездина. М.: Связь. 1980.
- ETSI/TC SMG. Recommendation GSM 6.10. GSM full rate speech transcoding. February 1992.