Проектирование системы анализа неструктурированной речевой информации

350 руб

Журнал «Нейрокомпьютеры: разработка, применение» №4 за 2016 г.

Статья в номере:

Ключевые слова: система анализа речи технология распознавания речи человеко-машинный интерфейс лингвистический процессор

Авторы:

М.П. Фархадов - д.т.н., зав. лабораторией автоматизированных систем массового обслуживания и обработки сигналов, Институт проблем управления им В.А. Трапезникова РАН (Москва). E-mail: mais@ipu.ru С.В. Васьковьский - к.т.н., ст. науч. сотрудник, Институт проблем управления им В.А. Трапезникова РАН (Москва). E-mail: v63v@yandex.ru В.А. Смирнов - соискатель, Институт проблем управления им В.А. Трапезникова РАН (Москва). E-mail: v63v@yandex.ru М.Э. Фархадова - к.филол.н., ст. преподаватель, Российский университет дружбы народов (Москва). E-mail: muhabbat-2007@mail.ru

Аннотация:

Представлена реализация целостной прикладной системы анализа неструктурированной речевой информации. Приведено описание программного комплекса речевой аналитики ANALYZE, лингвистические компоненты и человеко-машинный интерфейс. Рассмотрены архитектура решения и логика взаимодействия модулей, дано описание ключевых параметров наукоемких модулей системы и человеко-машинного интерфейса. Показан опыт практического применения данной системы для повышения качества организации массового обслуживания населения.

Страницы: 25-36

Список источников

http://newzealand.nuance.com/news/20060801_dns.asp.
http://australia.nuance.com/news/20070426_recognizer.asp.
http://speech-drive.ru/recognize/.
www.loquendo.com.
Ney H. et al. The RWTH Large vocabulary continuous speech recognition system // In IEEE ICASSP. USA. 1998. P. 853-856.
Loof J. et al. The RWTH 2007 TC-STAR Evaluation system for european english and spanish // In Proc. of Interspeech 2007. P. 2145-2148. Belgium. 2007.
Greenberg S., Chang S. Linguistic dissection of switchboard-corpus automatic speech recognition systems. ISCA Workshop on Automatic Speech Recognition: Challenges for the New Millennium. Paris, 2000.
Martin A., Pryzbocki M., Fiscus J., Pallet D. The 2000 NIST evaluation for recognition of conversational speech over the telephone. Presentation at the NIST Speech Transcription Workshop. 2000.
Evermann G. et al. Development of the 2003 CU-HTK conversational telephone speech transcription system // In Proc. ICASSP. 2004.
Furui S. Selected topics from 40 years of research on speech and speaker recognition // In Proc. of Interspeech 2009. P. 1-8.
Akita Y., Mimura M., Kawahara T.Automatic transcription system for meetings of the japanese national congress. In Proc. of Interspeech 2009. P. 84-87.
Nouza J., Cerva P., Zdansky J.Very large vocabulary voice dictation for mobile devices // In Proc. of Interspeech 2009. P. 995-998.
Marasek K. Polish LVCSR in the Janus system. Preliminary results for the SpeeCon database // Archives of Acoustics. 2007.V. 32.№ 1.P. 119 - 126.
Loof J. Gollan Ch., Ney H. Cross-language bootstrapping for unsupervised acoustic model training: rapid development of a polish speech recognition system // In Proc. of Interspeech 2009. P. 88-91.
http://newsdesk.pcmag.ru/node/5975.
Yamada M., et al. Improvement of rejection performance of keyword spotting using anti-keywords derived from large vocabulary considering acoustical similarity to keywords // In Proc. of Interspeech 2005.
Heracleous P., Shimizu T. An efficient keyword spotting technique using a complementary language for filler models training. 8th european conference on speech communication and technology (Eurospeech 2003). 2003. P. 921-924.
Smidl L., Muller L. Keyword Spotting for Highly Inflectional Languages // In Proc. of the 8th. ICSLP. USA. 1996. P. 2067-2070.
Lin Q., Das S., Lubensky D., Picheny M. A New Confidence measure based on rank-ordering subphone scores // In Proc. ICSLP \'98.Australia. 1998.
Manos A., Zue V. A segment based wordspotter using phonetic filler models 1997 // In Proc. of the 1997 IEEE ICASSP. 1997.V. 2. P. 899.
Szoke I. et al. Comparison of keyword spotting approaches for informal continuous speech // In Proc. Of INTERSPEECH 2005. P. 633-636.
www.speechpro.ru.
www.nexidia.com.
Hazen T., Richardson F., Margolis A.Topic identification from audio recordings using word and phone recognition lattices // In Proc. ASRU, Kyoto, December 2007.
Hazen T., Margolis A. Discriminative feature weighting using mce training for topic identification of spoken audio recordings // In Proc. ICASS. USA, 2008.
Gish H. et al. Unsupervised training of an HMM-based speech recognizer for topic classification // In Proc. of Interspeech 2009. P. 1935-1938.
Смирнов В.А. Ермилов С.Н. Слово не воробей... Речевая аналитика для службы безопасности // Директор по безопасности. Ноябрь 2010. № 11. C. 28-37.
Смирнов В.А., Гусев М.Н., Фархадов М.П. Функция лингвистического процессора в системе автоматического анализа неструктурированной речевой информации // Автоматизация и современные технологии. 2013. № 8. С. 22-28.
Смирнов В. А., Гусев М. Н., Фархадов М. П. Функция модуля акустического моделирования в системе автоматического анализа неструктурированной речевой информации // Управление большими системами. М.: ИПУ РАН. 2013. Вып. 45. С.181-205.
www.speech-drive.ru
Билик P.B., Жожикашвилй В.А., Петухова Н.В., Фархадов М.П. Анализ речевого интерфейса в интерактивных сервисных системах // I. Автоматика и телемеханика. 2009. № 2. С. 80-89.
Жожикашвили В.А., Петухова Н.В., Фархадов М.П. Компьютерные системы массового обслуживания и речевые технологии // Проблемы управления. 2006. № 2. С. 3-7.
Жожикашвили В.А., Билик Р.В., Вертлиб В.А., Жожикашвили А.В., Петухова Н.В., Фархадов М.П. Открытые системы массового обслуживания с распознаванием речи // Проблемы управления. 2003. № 4. С. 55-62.
Петухова Н.В., Васьковский С.В., Фархадов М.П., Смирнов В.А. Архитектура и характеристики систем распознавания речи // Нейрокомпьютеры: разработка, применение. 2013. № 12. С. 22-30.
Фархадов М.П.Распознавание речи в системах массового обслуживания населения // Труды СПИИРАН. 2011. Вып. 4 (19). С. 65-86.
Chechkin A.V., Pirogov M.V. Radical programming technology based on radical modeling // Нейрокомпьютеры. Разработка, применение. 2016. № 1. С. 3-16.
Павловский И. С.Смысловая интеграция научно-технической информации в области разработки и применения нейросетевых технологий // Нейрокомпьютеры. Разработка, применение. 2016. № 3. С. 47-53.