350 руб
Журнал «Нейрокомпьютеры: разработка, применение» №4 за 2016 г.
Статья в номере:
Проектирование системы анализа неструктурированной речевой информации
Ключевые слова:
система анализа речи
технология распознавания речи
человеко-машинный интерфейс
лингвистический процессор
Авторы:
М.П. Фархадов - д.т.н., зав. лабораторией автоматизированных систем массового обслуживания
и обработки сигналов, Институт проблем управления им В.А. Трапезникова РАН (Москва). E-mail: mais@ipu.ru
С.В. Васьковьский - к.т.н., ст. науч. сотрудник, Институт проблем управления им В.А. Трапезникова РАН (Москва). E-mail: v63v@yandex.ru
В.А. Смирнов - соискатель, Институт проблем управления им В.А. Трапезникова РАН (Москва). E-mail: v63v@yandex.ru
М.Э. Фархадова - к.филол.н., ст. преподаватель, Российский университет дружбы народов (Москва). E-mail: muhabbat-2007@mail.ru
Аннотация:
Представлена реализация целостной прикладной системы анализа неструктурированной речевой информации. Приведено описание программного комплекса речевой аналитики ANALYZE, лингвистические компоненты и человеко-машинный интерфейс. Рассмотрены архитектура решения и логика взаимодействия модулей, дано описание ключевых параметров наукоемких модулей системы и человеко-машинного интерфейса. Показан опыт практического применения данной системы для повышения качества организации массового обслуживания населения.
Страницы: 25-36
Список источников
- http://newzealand.nuance.com/news/20060801_dns.asp.
- http://australia.nuance.com/news/20070426_recognizer.asp.
- http://speech-drive.ru/recognize/.
- www.loquendo.com.
- Ney H. et al. The RWTH Large vocabulary continuous speech recognition system // In IEEE ICASSP. USA. 1998. P. 853-856.
- Loof J. et al. The RWTH 2007 TC-STAR Evaluation system for european english and spanish // In Proc. of Interspeech 2007. P. 2145-2148. Belgium. 2007.
- Greenberg S., Chang S. Linguistic dissection of switchboard-corpus automatic speech recognition systems. ISCA Workshop on Automatic Speech Recognition: Challenges for the New Millennium. Paris, 2000.
- Martin A., Pryzbocki M., Fiscus J., Pallet D. The 2000 NIST evaluation for recognition of conversational speech over the telephone. Presentation at the NIST Speech Transcription Workshop. 2000.
- Evermann G. et al. Development of the 2003 CU-HTK conversational telephone speech transcription system // In Proc. ICASSP. 2004.
- Furui S. Selected topics from 40 years of research on speech and speaker recognition // In Proc. of Interspeech 2009. P. 1-8.
- Akita Y., Mimura M., Kawahara T.Automatic transcription system for meetings of the japanese national congress. In Proc. of Interspeech 2009. P. 84-87.
- Nouza J., Cerva P., Zdansky J.Very large vocabulary voice dictation for mobile devices // In Proc. of Interspeech 2009. P. 995-998.
- Marasek K. Polish LVCSR in the Janus system. Preliminary results for the SpeeCon database // Archives of Acoustics. 2007.V. 32.№ 1.P. 119 - 126.
- Loof J. Gollan Ch., Ney H. Cross-language bootstrapping for unsupervised acoustic model training: rapid development of a polish speech recognition system // In Proc. of Interspeech 2009. P. 88-91.
- http://newsdesk.pcmag.ru/node/5975.
- Yamada M., et al. Improvement of rejection performance of keyword spotting using anti-keywords derived from large vocabulary considering acoustical similarity to keywords // In Proc. of Interspeech 2005.
- Heracleous P., Shimizu T. An efficient keyword spotting technique using a complementary language for filler models training. 8th european conference on speech communication and technology (Eurospeech 2003). 2003. P. 921-924.
- Smidl L., Muller L. Keyword Spotting for Highly Inflectional Languages // In Proc. of the 8th. ICSLP. USA. 1996. P. 2067-2070.
- Lin Q., Das S., Lubensky D., Picheny M. A New Confidence measure based on rank-ordering subphone scores // In Proc. ICSLP \'98.Australia. 1998.
- Manos A., Zue V. A segment based wordspotter using phonetic filler models 1997 // In Proc. of the 1997 IEEE ICASSP. 1997.V. 2. P. 899.
- Szoke I. et al. Comparison of keyword spotting approaches for informal continuous speech // In Proc. Of INTERSPEECH 2005. P. 633-636.
- www.speechpro.ru.
- www.nexidia.com.
- Hazen T., Richardson F., Margolis A.Topic identification from audio recordings using word and phone recognition lattices // In Proc. ASRU, Kyoto, December 2007.
- Hazen T., Margolis A. Discriminative feature weighting using mce training for topic identification of spoken audio recordings // In Proc. ICASS. USA, 2008.
- Gish H. et al. Unsupervised training of an HMM-based speech recognizer for topic classification // In Proc. of Interspeech 2009. P. 1935-1938.
- Смирнов В.А. Ермилов С.Н. Слово не воробей... Речевая аналитика для службы безопасности // Директор по безопасности. Ноябрь 2010. № 11. C. 28-37.
- Смирнов В.А., Гусев М.Н., Фархадов М.П. Функция лингвистического процессора в системе автоматического анализа неструктурированной речевой информации // Автоматизация и современные технологии. 2013. № 8. С. 22-28.
- Смирнов В. А., Гусев М. Н., Фархадов М. П. Функция модуля акустического моделирования в системе автоматического анализа неструктурированной речевой информации // Управление большими системами. М.: ИПУ РАН. 2013. Вып. 45. С.181-205.
- www.speech-drive.ru
- Билик P.B., Жожикашвилй В.А., Петухова Н.В., Фархадов М.П. Анализ речевого интерфейса в интерактивных сервисных системах // I. Автоматика и телемеханика. 2009. № 2. С. 80-89.
- Жожикашвили В.А., Петухова Н.В., Фархадов М.П. Компьютерные системы массового обслуживания и речевые технологии // Проблемы управления. 2006. № 2. С. 3-7.
- Жожикашвили В.А., Билик Р.В., Вертлиб В.А., Жожикашвили А.В., Петухова Н.В., Фархадов М.П. Открытые системы массового обслуживания с распознаванием речи // Проблемы управления. 2003. № 4. С. 55-62.
- Петухова Н.В., Васьковский С.В., Фархадов М.П., Смирнов В.А. Архитектура и характеристики систем распознавания речи // Нейрокомпьютеры: разработка, применение. 2013. № 12. С. 22-30.
- Фархадов М.П.Распознавание речи в системах массового обслуживания населения // Труды СПИИРАН. 2011. Вып. 4 (19). С. 65-86.
- Chechkin A.V., Pirogov M.V. Radical programming technology based on radical modeling // Нейрокомпьютеры. Разработка, применение. 2016. № 1. С. 3-16.
- Павловский И. С.Смысловая интеграция научно-технической информации в области разработки и применения нейросетевых технологий // Нейрокомпьютеры. Разработка, применение. 2016. № 3. С. 47-53.