Б.С. Горячкин1, А.А. Андрианов2, Д.В. Можаев3
1–3 МГТУ им. Н.Э. Баумана (Москва, Россия)
1 bsgor@mail.ru, 2 alks.andrnv@gmail.com, 3 mdv413@mail.ru
Постановка проблемы. Системы распознавания речи стремительно внедряются во все области человеческой активности. Для эффективного использования системы распознавания речи необходимо выстроить качественную и производительную модель взаимодействия человек – приложение, которая будет способствовать работе и вовлекать пользователя в процесс. В статье рассматриваются вопросы анализа способов повышения качества взаимодействия человека и облачной системы распознавания речи, исследуется производительность системы вывода и её связи с восприятием интерфейса человеком. Подвергаются анализу варианты взаимодействия между системой распознавания речи и клиентом, и определяется оптимальный.
Цель. Провести анализ и сравнение различных способов передачи данных, предназначенных для обработки облачной системой распознавания речи, определить наиболее эффективный способ на основании скорости отклика пользовательского интерфейса.
Результаты. Показано, как размер передаваемого интервала речи влияет на скорость отображения результатов распознавания. Проанализированы случаи передачи аудиоданных, разбитых по словам и по предложениям. Проведено сравнение технологических циклов потоков информации и приведена диаграмма Ганта для каждого случая. Выявлены закономерности скорости отображения в зависимости от длины интервала.
Практическая значимость. На основании результатов анализа становится возможной разработка наиболее отзывчивой и удобной для пользователя системы. Результаты расчетов указывают на кратный прирост скорости отклика, что благоприятно сказывается на пользовательском опыте.
Горячкин Б.С., Андрианов А.А., Можаев Д.В. Анализ производительности для системы распознавания речи // Нейрокомпьютеры: разработка, применение. 2023. T. 25. № 6. С. 47-55. DOI: https://doi.org/10.18127/j1999 8554-202306-05
- Лиманова Н.И., Селезнев И.А. Анализ эффективности клиент-серверной архитектуры // Бюллетень науки и практики. 2022. Т. 8. № 7. С. 392–396. DOI 10.33619/2414-2948/80/37.
- Андриянов Н.А., Камалова Ю.Б. Исследование эффективности и производительности алгоритмов компьютерного зрения в задачах распознавания зерен пыльцы // Информационно-измерительные и управляющие системы. 2022. Т. 20. № 5. С. 48–54. DOI 10.18127/j20700814-202205-08.
- Карпов А.А., Кипяткова И.С. Методология оценивания работы систем автоматического распознавания речи // Известия высших учебных заведений. Приборостроение. 2012. Т. 55. № 11. С. 38–43.
- Якубов М.С., Умурзакова Д.М. Методы и алгоритмы распознавания речи с дефектными произношениями // Перспективы развития информационных технологий. 2016. № 29. С. 44–48.
- Беленко М.В., Балакшин П.В. Сравнительный анализ систем распознавания речи с открытым кодом // Международный научно-исследовательский журнал. 2017. № 4-4(58). С. 13–18. DOI 10.23670/IRJ.2017.58.141.
- Бабаринов С.Л., Будникова М.А. О распознавании речи // Научные ведомости Белгородского государственного университета. Серия: Экономика. Информатика. 2014. № 21(192). С. 182–185.
- Поляничко К.С. Обзор и тестирование систем распознавания речи // Огарёв-Online. 2021. № 12(165).