Н.А. Борсук1, Т.А. Онуфриева2, Л.В. Царев3, П.А. Дерюгин4, А.Ю. Титов5
1–5 Калужский филиал МГТУ им. Н.Э. Баумана (г. Калуга, Россия)
1 borsuk.65@yandex.ru, 2 onufrievata@mail.ru, 3 x174101@gmail.com,
4 shadowmadness792@mail.ru, 5 alexcandr40@mail.ru
Постановка проблемы. В настоящее время все больше в общении между людьми используются компьютерные технологии, а именно: мессенджеры на различных устройствах. Однако в процессе общения или пересылки больших объемов текстовой информации люди зачастую допускают грамматические ошибки, что категорически недопустимо в деловом общении. В связи с этим возникает необходимость разработки семантического анализатора, который служит для автоматического исправления грамматических ошибок в текстах на русском языке.
Цель. Разработать семантический анализатор текста с использованием нейронных сетей, работающий с большим объемом данных, для повышения грамотности русскоязычного населения.
Результаты. Показана возможность разработки семантического анализатора с использованием нейронных сетей. Проведена апробация разработанного семантического анализатора на больших объемах данных, которая показала 68,7% правильности коррекции слов в предложениях.
Практическая значимость. Представленный семантический анализатор может быть полезен для пользователей, благодаря своей удобности и эффективности. Разработка и использование такого инструмента имеет большое значение в настоящее время и в перспективе. В дальнейшем рассмотренная нейронная сеть продолжит обучаться на больших Data Set.
Борсук Н.А., Онуфриева Т.А., Царев Л.В., Дерюгин П.А., Титов А.Ю. Разработка семантического анализатора с использованием нейронных сетей // Нейрокомпьютеры: разработка, применение. 2024. T. 26. № 1. С. 5-13. DOI: https://doi.org/10.18127/ j19998554-202401-01
- Ярушкина Н.Г., Мошкин В.С., Филиппов А.А., Гуськов Г.Ю., Романов А.А., Наместников А.М. Разработка программной системы семантического анализа контента социальных медиа // Радиотехника. 2018. № 6. С. 73–79.
- Новиков А.Ю., Столяров М.Г. Алгоритм первичной семантической интерпретации клауз в интересах построения подсистемы первичного семантического анализа в системе автоматической обработки текстовой информации // Наукоемкие технологии. 2011. Т. 12. № 8. С. 54–59.
- Диковицкий В.В. Семантический анализ текста с применением нейросетевого анализа морфологии и синтаксиса // Труды Кольского научного центра РАН. 2017. Т. 8. № 3-8. С. 109–115.
- Статистика интернета и соцсетей на 2023 год – цифры и тренды в мире и в России. [Электронный ресурс] – Режим доступа: https://www.web-canape.ru/business/statistika-interneta-i-socsetej-na-2023-god-cifry-i-trendy-v-mire-i-v-rossii/, дата обращения 18.10.2023.
- Пащенко А.В. Технологии распознавания изображений и синтаксического анализа на Российском рынке // Вестник Таганрогского института управления и экономики. 2022. № 1(35). С. 116–118.
- Сорока Б.О., Кубанских О.В. Основные проблемы при создании семантико-синтаксических анализаторов // Ученые записки Брянского государственного университета. 2017. № 2(6). С. 21–24.
- Траулько М.В. Программная реализация нечеткого поиска текстовой информации в словаре с помощью расстояния Левенштейна // Форум молодых ученых. 2017. № 12(16). С. 1827–1832.
- Постолит А.В. Основы искусственного интеллекта в примерах на Python. СПб: БХВ-Петербург. 2021. 448 с.
- Рашка С., Мирджалили В. Python и машинное обучение. Изд. 3-е. М.: ДМК Пресс. 2021. 848 c.
- Лонца А. Алгоритмы обучения с подкреплением на Python. М.: ДМК Пресс. 2020. 286 с.
- Вейдман С. Глубокое обучение: легкая разработка проектов на Python. СПб.: Питер. 2021. 272 с.
- Элбон К. Машинное обучение с использованием Python. Сборник рецептов. СПб: БХВ-Петербург. 2019. 384 с.
- Грас Дж. Data Science. Наука о данных с нуля. СПб: БХВ-Петербург. 2020. 416 с.