Анализ и синтез моделей машинного обучения для решения задачи поиска именованных сущностей

350 руб

Журнал «Нейрокомпьютеры: разработка, применение» №3 за 2024 г.

Статья в номере:

Тип статьи: научная статья

DOI: https://doi.org/10.18127/j19998554-202403-01

УДК: 004.021

Ключевые слова: Диалоговая система обработка естественного языка распознавание именованных сущностей сегментный граф классификатор энкодер

Авторы:

Б.С. Горячкин1, Р.И. Ким2

1,2 МГТУ им. Н.Э. Баумана (Москва, Россия)

1 bsgor@mail.ru, 2 radmir.kim99@mail.ru

Аннотация:

Постановка проблемы. Построение диалоговой системы является объемной и комплексной задачей, включающей в себя множество классических задач обработки естественного языка, одной из которых является поиск именованных сущностей (Named Entity Recognition – NER), поскольку именно сущности являются жесткими онтологиями для определения смысла текста. Все сущности можно разделить на три группы: «плоские» или обычные сущности, вложенные и разделенные по тексту. При решении задачи NER возникает сложность с построением универсальной модели для качественной обработки всех типов сущностей.

Цель. Изучить и проанализировать различные подходы для распознавания типов сущностей, выделить эталонные решения и разработать на их основе варианты архитектур моделей, способных обрабатывать все типы сущностей.

Результаты. Разработаны различные архитектуры моделей на основе компонентов эталонных решений для поиска универсальной из них с целью обработки всех типов сущностей. Выявлены в результате сравнения и анализа оптимальные архитектурные решения как по скорости работы, так и по точности, способные показывать высокое качество работы для всех типов сущностей.

Практическая значимость. Разработанные архитектуры моделей позволяют качественно обрабатывать все типы сущностей. Полученные модели охватывают все типы сущностей и превосходят базовые решения по средним показателям скорости и точности.

Страницы: 5-13

Для цитирования

Горячкин Б.С., Ким Р.И. Анализ и синтез моделей машинного обучения для решения задачи поиска именованных сущностей // Нейрокомпьютеры: разработка, применение. 2024. T. 26. № 3. С. 5-13. DOI: https://doi.org/10.18127/j19998554-202403-01

Список источников

Гапанюк Ю.Е., Леонтьев А.В., Латкин И.И., Чернобровкин С.В., Белянова М.А., Морозенков О.Н. Гибридная интеллектуальная русскоязычная диалоговая информационная система на основе метаграфового подхода // Динамика сложных систем – XXI век. 2018. Т. 12. № 1. С. 77–86.
Монахов Ю.М., Артюшина Л.А., Маков Е.О., Исмаилова М.Р. Модель интеллектуальной диалоговой системы для автоматизированного заказа билетов на основе семантического анализа // Динамика сложных систем – XXI век. 2018. Т. 12. № 2. С. 75–80.
Tarassov V.B., Gapanyuk Yu.E. Complex Graphs in the Modeling of Multiagent Systems: From Goal-Resource Networks to Fuzzy Metagraphs // Lecture notes in computer science. 2020. V. 12412. P. 177–198. DOI 10.1007/978-3-030-59535-7_13.
Belyanova M.A., Andreev A.M., Gapanyuk Yu.E. Neural Text Question Generation for Russian Language Using Hybrid Intelligent Information Systems Approach // Studies in Computational Intelligence. 2022. V. 1008 SCI. P. 217–223. DOI 10.1007/978-3-030-91581-0_29.
Wang J., Shou L., Chen K., Chen G. Pyramid: A Layered Model for Nested Named Entity Recognition // Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics. 2020. P. 5918–5928. DOI 10.18653/v1/2020.acl-main.525.
Wang Y., Yu B., Zhu H., Liu T., Yu N., Sun L. Discontinuous Named Entity Recognition as Maximal Clique Discovery // Proceedings of the 59th Annual Meeting of the Association for Computational Linguistics and the 11th International Joint Conference on Natural Language Processing. 2021. V. 1 Long Papers. P. 764–774. DOI 10.18653/v1/2021.acl-long.63.
Dong L., Yang N., Wang W., Wei F., Liu X., Wang Y., Gao J., Zhou M., Hon H.-W. Unified Language Model Pre-training for Natural Language Understanding and Generation // Neural Information Processing Systems. 2019. DOI 10.48550/arXiv.1905.03197.
Yu J., Bohnet B., Poesio M. Named Entity Recognition as Dependency Parsing // Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics. 2020. P. 6470–6476. DOI 10.18653/v1/2020.acl-main.577.
Luo L., Lai P.-T., Wei C.-H., Arighi C.N., Lu Z. BioRED: A Rich Biomedical Relation Extraction Dataset // Briefings in Bioinformatics. 2022. V. 23. № 5. DOI 10.1093/bib/bbac282.
Le T.A., Arkhipov M.Y., Burtsev M.S. Application of a hybrid BI-LSTM-CRF model to the task of Russian named entity recognition // Communications in computer and information science. 2017. V. 789. P. 91–103. DOI 10.1007/978-3-319-71746-3_8.

Дата поступления: 13.11.2023

Одобрена после рецензирования: 01.12.2023

Принята к публикации: 26.05.2024