Д.А. Бахматов1, В.В. Вакуленко2, И.М. Зацман3
1 МГУ имени М.В. Ломоносова (Москва, Россия)
2, 3 Федеральный исследовательский центр «Информатика и управление» РАН (Москва, Россия)
1 bahdan2013@yandex.ru, 2 v@vvak.ru, 3 izatsman@yandex.ru
Постановка проблемы. Предлагается подход к решению задач разрешения лексической неоднозначности (word sense disambiguation) с применением больших языковых моделей. Эти задачи относятся к категории проблем семантической сложности. Для таких задач сложно дать саму их постановку в формальном виде (например, задача создания системы правил для семантической интерпретации текста). Описание предлагаемого подхода дано на примере задачи разрешения лексической неоднозначности многозначных модальных глаголов в немецком языке. Разрешение неоднозначности – это выбор одного из нескольких значений многозначного слова, которое соответствует смысловому содержанию его использования в анализируемом контексте. Для этой задачи сложно определить в формальном виде понятие «значение», а также границы между разными значениями многозначного слова, что обуславливает ее отнесение к категории проблем семантической сложности. Традиционно подобные задачи решались, в основном, экспертно при составлении словарей, тезаурусов и других систем организации знания, что было связано со значительными временными и трудозатратами. С появлением систем искусственного интеллекта (ИИ-системы) на основе больших языковых моделей (large language model, далее – LLM) часть экспертной работы можно передать им.
Цель. Рассмотреть подход к решению задач разрешения лексической неоднозначности многозначных слов на основе гибридного интеллекта как сочетания работы ИИ-системы и последующего экспертного анализа ее результатов.
Результаты. Предложен подход к автоматизированному решению с помощью ИИ-систем на основе LLM задачи разрешения лексической неоднозначности.
Практическая значимость. Предложенный подход обеспечил существенное сокращение времени решения задачи разрешения лексической неоднозначности.
Бахматов Д.А., Вакуленко В.В., Зацман И.М. Разрешение лексической неоднозначности с применением больших языковых моделей // Системы высокой доступности. 2026. Т. 22. № 2. С. 33−39. DOI: https://doi.org/10.18127/j20729472-202602-03
- Akata Z., Balliet D., De Rijke M., Dignum F., Dignum V. et al. A research agenda for hybrid intelligence: Augmenting human intellect with collaborative, adaptive, responsible, and explainable artificial intelligence // Computer. 2020. V. 53. № 8. P. 18–28.
- Bredeweg B., Kragten M. Requirements and challenges for hybrid intelligence: A case-study in education // Frontiers in Artificial Intelligence. 2022. V. 5. № 8. P. 1–11.
- Weber F. Wambsganß T., Soellner M. Enhancing legal writing skills: The impact of formative feedback in a hybrid intelligence learning environment // British Journal of Educational Technology. 2025. V. 56. № 2. P. 650–677.
- Добровольский Д.О. Немецкие модальные глаголы в параллельном корпусе и задачи двуязычной лексикографии // Германские языки: текст, корпус, перевод / Отв. ред. Д.Б. Никуличева. М.: ИЯз РАН, 2020. С. 103–116.
- Добровольский Д.О., Зализняк Анна А. Об особом типе модальности необходимости: семантика немецкого глагола sollen по данным параллельных корпусов // Вопросы языкознания. 2021. № 6. С. 51-68.
- Добровольский Д. О., Зацман И. М. Модель извлечения знания из параллельных текстов лексикографической информационной системы // Информатика и её применения. 2024. Т. 18. Вып. 3. С. 97-105.
- Постановление Правительства РФ от 25 декабря 2024 г. № 1892 «О Национальном словарном фонде». http://government.ru/docs/53894/
- DWDS (Digitales Wörterbuch der deutschen Sprache). https://www.dwds.de
- Klein W., Geyken A. Das Digitale Wörterbuch der Deutschen Sprache (DWDS) // Lexicographica. 2010. V. 26. № 2010. P. 79–96.
- Geyken A., Wiegand F., Würzner K.-M. On-the-fly Generation of Dictionary Articles for the DWDS Website // Electronic Lexicography in the 21st Century: Proceedings of eLex 2017 conference / Eds. I. Kosem, C. Tiberius. Brno: Lexical Computing CZ s. r. o., 2017. P. 560–570.
- What is AI inference? https://www.ibm.com/think/topics/ai-inference
- LLM Inference. https://www.deepchecks.com/glossary/llm-inference/
- Wörterbücher im DWDS:sollen. https://www.dwds.de/wb/sollen
- Duden Online:sollen. https://www.duden.de/rechtschreibung/sollen
- Параллельный немецкий корпус в составе Национального корпуса русского языка. https://ruscorpora.ru/search?search=CiUqFwoICAAQChgyIAogADIFZ3JzdGRACngBMgcIBRIDZGV1OgEB

