500 руб
Журнал «Системы высокой доступности» №2 за 2026 г.
Статья в номере:
Разрешение лексической неоднозначности с применением больших языковых моделей
Тип статьи: научная статья
DOI: https://doi.org/10.18127/j20729472-202602-03
УДК: 004.822
Авторы:

Д.А. Бахматов1, В.В. Вакуленко2, И.М. Зацман3

1 МГУ имени М.В. Ломоносова (Москва, Россия)
2, 3 Федеральный исследовательский центр «Информатика и управление» РАН (Москва, Россия)
1 bahdan2013@yandex.ru, 2 v@vvak.ru, 3 izatsman@yandex.ru

Аннотация:

Постановка проблемы. Предлагается подход к решению задач разрешения лексической неоднозначности (word sense disambiguation) с применением больших языковых моделей. Эти задачи относятся к категории проблем семантической сложности. Для таких задач сложно дать саму их постановку в формальном виде (например, задача создания системы правил для семантической интерпретации текста). Описание предлагаемого подхода дано на примере задачи разрешения лексической неоднозначности многозначных модальных глаголов в немецком языке. Разрешение неоднозначности – это выбор одного из нескольких значений многозначного слова, которое соответствует смысловому содержанию его использования в анализируемом контексте. Для этой задачи сложно определить в формальном виде понятие «значение», а также границы между разными значениями многозначного слова, что обуславливает ее отнесение к категории проблем семантической сложности. Традиционно подобные задачи решались, в основном, экспертно при составлении словарей, тезаурусов и других систем организации знания, что было связано со значительными временными и трудозатратами. С появлением систем искусственного интеллекта (ИИ-системы) на основе больших языковых моделей (large language model, далее – LLM) часть экспертной работы можно передать им.

Цель. Рассмотреть подход к решению задач разрешения лексической неоднозначности многозначных слов на основе гибридного интеллекта как сочетания работы ИИ-системы и последующего экспертного анализа ее результатов.

Результаты. Предложен подход к автоматизированному решению с помощью ИИ-систем на основе LLM задачи разрешения лексической неоднозначности.

Практическая значимость. Предложенный подход обеспечил существенное сокращение времени решения задачи разрешения лексической неоднозначности.

Страницы: 33-39
Для цитирования

Бахматов Д.А., Вакуленко В.В., Зацман И.М. Разрешение лексической неоднозначности с применением больших языковых моделей // Системы высокой доступности. 2026. Т. 22. № 2. С. 33−39. DOI: https://doi.org/10.18127/j20729472-202602-03

Список источников
  1. Akata Z., Balliet D., De Rijke M., Dignum F., Dignum V. et al. A research agenda for hybrid intelligence: Augmenting human intellect with collaborative, adaptive, responsible, and explainable artificial intelligence // Computer. 2020. V. 53. № 8. P. 18–28.
  2. Bredeweg B., Kragten M. Requirements and challenges for hybrid intelligence: A case-study in education // Frontiers in Artificial Intelligence. 2022. V. 5. № 8. P. 1–11.
  3. Weber F. Wambsganß T., Soellner M. Enhancing legal writing skills: The impact of formative feedback in a hybrid intelligence learning environment // British Journal of Educational Technology. 2025. V. 56. № 2. P. 650–677.
  4. Добровольский Д.О. Немецкие модальные глаголы в параллельном корпусе и задачи двуязычной лексикографии // Германские языки: текст, корпус, перевод / Отв. ред. Д.Б. Никуличева. М.: ИЯз РАН, 2020. С. 103–116.
  5. Добровольский Д.О., Зализняк Анна А. Об особом типе модальности необходимости: семантика немецкого глагола sollen по данным параллельных корпусов // Вопросы языкознания. 2021. № 6. С. 51-68.
  6. Добровольский Д. О., Зацман И. М. Модель извлечения знания из параллельных текстов лексикографической информационной системы // Информатика и её применения. 2024. Т. 18. Вып. 3. С. 97-105.
  7. Постановление Правительства РФ от 25 декабря 2024 г. № 1892 «О Национальном словарном фонде». http://government.ru/docs/53894/
  8. DWDS (Digitales Wörterbuch der deutschen Sprache). https://www.dwds.de
  9. Klein W., Geyken A. Das Digitale Wörterbuch der Deutschen Sprache (DWDS) // Lexicographica. 2010. V. 26. № 2010. P. 79–96.
  10. Geyken A., Wiegand F., Würzner K.-M. On-the-fly Generation of Dictionary Articles for the DWDS Website // Electronic Lexicography in the 21st Century: Proceedings of eLex 2017 conference / Eds. I. Kosem, C. Tiberius. Brno: Lexical Computing CZ s. r. o., 2017. P. 560–570.
  11. What is AI inference? https://www.ibm.com/think/topics/ai-inference
  12. LLM Inference. https://www.deepchecks.com/glossary/llm-inference/
  13. Wörterbücher im DWDS:sollen. https://www.dwds.de/wb/sollen
  14. Duden Online:sollen. https://www.duden.de/rechtschreibung/sollen
  15. Параллельный немецкий корпус в составе Национального корпуса русского языка. https://ruscorpora.ru/search?search=CiUqFwoICAAQChgyIAogADIFZ3JzdGRACngBMgcIBRIDZGV1OgEB
Дата поступления: 11.03.2026
Одобрена после рецензирования: 25.03.2026
Принята к публикации: 06.04.2026