350 руб
Журнал «Системы высокой доступности» №2 за 2025 г.
Статья в номере:
Автоматизация доступа к информации при навигации по данным семантической библиотеки и интеграции графа знаний с языковой моделью
Тип статьи: научная статья
DOI: https://doi.org/10.18127/j20729472-202502-01
УДК: 004
Авторы:

В.И. Будзко1, О.М. Атаева2, Н.П. Тучкова3

1–3 ФИЦ ИУ РАН (Москва, Россия)
1 vbudzko@ipiran.ru, 2 oataeva@frccsc.ru, 3 ntuchkova@frccsc.ru

Аннотация:

Постановка проблемы. Исследуется проблема интеграции языковых моделей (LM) и графа знаний (KG). KG строится в семантической библиотеке научных предметных областей LibMeta для навигации по данным научных публикаций. На примере KG математической предметной области (SjD) показано, что в результате такого подхода LM не выходит за рамки SjD, что позволяет утверждать о более релевантном ответе на запрос. В основу описаний математической SjD положены математические энциклопедии советской, Российской математической школы, а наполнение библиотеки предметных областей осуществляется путем интеграции предметных областей профильных математических журналов. На примере математических SjD и приложений рассматривается задача создания среды для использования цифрового ассистента на русском языке при овладении научными знаниями в локальной SjD и доступа к научным исследованиям. Настройка LM на SjD реализуется путем создания множества инструкций и проверки истинности ответов на их основе. Приложения результатов исследования предполагаются во внедрении в системы математических знаний, библиотечные и журнальные системы для поддержки бизнес-процессов, поиска и анализа научных публикаций.

Цель. Исследования направлены на создание технологии информационной поддержки научных исследований в процессе поиска и анализа научной информации. Предлагаемый подход позволяет уменьшить поток информационного шума при работе с научными изданиями.

Результаты. Разработана методология взаимодействия LM и KG математической SjD на основе инструкций, применяемых к описанию SjD в виде KG.

Практическая значимость. Применение предложенного подхода позволит использовать множество инструкций для упрощения работы с LM в процессе поиска профильной информации при уменьшении галлюцинаций LM и без привлечения экспертной консультации. В условиях интенсификации научного труда, связанного с возрастающим потоком информации, предлагается решение для поисковой дополненной генерации (RAG).

Страницы: 5-20
Для цитирования

Будзко В.И., Атаева О.М., Тучкова Н.П. Автоматизация доступа к информации при навигации по данным семантической библиотеки и интеграции графа знаний с языковой моделью // Системы высокой доступности. 2025. Т. 21. № 2. С. 5−20. DOI: https://doi.org/ 10.18127/j20729472-202502-01

Список источников
  1. Russell S., Norvig P. Artificial Intelligence, Global Edition. A Modern Approach. 4th edition. Munich, Pearson. 2021. 1168 p.
  2. ISO 25964 the international standard for thesauri and interoperability with other vocabularies. https://www.niso.org/schemas/iso25964
  3. Ataeva O., Serebryakov V., Tuchkova N. Development of the semantic space 'Mathematics' by integrating a subspace of its applied area // Lobachevskii Journal of Mathematics. 2022. V. 43. № 12. P. 3435–3446. https://doi.org/10.1134/S1995080222150069
  4. Kaddour J., at all. Challenges and Applications of Large Language Models / Kaddour J., Harris J., Mozes M., Bradley H., Raileanu R., McHardy R. 2023. https://arxiv.org/abs/2307.10169  https://doi.org/10.48550/arXiv.2307.10169
  5. Singh A., Ehtesham A., Kumar T., Khoei T. Agentic retrieval-augmented generation: a survey on agentic RAG. 2025. https://doi.org/10.48550/arXiv.2501.09136
  6. Annepaka, Y., Pakray P. Large language models: a survey of their development, capabilities, and applications // Knowledge and Information Systems. 2025. V. 67. P. 2967–3022. https://doi.org/10.1007/s10115-024-02310-4
  7. Minaee S., Mikolov T., Nikzad N., Chenaghlu M., Socher R., Amatriain X., Gao J. Large Language Models: A Survey. 2025. arXiv:2402.06196v3 /https://doi.org/10.48550/arXiv.2402.06196
  8. Liu Z., etc. // OntoTune: Ontology-Driven Self-training for Aligning Large Language Models / Z. Liu, C. Gan, J. Wang, Y. Zhang, Z. Bo, M. Sun, H. Chen, W.Zhang. arXiv:2502.05478. 2025.  https://doi.org/10.48550/arXiv.2502.05478
  9. Xu D., etc. Multi-perspective Improvement of Knowledge Graph Completion with Large Language Models / D. Xu, Z. Zhang, Z. Lin, X. Wu, Z. Zhu,T. Xu, X. Zhao, Y. Zheng, E. Chen. 2024. https://arxiv.org/pdf/2403.01972
  10. Azerbayev Z., at all. LLEMMA: an open language model for mathematics / 2th International Conference on Learning Representations / Z. Azerbayev Z., Schoelkopf H., Paster K., Dos Santos M., McAleer S., Jiang A.Q., Deng J., Biderman S., Welleck S., ICLR 2024 Hybrid, Vienna. Austria.
  11. Hendrycks D., at all. Measuring mathematical problem solving with the MATH dataset / Hendrycks D., Burns C., Kadavath S., Arora A., Basart S., Tang E., Song D., Steinhardt J. NeurIPS, 2021. https://doi.org/10.48550/arXiv.2103.03874
  12. Shao Z., at all. // DeepSeekMath: pushing the limits of mathematical reasoning in open language models / Shao Z., Wang P., Zhu Q., Xu R., Song J., Bi X., Zhang H., Zhang M., Li Y.K. Wu Y., Guo D. https://doi.org/10.48550/arXiv.2402.03300
  13. Виноградов И.М. Математическая энциклопедия. В 5 т. М.: Советская энциклопедия. 1977–1985.
  14. Моисеев Е.И., Муромский А.А., Тучкова Н.П. Тезаурус информационно-поисковый по предметной области «обыкновенные дифференциальные уравнения». М.: МАКС Пресс. 2005. 116 с.
  15. Pan S., at all. Unifying Large Language Models and Knowledge Graphs: A Roadmap // in IEEE Transactions on Knowledge and Data Engineering/ Pan S., Luo L., Wang Y., Chen C., Wang J., Wu X., V.. 36. №. 7. P. 3580–3599, July 2024, https://doi.org/10.1109/ TKDE.2024.3352100.
  16. Luo L., at all. Graph-constrained reasoning: Faithful reasoning on knowledge graphs with large language models / Luo L., Zhao Z., Gong C., Haffari G., Pan S. arXiv preprint arXiv:2410.13080. 2024. https://doi.org/10.48550/arXiv.2410.13080
  17. De Santis A., at all. Integrating Large Language Models and Knowledge Graphs for Extraction and Validation of Textual Test Data / De Santis A., Balduini M., De Santis F., Proia A., Leo A., Brambilla M., Della Valle E. arXiv:2408.01700v1. 2024 https://doi.org/10.1007/978-3-031-77847-6_17
  18. Liu Z., at all. OntoTune: ontology-driven self-training for aligning large language models / Liu Z., Gan C., Wang J., Zhang Y., Bo Z., Sun M., Chen H., Zhang W.https://doi.org/10.48550/arXiv.2502.05478
  19. Ataeva, O., Serebryakov, V., and Tuchkova N. Ontological approach to a knowledge graph construction in a semantic library // Lobachevskii J. of Mathematics. 2023. 44 (6). P. 2229–2239. https://doi.org/10.1134/S1995080223060471
  20. Derong Xu, Ziheng Zhang, Zhenxi Lin, Xian Wu, Zhihong Zhu, Tong Xu, Xiangyu Zhao, Yefeng Zheng, Enhong Chen. Multi-perspective Improvement of Knowledge Graph Completion with Large Language Models. https://doi.org/10.48550/ arXiv.2403.01972
  21. Christian Steinfeldt, Helena Mihaljević. Evaluation and Domain Adaptation of Similarity Models for Short Mathematical Texts Intelligent Computer Mathematics / 17th International Conference, CICM 2024, Montréal, QC, Canada, August 5–9 2024. P. 241–260. https://doi.org/10.1007/978-3-031-66997-2_14
  22. Будзко В.И., Меденников В.И. Системный анализ образовательных цифровых экосистем в АПК // Системы высокой доступности. 2023. Т. 19. № 1. С. 46–58. https://doi.org/10.18127/j20729472-202301-04
  23. Encyclopedia of Mathematics.  https://www.encyclopediaofmath.org/index.php/Main_Page
  24. Математическая энциклопедия. Энциклопедия / Гл. ред. Л.Д. Фаддеев. М.: Большая русская энциклопедия. 1998. 692 с.
  25. Брычков Ю.А. Специальные функции. Производные, интегралы, ряды и другие формулы. Справочник. М.: Бином. 509 с.
  26. Ataeva O., Serebryakov V., and Tuchkova N. From Texts to Knowledge Graph in the Semantic Library LibMeta // Lobachevskij Journal of Mathematics. 2024. V. 45. P. 2211–2219. https://doi.org/10.1134/S1995080224602625
  27. Ataeva, O.M., Sererbryakov, V.A., Tuchkova N.P. Mathematical Physics Branches: Identifying Mixed Type Equations // Lobachevskij Journal of Mathematics. 2019. V. 40. № 7. P. 876–886.  https://doi.org/10.1134/S1995080219070047
  28. Ataeva, O., Serebryakov, V., and Tuchkova N. Ontology-driven knowledge graph construction in the mathematics semantic library // Pattern Recognition and Image Analysis. 2024. V. 34. № 3. P. 451–458. https://doi.org/10.1134/S1054661824700196
Дата поступления: 14.04.2025
Одобрена после рецензирования: 30.04.2025
Принята к публикации: 30.05.2025