И.Д. Стребков1
1 Федеральный исследовательский центр "Информатика и управление" РАН (Москва, Россия)
1 istrebkov@frccsc.ru
Постановка проблемы. Графы знаний семантических связанных данных часто характеризуются неполнотой связей и наличием изолированных узлов, что снижает эффективность поиска и затрудняет их использование для обучения языковых моделей. Анализ полноты и корректности графа знаний является актуальной проблемой оценки качества знаний семантических библиотек.
Цель. Использовать методы метрического анализа графа знаний математических областей библиотеки SciLibAIRU для оценки его структуры, выявления ключевых и изолированных узлов и построения эмбеддингов, улучшающих навигацию и поиск.
Результаты. Получены метрики графа, выявлены изолированные концепты и построены эмбеддинги, которые позволят визуализировать его структуру. Установлены пороги для выделения значимых узлов и предложен метод фильтрации графа.
Практическая значимость. Подход позволяет совершенствовать граф знаний, восполняя связи и оптимизируя навигацию, что повышает точность поиска и качество датасетов для обучения предметно-ориентированных языковых моделей.
Стребков И.Д. Метрические инструменты анализа графа знаний предметных областей в семантической библиотеке // Системы высокой доступности. 2026. Т. 22. № 1. С. 95−98. DOI: https://doi.org/10.18127/j20729472-202601-19
- West R., Gabrilovich E., Murphy K. et al. Knowledge base completion via search-based question answering. 2014. WWW. 515–526.
- Barbosa D., Wang H., Yu C. Shallow information extraction for the knowledge web. 2013 IEEE 29th International Conference on Data Engineering (ICDE). IEEE, 2013. P. 1264-1267. https://doi.org/110.1109/ICDE.2013.6544920
- Атаева О.М., Тучкова Н.П., Теймуразов К.Б., Абдышов А., Кобук М.Г. Библиотека научных предметных областей SciLibRu // Электронные библиотеки. 2025. Т. 28. Вып. 6. С. 1324–45, https://doi.org/10.26907/1562-5419-2025-28-6-1324-1345
- Ataeva O., Serebryakov V., Tuchkova N. Ontological approach to a knowledge graph construction in a semantic library. Lobachevskii J. of Mathematics. 2023. 44. P. 2229–2239. https://doi.org/10.1134/S1995080223060471
- Park N., Kan A., Dong X. L., Zhao T. Christos Faloutso 2019. Estimating Node Importance in Knowledge Graphs Using Graph Neural Networks. In The 25th ACM SIGKDD Conference on Knowledge Discovery and Data Mining (KDD ’19), August 4–8, 2019, Anchorage, AK, USA. ACM, New York, NY, USA, 11 p. https://doi.org/10.1145/3292500.3330855
- Герасименко Н.А., Ватолин А.С., Янина А.О., Воронцов К.В. SciRus: легкий и мощный мультиязычный энкодер для научных текстов // Докл. РАН. Матем., информ., проц. упр. 2024. 520:2. C. 216–227. Dokl. Math., 110:suppl. 1 (2024), S193–S202. https://doi.org/10.1134/S1064562424602178

