К.А. Калугин1
1 Институт проблем управленияим. В.А. Трапезникова РАН (Москва, Россия)
1 netter2@rambler.ru
Постановка проблемы. В условиях экспоненциального роста объёма научных публикаций и усложнения междисциплинарных коллабораций актуализируется задача точной и автоматизированной оценки тематической близости исследователей (научных агентов). Существующие подходы (наукометрические, сетевые, тематические) часто не учитывают динамические терминологические предпочтения учёных, что может приводить к неточностям при формировании исследовательских команд, распределении экспертизы и выявлении дублирующихся работ. Исследуется проблема выработки критерия для оценки тематической схожести научных агентов.
Цель. Разработать и экспериментально апробировать новый гибридный критерий для оценки тематической схожести научных агентов на основе анализа их терминологических профилей, а также проверить альтернативные методы валидации (суперкритерии).
Результаты. Предложен гибридный критерий SPM, интегрирующий ранговую (Спирмена) и линейную (Пирсона) корреляции с механизмом отсечения на основе скалярного произведения векторов частотности терминов. Проведено экспериментальное сравнение с базовыми метриками (Жаккара, Спирмена, Пирсона) на выборке сотрудников ИПУ РАН с привлечением экспертной оценки, показавшее его более высокую точность. Разработаны и апробированы суперкритерии на основе гипотез о соавторстве и кластерной принадлежности, подтвердившие свою эффективность для косвенной оценки качества критериев схожести.
Практическая значимость. Разработанная методика позволяет оптимизировать процессы формирования научных коллективов, а также сократить временные затраты на поиск релевантных экспертов, в том числе из внешних организаций, что способствует минимизации дублирования исследований в смежных областях.
Калугин К.А. Гибридные критерии оценки тематической схожести научных агентов // Системы высокой доступности. 2026. Т. 22. № 1. С. 81−84. DOI: https://doi.org/10.18127/j20729472-202601-16
- Ahlgren P., Jarneving B., Rousseau R. Requirements for a cocitation similarity measure, with special reference to Pearson's correlation coefficient. Journal of the American Society for Information Science and Technology. 2003. V. 54. № 6. P. 550–560.
- Šubelj L., Van Eck N.J., Waltman L. Clustering scientific publications based on citation relations: A systematic comparison of different methods. PloS One. 2016. V. 11. № 4. e0154404.
- Probierz B., Kozak J., Hrabia A. Clustering of scientific articles using natural language processing. Procedia Computer Science. 2022. V. 207. P. 3449–3458.
- Van Eck N. J., Waltman L. Generalizing the h- and g-indices. Journal of Informetrics. 2008. V. 2. № 4. P. 263–271.
- Наукометрия и экспертиза в управлении наукой: сборник статей / под ред. Д. Новикова, А. Орлова, П. Чеботарева. М.: ИПУ РАН. 2013. 572 с.
- Губанов Д.А., Кузнецов О.П., Курако Е.А., Лемтюжникова Д.В., Новиков Д.А., Чхартишвили А.Г. Информационная система анализа научной деятельности (ИСАНД) в области теории управления // Проблемы управления. 2024. № 3. С. 42–65.

