Гибридные критерии оценки тематической схожести научных агентов

500 руб

Журнал «Системы высокой доступности» №1 за 2026 г.

Статья в номере:

Тип статьи: научная статья

DOI: https://doi.org/10.18127/j20729472-202601-16

УДК: 519.854.2

Ключевые слова: Тематическая схожесть научные агенты терминологический профиль гибридный критерий индекс Жаккара корреляция Спирмена корреляция Пирсона кластеризация анализ соавторства оценка точности

Авторы:

К.А. Калугин1

1 Институт проблем управленияим. В.А. Трапезникова РАН (Москва, Россия)

1 netter2@rambler.ru

Аннотация:

Постановка проблемы. В условиях экспоненциального роста объёма научных публикаций и усложнения междисциплинарных коллабораций актуализируется задача точной и автоматизированной оценки тематической близости исследователей (научных агентов). Существующие подходы (наукометрические, сетевые, тематические) часто не учитывают динамические терминологические предпочтения учёных, что может приводить к неточностям при формировании исследовательских команд, распределении экспертизы и выявлении дублирующихся работ. Исследуется проблема выработки критерия для оценки тематической схожести научных агентов.

Цель. Разработать и экспериментально апробировать новый гибридный критерий для оценки тематической схожести научных агентов на основе анализа их терминологических профилей, а также проверить альтернативные методы валидации (суперкритерии).

Результаты. Предложен гибридный критерий SPM, интегрирующий ранговую (Спирмена) и линейную (Пирсона) корреляции с механизмом отсечения на основе скалярного произведения векторов частотности терминов. Проведено экспериментальное сравнение с базовыми метриками (Жаккара, Спирмена, Пирсона) на выборке сотрудников ИПУ РАН с привлечением экспертной оценки, показавшее его более высокую точность. Разработаны и апробированы суперкритерии на основе гипотез о соавторстве и кластерной принадлежности, подтвердившие свою эффективность для косвенной оценки качества критериев схожести.

Практическая значимость. Разработанная методика позволяет оптимизировать процессы формирования научных коллективов, а также сократить временные затраты на поиск релевантных экспертов, в том числе из внешних организаций, что способствует минимизации дублирования исследований в смежных областях.

Страницы: 81-84

Для цитирования

Калугин К.А. Гибридные критерии оценки тематической схожести научных агентов // Системы высокой доступности. 2026. Т. 22. № 1. С. 81−84. DOI: https://doi.org/10.18127/j20729472-202601-16

Список источников

Ahlgren P., Jarneving B., Rousseau R. Requirements for a cocitation similarity measure, with special reference to Pearson's correlation coefficient. Journal of the American Society for Information Science and Technology. 2003. V. 54. № 6. P. 550–560.
Šubelj L., Van Eck N.J., Waltman L. Clustering scientific publications based on citation relations: A systematic comparison of different methods. PloS One. 2016. V. 11. № 4. e0154404.
Probierz B., Kozak J., Hrabia A. Clustering of scientific articles using natural language processing. Procedia Computer Science. 2022. V. 207. P. 3449–3458.
Van Eck N. J., Waltman L. Generalizing the h- and g-indices. Journal of Informetrics. 2008. V. 2. № 4. P. 263–271.
Наукометрия и экспертиза в управлении наукой: сборник статей / под ред. Д. Новикова, А. Орлова, П. Чеботарева. М.: ИПУ РАН. 2013. 572 с.
Губанов Д.А., Кузнецов О.П., Курако Е.А., Лемтюжникова Д.В., Новиков Д.А., Чхартишвили А.Г. Информационная система анализа научной деятельности (ИСАНД) в области теории управления // Проблемы управления. 2024. № 3. С. 42–65.

Дата поступления: 24.02.2026

Одобрена после рецензирования: 26.02.2026

Принята к публикации: 10.03.2026