Н.В. Блохин1, С.В. Макрушин2
1, 2 Финансовый университет при Правительстве РФ (Москва, Россия)
1, 2 Центр интеллектуальных аналитических и робототехнических систем (г. Балашиха, Россия)
1 nvblokhin@fa.ru, 2 svmakrushin@fa.ru
Постановка проблемы. Отраслевая классификация юридических лиц обычно строится на основе общероссийского классификатора видов экономической деятельности (ОКВЭД). ОКВЭД позволяет систематизировать и группировать компании в соответствии с их основной сферой деятельности. Однако данный классификатор плохо подходит для целей оценки экономической взаимосвязи компаний, поскольку он отражает технологическое сходство сфер деятельности и не учитывает связь между отраслями по цепочке переделов продукции, которая существенно более значима для экономической деятельности компаний. Отраслевая принадлежность компании определяется не только заявленным ею кодом ОКВЭД, но и ее фактическими экономическими и юридическими взаимосвязями с другими компаниями. Используя современные методы машинного обучения, можно построить векторные представления компаний (эмбеддинги), учитывающие взаимосвязи между компаниями.
Цель. Построить уточненное векторное представление отраслевой принадлежности компаний, учитывающее их отраслевую классификацию и фактическую экономическую активность.
Результаты. Предложена авторская методология совместного векторного представления отраслей и компаний, учитывающая их фактические экономические и юридические взаимосвязи. Для узлов графов групп связанных компаний построены векторные представления, содержащие информацию о связях между компаниями. Проведен анализ интерпретируемости полученных эмбеддингов.
Практическая значимость. Полученные в работе эмбеддинги компаний могут быть использованы для определения близости между компаниями, проведения кластеризации компаний, а также могут выступать как ценные признаки для моделей машинного обучения, решающих конкретные прикладные задачи.
Блохин Н.В., Макрушин С.В. Построение эмбеддингов компаний на основе векторного представления отраслей экономики и связей между компаниями // Нейрокомпьютеры: разработка, применение. 2025. Т. 27. № 2. С. 5–12. DOI: https://doi.org/10.18127/ j19998554-202502-01
- Mikolov T., Chen K., Corrado G., Dean J. Efficient estimation of word representations in vector space // Proceedings of the International Conference on Learning Representations. 2013.
- Song C., Raghunathan A. Information leakage in embedding models // Proceedings of the 2020 ACM SIGSAC Conference on Computer and Communications Security. 2020.
- Grbovic M., Haibin C. Real-time personalization using embeddings for search ranking at Airbnb // Proceedings of the 24th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining. 2018.
- Beam A., Kompa B., Schmaltz A., et al. Clinical concept embeddings learned from massive sources of multimodal medical data // Pacific Symposium on Biocomputing. 2018.
- Madjiheurem S., Qu L., Walder C. Chord2Vec: Learning musical chord embeddings // 30th Conference on Neural Information Processing Systems. 2016.
- Блохин Н.В., Макрушин С.В. Построение векторного представления отраслей экономики с помощью графовых нейронных сетей // Информационно-измерительные и управляющие системы. 2023. № 5. С. 7–15.
- Приказ Росстата от 31.12.2014 № 742 (ред. от 04.02.2016) «О методических указаниях по определению основного вида экономической деятельности хозяйствующих субъектов на основе Общероссийского классификатора видов экономической деятельности (ОКВЭД2) для формирования сводной официальной статистической информации».
- Zhou J., Cui G. Graph neural networks: A review of methods and applications // arXiv preprint arXiv:1812.08434. 2018.
- Zhang S., Tong H., Xu J., Maciejewski R. Graph convolutional networks: a comprehensive review // Computational Social Networks. 2019. V. 6. № 11.
- Wang X., Bo D., Shi C., et al. A survey on heterogeneous graph embedding: Methods, techniques, applications and sources. 2020.
- Классификация [Электронный ресурс] / URL: http://www.machinelearning.ru/wiki/index.php?title=Классификация (дата обращения: 07.12.2023).
- Potdar K., Pardawala T.S., Pai C.D. A comparative study of categorical variable encoding techniques for neural network classifiers // International Journal of Computer Applications. 2017. V. 175. № 4. P. 7–9.
- Hamilton W.L., Zhitao Y., Leskovec J. Inductive representation learning on large graphs // Neural Information Processing Systems. 2017.
- Kingma D., Ba J. Adam: A method for stochastic optimization // International Conference on Learning Representations. 2014.

