350 руб
Журнал «Нейрокомпьютеры: разработка, применение» №2 за 2025 г.
Статья в номере:
Построение эмбеддингов компаний на основе векторного представления отраслей экономики и связей между компаниями
Тип статьи: научная статья
DOI: https://doi.org/10.18127/j19998554-202502-01
УДК: 519.171.2 + 004.852
Авторы:

Н.В. Блохин1, С.В. Макрушин2

1, 2 Финансовый университет при Правительстве РФ (Москва, Россия)

1, 2 Центр интеллектуальных аналитических и робототехнических систем (г. Балашиха, Россия)

1 nvblokhin@fa.ru, 2 svmakrushin@fa.ru

Аннотация:

Постановка проблемы. Отраслевая классификация юридических лиц обычно строится на основе общероссийского классификатора видов экономической деятельности (ОКВЭД). ОКВЭД позволяет систематизировать и группировать компании в соответствии с их основной сферой деятельности. Однако данный классификатор плохо подходит для целей оценки экономической взаимосвязи компаний, поскольку он отражает технологическое сходство сфер деятельности и не учитывает связь между отраслями по цепочке переделов продукции, которая существенно более значима для экономической деятельности компаний. Отраслевая принадлежность компании определяется не только заявленным ею кодом ОКВЭД, но и ее фактическими экономическими и юридическими взаимосвязями с другими компаниями. Используя современные методы машинного обучения, можно построить векторные представления компаний (эмбеддинги), учитывающие взаимосвязи между компаниями.

Цель. Построить уточненное векторное представление отраслевой принадлежности компаний, учитывающее их отраслевую классификацию и фактическую экономическую активность.

Результаты. Предложена авторская методология совместного векторного представления отраслей и компаний, учитывающая их фактические экономические и юридические взаимосвязи. Для узлов графов групп связанных компаний построены векторные представления, содержащие информацию о связях между компаниями. Проведен анализ интерпретируемости полученных эмбеддингов.

Практическая значимость. Полученные в работе эмбеддинги компаний могут быть использованы для определения близости между компаниями, проведения кластеризации компаний, а также могут выступать как ценные признаки для моделей машинного обучения, решающих конкретные прикладные задачи.

Страницы: 5-12
Для цитирования

Блохин Н.В., Макрушин С.В. Построение эмбеддингов компаний на основе векторного представления отраслей экономики и связей между компаниями // Нейрокомпьютеры: разработка, применение. 2025. Т. 27. № 2. С. 5–12. DOI: https://doi.org/10.18127/ j19998554-202502-01

Список источников
  1. Mikolov T., Chen K., Corrado G., Dean J. Efficient estimation of word representations in vector space // Proceedings of the International Conference on Learning Representations. 2013.         
  2. Song C., Raghunathan A. Information leakage in embedding models // Proceedings of the 2020 ACM SIGSAC Conference on Computer and Communications Security. 2020.
  3. Grbovic M., Haibin C. Real-time personalization using embeddings for search ranking at Airbnb // Proceedings of the 24th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining. 2018.
  4. Beam A., Kompa B., Schmaltz A., et al. Clinical concept embeddings learned from massive sources of multimodal medical data // Pacific Symposium on Biocomputing. 2018.
  5. Madjiheurem S., Qu L., Walder C. Chord2Vec: Learning musical chord embeddings // 30th Conference on Neural Information Processing Systems. 2016.
  6. Блохин Н.В., Макрушин С.В. Построение векторного представления отраслей экономики с помощью графовых нейронных сетей // Информационно-измерительные и управляющие системы. 2023. № 5. С. 7–15.
  7. Приказ Росстата от 31.12.2014 № 742 (ред. от 04.02.2016) «О методических указаниях по определению основного вида экономической деятельности хозяйствующих субъектов на основе Общероссийского классификатора видов экономической деятельности (ОКВЭД2) для формирования сводной официальной статистической информации».
  8. Zhou J., Cui G. Graph neural networks: A review of methods and applications // arXiv preprint arXiv:1812.08434. 2018.
  9. Zhang S., Tong H., Xu J., Maciejewski R. Graph convolutional networks: a comprehensive review // Computational Social Networks. 2019. V. 6. № 11.
  10. Wang X., Bo D., Shi C., et al. A survey on heterogeneous graph embedding: Methods, techniques, applications and sources. 2020.
  11. Классификация [Электронный ресурс] / URL: http://www.machinelearning.ru/wiki/index.php?title=Классификация (дата обращения: 07.12.2023).
  12. Potdar K., Pardawala T.S., Pai C.D. A comparative study of categorical variable encoding techniques for neural network classifiers // International Journal of Computer Applications. 2017. V. 175. № 4. P. 7–9.
  13. Hamilton W.L., Zhitao Y., Leskovec J. Inductive representation learning on large graphs // Neural Information Processing Systems. 2017.
  14. Kingma D., Ba J. Adam: A method for stochastic optimization // International Conference on Learning Representations. 2014.
Дата поступления: 16.12.2024
Одобрена после рецензирования: 20.01.2025
Принята к публикации: 14.03.2025