350 руб
Журнал «Нелинейный мир» №1 за 2025 г.
Статья в номере:
Построение иерархических векторных представлений кодов ОКВЭД с применением полносвязных адаптеров
Тип статьи: научная статья
DOI: https://doi.org/10.18127/j20700970-202501-07
УДК: 519.171.2 + 004.852
Авторы:

Н.В. Блохин1

1 Финансовый университет при Правительстве РФ (Москва, Россия)
1 nvblokhin@fa.ru

Аннотация:

Постановка проблемы. Отраслевая принадлежность является важным признаком компании, определяющим ее окружение, инвестиционные риски и другие ключевые аспекты деятельности. Коды Общероссийского классификатора видов экономической деятельности (ОКВЭД), используемые для описания отраслевой принадлежности в Российской Федерации, представляют собой сложный атрибут с иерархической структурой и неравномерным распределением. Традиционные методы машинного обучения могут быть недостаточно эффективны для анализа и прогнозирования на основе этой характеристики. Используя современные нейросетевые технологии, можно построить компактные векторные представления кодов ОКВЭД, которые учитывают иерархическую структуру классификатора и взаимосвязи между различными уровнями кодов и могут служить ценными признаками в прикладных задачах экономического анализа.

Цель. Разработать методы построения векторных представлений кодов ОКВЭД с учетом иерархической структуры классификатора для получения информативных эмбеддингов, отражающих индивидуальные свойства кодов и их место в общей структуре.

Результаты. Предложен авторский подход для объединения информации с разных уровней классификатора с использованием полносвязных адаптеров и механизма внимания для сглаживания проблемы построения векторов для слабо представленных кодов. Отмечено, что демонстрация качества полученных эмбеддингов на задаче прогнозирования дефолтов заемщика подтверждает, что созданные векторные представления позволяют улучшить качество решения.

Практическая значимость. Полученные результаты можно использовать для решения прикладных экономических задач. Предложенные модели и подходы к построению векторных представлений кодов ОКВЭД могут быть воспроизведены на публично доступных данных и интегрированы в существующие модели для улучшения качества решения других прикладных задач.

Страницы: 59-71
Для цитирования

Блохин Н.В. Построение иерархических векторных представлений кодов ОКВЭД с применением полносвязных адап­теров // Нелинейный мир. 2025. Т. 23. № 1. С. 59–71. DOI: https://doi.org/10.18127/ j20700970-202501-07

Список источников
  1. Приказ Росстата от 31.12.2014 № 742 (ред. от 04.02.2016) «О Методических указаниях по определению основного вида экономической деятельности хозяйствующих субъектов на основе Общероссийского классификатора видов экономической деятельности (ОКВЭД2) для формирования сводной официальной статистической информации»
  2. Porter M.E. Competitive Strategy: Techniques for Analyzing Industries and Competitors, Free Press. New York. NY. 1980.
  3. Урядникова М. Особенности влияния отраслевых рынков на ценообразование // Вестник ЧГУ. 2010. №1. URL: https://cyberleninka.ru/article/n/osobennosti-vliyaniya-otraslevyh-rynkov-na-tsenoobrazovanie (дата обращения: 25.01.2025).
  4. «ОК 029-2014 (КДЕС Ред. 2). Общероссийский классификатор видов экономической деятельности» (утв. Приказом Росстандарта от 31.01.2014 № 14-ст) (ред. от 14.03.2024).
  5. Hancock J., Khoshgoftaar T. Survey on categorical data for neural networks. Journal of Big Data. 2020. V. 7. P. 28.
  6. Yu M., Chen X., Gu X., Liu H., Du L. A subspace constraint based approach for fast hierarchical graph embedding. World Wide Web. 2023. V. 26. P. 3691–3705.
  7. Yu J., Zhang C., Hu Z., Ji Y. Embedding Hierarchical Tree Structure of Concepts in Knowledge Graph Embedding. Electronics. 2024. V. 13. № 22.
  8. Goodfellow I., Bengio Y., Courville A. Deep Learning. 2016. MIT Press.
  9. Zhang S., Hanghang T., Xu J., Maciejewski R. Graph convolutional networks: a comprehensive review. Computational Social Networks. 2019. V. 6.
  10. Hamilton W. L., Ying R., Leskovec J. Inductive Representation Learning on Large Graphs. Proceedings of the 31st International Conference on Neural In-formation Processing Systems. 2017. P. 1025–1035.
  11. Lin T. Focal Loss for Dense Object Detection. IEEE International Conference on Computer Vision (ICCV). 2017. P. 2999–3007.
  12. Schechtman E., Schechtman G. The relationship between Gini terminology and the ROC curve. METRON. 2019. V. 77.
  13. Deep Graph Library. URL: https://www.dgl.ai/ (дата обращения: 26.01.2025).
  14. Блохин Н.В., Макрушин С.В. Построение векторного представления отраслей экономики с помощью графовых нейронных сетей // Информационно-измерительные и управляющие системы. 2023. Т. 21. № 5. С. 7–15. DOI 10.18127/j20700814-202305-02.
Дата поступления: 26.01.2025
Одобрена после рецензирования: 16.02.2025
Принята к публикации: 26.02.2025