Н.В. Блохин1, С.В. Макрушин2
1−2 Финансовый университет при Правительстве Российской Федерации (Москва, Россия)
1−2 Центр интеллектуальных аналитических и робототехнических систем (г. Балашиха, Россия)
1nvblokhin@fa.ru, 2svmakrushin@fa.ru
Постановка проблемы. При решении различных прикладных экономических задач описание отраслевой принадлежности является одним из ключевых параметров моделей, и его точное и емкое описание может существенно повлиять на качество решения задачи. На данный момент в России основным инструментом описания отраслевой принадлежности является общероссийский классификатор видов экономической деятельности (ОКВЭД). ОКВЭД является иерархическим классификатором, использующим для определения вида экономической деятельности прежде всего процесс производства. В то же время анализ взаимосвязей между компаниями может дать более полное представление о функционировании конкретной отрасли или позиционировании отраслей относительно друг друга. Современные методы анализа сетей позволяют создать инструментарий, дающий более емкое определение близости отраслей. В частности, для этого можно использовать методы векторного представления (эмбеддинга) узлов сети в пространстве большой размерности.
Цель. Разработать модель для построения векторных представлений графа классификатора видов экономической деятельности, в которых объединена информация о графе иерархической структуры ОКВЭД и информация о сети взаимосвязей большого числа реальных компаний – представителей данных отраслей.
Результаты. Предложен авторский подход к построению графа кодов экономической деятельности с учетом информации о связях между компаниями. Для узлов данного графа построены векторные представления (эмбеддинги) с применением современных технологий графовых сверточных нейронных сетей. Продемонстрирован подход к использованию полученных эмбеддингов для решения прикладной экономической задачи.
Практическая значимость. Полученные в работе эмбеддинги могут быть использованы в моделях машинного обучения в качестве признаков, которые характеризуют отраслевую принадлежность компаний, для получения более высокого качества решения прикладных экономических задач.
Блохин Н.В., Макрушин С.В. Построение векторного представления отраслей экономики с помощью графовых нейронных сетей // Информационно-измерительные и управляющие системы. 2023. Т. 21. № 5. С. 7−15. DOI: https://doi.org/10.18127/j20700814-202305-02
- Приказ Росстата от 31.12.2014 N 742 (ред. от 04.02.2016) «О Методических указаниях по определению основного вида экономической деятельности хозяйствующих субъектов на основе Общероссийского классификатора видов экономической деятельности (ОКВЭД2) для формирования сводной официальной статистической информации».
- Федеральный закон от 08.12.2003 N 165-ФЗ (ред. от 08.12.2020) «О специальных защитных, антидемпинговых и компенсационных мерах при импорте товаров».
- Урядникова Марина Валерьевна Особенности влияния отраслевых рынков на ценообразование // Вестник ЧГУ. 2010. № 1. URL: https://cyberleninka.ru/article/n/osobennosti-vliyaniya-otraslevyh-rynkov-na-tsenoobrazovanie (дата обращения: 12.06.2023).
- «ОК 029-2014 (КДЕС Ред. 2). Общероссийский классификатор видов экономической деятельности» (утв. Приказом Росстандарта от 31.01.2014 N 14-ст) (ред. от 12.08.2021).
- Kamath C., Bukhari S., Dengel A. Comparative Study between Traditional Machine Learning and Deep Learning Approaches for Text Classification // Proceedings of the ACM Symposium on Document Engineering. 2018.
- Slavov S., Tagarev A., Tulechki N., Boytcheva S. Company Industry Classification with Neural and Attention-Based Learning Models // Big Data. Knowledge and Control Systems Engineering (BdKCSE). 2019. 1−7.
- Wood S., Muthyala R., Jin Y., Qin Y., Rukadikar N., Gao H., Rai A. Automated Industry Classification with Deep Learning // IEEE 12th International Conference on Semantic Computing (ICSC). 2018. 64−70.
- Husmann S., Shivarova A., Steinert R. Company classification using machine learning // Expert Systems with Applications. 2022. V. 195.
- Bernstein A., Clearwater S., Provost F. The Relational Vector-Space Model // Proceedings of IJCAI Workshop on Statistical Models from Relational Data. 2003. P. 8−18.
- Kakushadze Z., Yu W. Statistical Industry Classification // SSRN Electronic Journal. 2016. 10.2139/ssrn.2802753.
- Dolphin R., Smyth B., Dong R. A Machine Learning Approach to Industry Classification in Financial Markets // Artificial Intelligence and Cognitive Science. AICS 2022. Communications in Computer and Information Science. V. 1662. Springer. Cham.
- Cai H., Zheng V.W., Chang K.C. A Comprehensive Survey of Graph Embedding: Problems, Techniques and Applications // IEEE Transactions on Knowledge and Data Engineering. 2017. 30: 1616-1637.
- Zhou J., Cui G. Graph neural networks: A review of methods and applications. arXiv preprint arXiv:1812.08434. 2018.
- Zhang S., Tong H., Xu J., Maciejewski R. Graph convolutional networks: a comprehensive review // Computational Social Networks. 2019. 6:1. doi:10.1186/s40649-019-0069-y.
- Mikolov T., Chen K., Corrado G., Dean J. Efficient estimation of word representations in vector space // Proceedings of the International Conference on Learning Representations. 2013.
- Kipf T., Welling M. Semi-supervised classification with graph convolutional networks // International Conference on Learning Representations (ICLR). 2017.
- Hamilton W., Ying Z., Leskovec J. Inductive representation learning on large graphs // Proc. of NIPS. 2017. 1024–1034.
- Yang B., Yih W., He X., Gao J., Deng L. Embedding Entities and Relations for Learning and Inference in Knowledge Bases // CoRR, abs/1412.6575. 2014.
- Приказ Минфина России от 20.07.2010 № 66н «О формах бухгалтерской отчетности организаций».
- Maaten L.V., Hinton G.E. Visualizing Data using t-SNE // Journal of Machine Learning Research. 2008. 9: 2579-2605.