В.Е. Дементьев1, Н.А. Андриянов2
1 Ульяновский государственный технический университет (г. Ульяновск, Россия)
2 Финансовый университет при Правительстве Российской Федерации (Москва, Россия)
Постановка проблемы. Cегодня цифровые системы сбора и анализа информации применяются в различных областях промышленности и экономики. В частности, в транспортной отрасли внедрение интеллектуальных технологий началось относительно недавно, поэтому на сегодняшний день универсальное решение по сбору информации о работе службы заказа такси отсутствует. Здесь возникает задача измерения таких показателей, как дальность дистанции, стоимость поездки, время принятия заказа и др. Кроме того, необходимо определить значимые показатели и выбрать эффективные методы их обработки. Таким образом, задача прогнозирования стоимости заказа такси, которая может быть решена с помощью методов машинного обучения, является актуальной.
Цель. Разработать интеллектуальную систему прогнозирования стоимости заказа службы такси на основе данных, предоставляемых внедренной информационно-измерительной системой.
Результаты. Рассмотрена задача прогнозирования эффективной стоимости заказа службы такси по большому числу параметров на основе датасета, предоставленного одной из компаний службы заказа такси г. Ульяновска. Особое внимание уделено используемым параметрам оценки и сбора необходимой информации. Предложены способ предобработки данных с использованием дважды стохастической модели случайного поля и комбинированный метод прогнозирования на базе k-бли-жайших соседей, градиентного бустинга и случайного леса. Показано, что предложенный способ предобработки данных позволяет уменьшить среднеквадратическую ошибку на 7% по сравнению с известными алгоритмами машинного обучения. Приведено подробное описание данных с использованием методов сокращения размерности. Проведена оценка качества прогнозов с использованием данных с экспертной разметкой необходимой стоимости.
Практическая значимость. Разработанный алгоритм может быть использован для формирования стоимости службы заказа такси. За счет применения обученных моделей региональная служба заказа такси может повысить эффективность политики ценообразования, однако для получения надежной модели требуется обучающая выборка большего объема.
Дементьев В.Е., Андриянов Н.А. Система прогнозирования эффективной стоимости заказа службы такси с использованием алгоритмов машинного обучения // Информационно-измерительные и управляющие системы. 2022. Т. 20. № 5. С. 67−73.
DOI: https://doi.org/10.18127/j20700814-202205-10
- Андриянов Н.А., Орлов Е.А. Разработка модели машинного обучения для оценки состояния глаз водителя // Инженерный вестник Дона. 2022. V. 5. № 89. C. 142-159.
- Селезнев Н.К., Ирхин И.А., Кантор В.В. Автоматическое извлечение атрибутов водителя из логов мобильного приложения такси // Труды Московского физико-технического института. 2018. V. 3. № 39. С. 5-15.
- Мосева М.С. О методах сбора и анализа основных характеристик транспортного потока // T-Comm - Телекоммуникации и Транспорт. 2022. V. 16. № 2. С. 29-38.
- Soloviev V., Feklin V. Non-life Insurance Reserve Prediction Using LightGBM Classification and Regression Models Ensemble // Studies in Systems, Decision and Control. 2022. V. 417. Р. 181–188.
- Schuh G., Reinhart G., Prote J., Sauermann F., Horsthofer J., Oppolzer F., Knoll D. Data Mining Definitions and Applications for the Management of Production Complexity // Procedia CIRP. 2019. V. 81. P. 874-879.
- Oluwaseun A., Chaubey M. Data mining classification techniques on the analysis of student performance // Data Analysis. 2019.
V. 3. P. 19-32. DOI: 10.11216/gsj.2019.04.19671. - Umang P. NYC Taxi Trip and Fare Data Analytics using BigData // Data Analysis. 2015. V. 2. P. 86-90.
- Guo J. Analysis and comparison of Uber, Taxi and Uber request via Transit // JISC. 2018. V. 29. P. 1-4.
- Deri J., Moura J. Taxi data in New York city: A network perspective // ACSSC. 2015. P. 1829-1833. DOI: 10.1109/ACSSC.2015.7421468.
- Andriyanov N.A., Sonin V.A. Using mathematical modeling of time series for forecasting taxi service orders amount // CEUR Workshop Proceedings. 2018. V. 2258. P. 462-472.
- Андриянов Н.А., Дементьев В.Е., Ташлинский А.Г., Буранкина П.В. Использование глубоких гауссовых моделей в системах массового обслуживания для поддержки принятия решений // Автоматизация процессов управления. 2022. №1(67).
С. 43-51. DOI: 10.35752/1991-2927-2022-1-67-43-51. - Andriyanov N., Dementiev V., Tashlinskiy A. Development and Research of Intellectual Algorithms in Taxi Service Data Processing Based on Machine Learning and Modified K-means Method. Czarnowski, I., Howlett, R.J., Jain, L.C. (eds) // Intelligent Decision Technologies. Smart Innovation, Systems and Technologies. Springer, Singapore. 2022. V. 309. P. 183-192. DOI: 10.1007/978-981-19-3444-5_16.
- Danilov A.N., Andriyanov N.A., Azanov P.T.: Ensuring the effectiveness of the taxi order service by mathematical modeling and machine learning // Journal of Physics: Conference Series. 2018. V. 1096. P. 1-6. DOI: 10.1088/1742-6596/1096/1/012188.
- Андриянов Н.А. Дважды стохастические модели изображений: Автореф. дисс. … канд. техн. наук. Ульяновск. 2017. 24 с.
- Строганов В.Ю., Зеленцова Е.В. Представление и моделирование адаптивных алгоритмов управления транспортными системами в виде конечных иерархических автоматов // Динамика сложных систем. 2021. T. 15. № 4. С. 29−35. DOI: 10.18127/j19997493- 202104-04.