С.Т. Цаплин1, Д.В. Березкин2, Г.П. Можаров3
1-3 Московский государственный технический университетим. Н.Э. Баумана (Москва, Россия)
1 tsaplin@bmstu.ru, 2 berezkind@bmstu.ru, 3 mojarov@bmstu.ru
Постановка проблемы. Прогнозирование социально-экономических показателей осложняется ограниченным объемом исторических данных. В частности, при планировании контрольных цифр прием а в вузы статистическая информация представлена экстремально короткими временными рядами (не более 9 точек наблюдений), что затрудняет применение стандартных прогнозных моделей и ставит под вопрос объективность полученного прогноза.
Цель. Провести сравнительный анализ существующих классических и нейросетевых методов аугментации временных рядов для решения задачи прогнозирования при малом числе точек отсчета.
Результаты. Установлено, что точность прогноза моделей, обученных на синтетических данных, может дос тигать 0,97. Однако для экстремально коротких временных рядов (менее 40 точек отсчета) ни один из описанных методов не решает задачу аугментации эффективно. Классические методы (зашумление, масштабирование, бутстреп и др.) подходят преимущественно для анал итических задач, а нейросетевые подходы (TSA -GAN, T -CGAN, TimeGAN) требуют наличия минимального объема данных (от 19 до 40 точек).
Практическая значимость. Полученные результаты свидетельствуют о необходимости дальнейших исследований в области разработки комбинированных подходов, использующих одновременно простые и сложные методы аугментации. Исследование предоставляет важные сведения для специалистов, принимающих управленческие решения, в условиях ограниченной статистической информации, в частности, при планировании образовательных услуг и бюджетов.
Цаплин С.Т., Березкин Д.В., Можаров Г.П. Сравнительный анализ методов аугментации коротких временных рядов // Динамика сложных систем. 2026. Т. 20. № 2. С. 70−78. DOI: 10.18127/j19997493-202602-08
- Qingsong Wen, Liang Sun, Fan Yang, Xiaomin Song, Jingkun Gao, Xue Wang, Huan Xu. Time Series D ata Augmentation for Deep Learning: A Survey. Thirtieth International Joint Conference on Artificial Intelligence (IJCAI-21). 2020. P. 4653–4660.
- Annaki I., Rahmoune M., Bourhaleb M. Overview of Data Augmentation Techniques in Time Series Analysis. Interna tional Journal of Advanced Computer Science and Applications. 2024. V. 15. P. 10123–10145.
- Ana Lazcano de Rojas. Data augmentation in economictime series: Behavior and improvements in predictions. AIMS Mathematics. 2023. V. 8. P. 24528–24544.
- Shiyu Liu, Hongyan Qiao, Lianhong Yuan, Yuan Yuan, Jun Liu. Research on dataaugmentation algorithm for timeseries based on deeplearning. KSII Transactions on Internet and Information Systems. 2023. V. 17. P. 1530–1544.
- Мониторинг качества приема в ВУЗы. URL: https://ege.hse.ru/rating/2022/91645021/all/
- Flores A., Tito-Chura H., Apaza-Alanoca H. Data Augmentation for Short-Term Time Series Prediction with Deep Learning. In: Arai, K. (eds) Intelligent Computing. Lecture Notes in Networks and Systems. 2021. V. 284.
- Rashid K.M., Louis J. Window-warping: atimeseries dataaugmentation of imu data for construction equipment activity identification. 36th International Symposium on Automation and Robotics in Construction (ISARC). 2019. V. 36. P. 651–657.
- Xue Ying. An Overview of Overfitting and its Solutions. Journal of Physics Conference Series. 2019.
- Le Guennec A., Malinowski S., Tavenard R. Data Augmentation for Time Series Classification using Convolutional N eural Networks. ECML/PKDD Workshop on Advanced Analytics and Learning on Temporal Data. 2016. 1
- Zhicheng Cui, Wenlin Chen. Multi-scale convolutional neural networks for timeseries classification. 2016. URL: https://arxiv.org/abs/1603.06995 1
- Ekin D Cubuk, Barret Zoph, Jonathon Shlens, and Quoc V Le. RandAugment: Practical automated data augmentation with areducedsearch space. In 2020 IEEE/CVF Conference on Computer Vision and Pattern Recognition Workshop. 2020. P. 3008–3017. 1
- Jingkun Gao, Xiaomin Song, Qingsong Wen, Pichao Wang, Liang Sun, and Huan Xu. Robusttad: Robust timeseries anomalydetection via decomposition and convolutional neural networks. 6th KDD MileTS Workshop on Mining and Learning from Time Series. 2020. P. 1–6. 1
- Um T.T., Pfister F.M., Pichler D., Endo S., Lang M., Hirche S., Fietzek U., Kuli´c D. Data augmentation of wearablesensor data for parkinson’sdiseasemonitoring using convolutional neural networks. Proceedings of the 19th ACM International Conference on Multimodal Interaction. 2017. P. 216–220. 1
- Fawaz H.I., Forestier G., Weber J., Idoumghar L., Muller P.-A. Data augmentation using synthetic data for timeseries classification with deepresidual networks. 2018. URL: https://arxiv.org/abs/1808.02455 1
- Iwana B.K., Uchida S. An empirical survey of dataaugmentation for timeseries classification with neural networks. PLoS ONE 16(7). 2021. 1
- Iwana B.K., Uchida S. Time seriesdata augmentation for neural networks by timewarping with adiscriminative teacher. ICPR. 2021. P. 3558–3565. 1
- Rashid K.M., Louis J. Time-warping: A timeseries dataaugmentation of IMU data for construction equipment activity identification. 36th International Symposium on Automation and Robotics in Construction. 2019. 1
- Athanasopoulos G., Song H., Sun J.A. Bagging in tourismdemand modeling and forecasting. Journal of Travel Research 57(1). 2017. P. 52–68. 1
- Bergmeir C., Hyndman R.J., Ben´ıtez J.M. Bagging exponential smoothing methods using STL decomposition and Box –Cox transformation. International Journal of Forecasting 32(2). 2016. P. 303–312. 2
- Dongsheng Luo, Wei Cheng, Yingheng Wang, Dongkuan Xu, Jingchao Ni, Wenchao Yu, Xuchao Zhang, Yanchi Liu, Yuncong Chen, Haifeng Chen, Xiang Zhang. Time Series Contrastive Learning with Information-Aware Augmentations. 202 3. URL: https://arxiv.org/abs/2303.11911 2
- Shivam Grover, Amin Jalali, Ali Etemad. Segment, Shuffle, and Stitch. A Simple Mechanism for Improving Time-Series Representations. 2024. URL: https://arxiv.org/html/2405.20082v1 2
- Uchitomi Hirotaka & Ming Xianwen & Z hao Changyu & Ogata Taiki & Miyake Yoshihiro. Classification of mild Parkinson’sdisease: dataaugmentation of time-seriesgait dataobtained via inertialmeasurement units. Scientific Reports. 13. 2023. 2
- Iftikhar N., Liu X., Danalachi S., Nordbjerg F.E., V ollesen J.H. A scalablesmart meterdata generator using spark, in: On the Move to Meaningful Internet Systems. OTM Conferences, Springer International Publishing. 2017. P. 21– 3
- Сравнительный анализ методов аугментации коротких временных рядов Динамика сложных систем, т. 20, № 2, 2026 г., c. 70−78 76 2
- Cao P., Li X., Mao K., Lu F., Ning G., Fang L., Pan Q. A noveldata augmentation method to enhancedeep neural networks for detection of atrialfibrillation. Biomedical Signal Processing and Control 56. 2020. 2
- Маер А.В., Симахин В.А. Непараметрические датчики для случайных стационарных процессов // Сибирский аэрокосмический журнал. 2010. С. 46–49. 2
- Kim M. & Jeong C.Y. Label-preserving data augmentation for mobilesensor data. Multidimens. Systems and Signal Processing. 32. 2021. P. 115–129. 2
- Терентьева Е.С. Применение бутстреп -метода в непараметрическом моделировании систем при наличии пропусков данных // Решетневские чтения. 2010. С. 430–432. 2
- Shuang Wu, Chi-Hua Wang, Yuantong Li, Guang Cheng. Residual Bootstrap Exploration for Stochastic Linear Bandit. 2020. URL: https://arxiv.org/pdf/2202.11474 2
- Тычков А.Ю. Применение модифицированного преобразования Гильберта–Хуанга для решения задач цифровой обработки медицинских сигналов // Известия высших учебных заведений. Поволжский регион. 2018. С. 70–80. 3
- Кан Ш.Ч., Микулович А.В., Микулович В.И. Анализ нестационарных сигналов на основе преобразования Гильберта–Хуанга // Информатика. 2010. № 2. С. 25–35. 3
- Pan Q., Li X., Fang L. Data augmentation for deeplearning-based ecg analysis. Feature Engineering and Computational Intelligence in ECG Monitoring. 2020. P. 91–111. 3
- Rosario Ryan. A Data Augmentat ion Approach to Short Text Classification. 2017. URL: https://www.researchgate.net/publication/ 316714414_A_Data_Augmentation_Approach_to_Short_Text_Classification 3
- Norden E Huang, Zheng Shen, Steven R Long, Manli C Wu, Hsing H Shih, Quanan Zheng, Nai-Chyuan Yen, Chi Chao Tung, and Henry H Liu. The empirical mode decomposition and the hilbertspectrum for nonlinear and non-stationary time series analysis. Proceedings of the Royal Society of London. Series A: mathematical, physical and engineering sciences. 1998. P. 903–995. 3
- Safiullin N.T., Porshnev S.V., Kleeorin N. Data analysis of sunspottime series with SSA and HHT information adaptive method. 2017. URL: https://ceur-ws.org/Vol-2005/paper-13.pdf 3
- Norden Huang. Applications of Hilbert-Huang transform to non-stationary financial timeseries analysis. Applied Stochastic Models in Business and Industry. 2003. 19. P. 245–268. 3
- Kurbatsky V.G., Sidorov D.N., Spiryaev V.A., Tomin N. Forecasting Nonstationary Time Series Based on Hilbert-Huang Transform and Machine Learning. Automation and Remote Control 75(5). 2014. P. 922–934. 3
- Goodfellow Ian & Pouget-Abadie Jean & Mirza Mehdi & Xu Bing & Warde-Farley David & Ozair Sherjil & Courville Aaron & Bengio Y. Generative Adversarial Networks. Advances in Neural Information Processing Systems.2014. 3. 3
- Ramponi G., Protopapas P., Brambilla M., Janssen R. T-CGAN: Conditional Generative Adversarial Network for Data Augmentation in Noisy Time Series with Irregular Sampling. 2019. URL: https://arxiv.org/pdf/1811.08295 3
- Li Z., Ma C., Shi X., Zhang D., Li W. and Wu L. TSA-GAN: A Robust Generative Adversarial Networks for Time Series Augmentation. 2021 International Joint Conference on Neural Networks (IJCNN). 2021. P. 1–8. 4
- Jinsung Yoon, Daniel Jarrett. Time-series Generative Adversaria l Networks. Neural Information Processing Systems (NeurIPS). 2019. 4
- Laftchiev E., Liu Y. Finding Multidimensional Patterns in Multidimensional Time Series. KDD Workshop on Mining and Learning From Time Series. 2018.

