С.Т. Цаплин¹
¹МГТУ им. Н.Э. Баумана (Москва, Россия)
¹tsaplin@bmstu.ru
Постановка проблемы. Традиционные подходы к прогнозированию временных рядов, включающие в себя статистические методы (ARIMA, SARIMA) и современные алгоритмы машинного обучения, демонстрируют определенные ограничения при работе с комплексными данными, характеризующимися нелинейными зависимостями и многофакторной обусловленностью. Несмотря на развитие методов машинного обучения и больших языковых моделей, остается актуальной задача повышения точности прогнозирования временных рядов, особенно в условиях ограниченного объема обучающих данных и необходимости учета разнородных внешних факторов. Интеграция визуально-языковых моделей (VLM) в область прогнозирования временных рядов представляет собой малоизученный инновационный подход, требующий систематического анализа его применимости и эффективности.
Цель. Оценить применимость визуально-языковых моделей (VLM) для прогнозирования временных последовательностей путем сравнительного анализа с существующими методами на основе пяти ключевых критериев: точности прогноза, вычислительной скорости, простоты применения, интерпретируемости результатов и способности эффективно учитывать разнородные внешние факторы и экзогенные переменные.
Результаты. Проведено комплексное сопоставление классических статистических подходов, алгоритмов машинного обучения и инновационных мультимодальных систем с точки зрения их результативности при обработке темпоральных данных. Выполнен сравнительный анализ четырех классов моделей, который продемонстрировал значительное превосходство VLM по точности прогнозирования: среднеквадратичная ошибка у модели Time-VLM составила 4.80 против 15.80 у классической модели ARIMA, 8.90 у LSTM и 6.50 у Time-LLM, модель VLM получила наивысшие оценки по точности прогноза (5/5 баллов) и способности эффективно интегрировать разнообразные внешние факторы (5/5 баллов). Показано, что архитектура Time-VLM, объединяющая Retrieval-Augmented Learner для обработки временных данных, Vision-Augmented Learner для преобразования числовых рядов в информативные визуальные представления и Text-Augmented Learner для генерации релевантных контекстуальных описаний, обеспечивает эффективную обработку мультимодальных данных с синергетическим эффектом.
Практическая значимость. Полученные результаты определяют возможность использования VLM для принятия обоснованного выбора оптимальных методов прогнозирования в зависимости от специфики конкретной задачи, доступных вычислительных ресурсов и требований к точности предсказаний. Исследование подтверждает эффективность мультимодального подхода, объединяющего визуальную, текстовую и временную информацию, особенно в условиях ограниченного объема обучающих данных (few-shot и zero-shot обучение). Практическая значимость работы заключается в систематизации преимуществ и ограничений различных подходов к прогнозированию, что позволяет специалистам выбирать оптимальные методы для конкретных применений в экономике, финансах, промышленности и других областях. Научная новизна работы состоит в первом систематическом анализе применимости VLM для прогнозирования временных рядов. Основные ограничения VLM включают в себя высокую сложность практического применения и значительные вычислительные требования.
Цаплин С.Т. Анализ возможностей применения VLM для прогнозирования временных рядов // Информационно-измерительные и управляющие системы. 2026. Т. 24. № 1. С. 34−42. DOI: https://doi.org/10.18127/j20700814-202601-04
- Zhong S., Ruan W., Jin M., Sengupta T., Kang Y., Jansen S., Nuenen van T. Time-VLM: Exploring Multimodal Vision-Language Models for Augmented Time Series Forecasting. 2025. URL: https://arxiv.org/abs/2502.04395.
- Vision-Language Models for Vision Tasks: A Survey. 2024. URL: https://arxiv.org/pdf/2304.00685.pdf.
- Hyndman R.J., Athanasopoulos G. Forecasting: Principles and Practice. Edit. 3rd. Melbourne, Australia: OTexts. 2021. 382 p.
- Филаретов Г.Ф., Ларин А.А. Исследование и разработка EWMA-алгоритма обнаружения разладки гауссовского временного ряда по математическому ожиданию // Датчики и системы. 2022. № 6. С. 9−14. DOI: 10.25728/datsys.2022.6.2.
- Box G.E.P., Jenkins G.M., Reinsel G.C., Ljung G.M. Time Series Analysis: Forecasting and Control. Edition 5th. Hoboken: John Wiley & Sons. 2016. 712 p.
- Трегуб А.В., Трегуб И.В. Методика построения модели ARIMA для прогнозирования динамики временных рядов // Лесной вестник. 2011. № 5. С. 179−183.
- Калугин Т.Р., Ким А.К., Петрусевич Д.А. Анализ моделей ADL(p, q), используемых для описания связей между временными рядами // Российский технологический журнал. 2020. Т. 8. № 2. С. 7−22. DOI: 10.32362/2500-316X-2020-8-2-7-22.
- Chen T., Guestrin C. XGBoost: A Scalable Tree Boosting System // Proceedings of 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. San Francisco, USA. 2016. P. 785−794.
- Goodfellow I., Bengio Y., Courville A. Deep Learning. Cambridge: MIT Press. 2016. 800 p.
- Lim B., Zohren S. Deep Learning for Time Series Forecasting: Tutorial and Literature Survey. 2022. URL: https://arxiv.org/pdf/ 2004.10240.pdf.
- Freitas C.M., Prates R.C., Ochi L.S. Prompt-Driven Time Series Forecasting with Large Language Models // Proceedings of 17th International Conference on Agents and Artificial Intelligence (ICAART 2025). Funchal, Portugal. 2025. P. 1−8.
- Jin M., Wang S., Ma L., Chu Z., Zhang J.Y., Shi X., Chen P.Y., Liang Y., Li Y.F., Pan S., Wen Q. Time-LLM: Time Series Forecasting by Reprogramming Large Language Models. 2023. URL: https://arxiv.org/abs/2310.01728.
- Gruver N., Finzi M., Zohren S., Roberts S.J. Large Language Models Are Zero-Shot Time Series Forecasters. 2023. URL: https://arxiv.org/abs/2310.07820.
- Goyal A., Agarwal S., Gadekallu V.S. From Pixels to Predictions: Spectrogram and Vision Transformer for Better Time Series Forecasting. 2024. URL: https://arxiv.org/abs/2403.11047.
- Wang Y., Cabrera A., Wilson A.G., Choi Y. XForecast: Evaluating Natural Language Explanations for Time Series Forecasting. 2024. URL: https://arxiv.org/html/2410.14180v1.
- Tan M., Merrill M.A., Gupta V., Hartvigsen T., Alsentzer E. Are Language Models Actually Useful for Time Series Forecasting? // Advances in Neural Information Processing Systems 37 (NeurIPS 2024). Vancouver, Canada. 2024.
- Nielsen A. Practical Time Series Analysis: Prediction with Statistics and Machine Learning. Sebastopol: O'Reilly Media. 2019. 368 p.
- Liu H., Xu S., Zhao Z., Zheng W.L., Zhang Y., Zhao Y., Yu X., Yu C., Chen H., Bian J., Liu T.Y., Qin T., Fan W., Xie X. Time-MMD: Multi-Domain Multimodal Dataset for Time Series Analysis. Advances in Neural Information Processing Systems 37 (NeurIPS 2024). Vancouver, Canada. 2024.
- Zhou H., Zhang S., Peng J., Zhang S., Li J., Xiong H., Zhang W. Informer: Beyond Efficient Transformer for Long Sequence Time-Series Forecasting // Thirty-Fifth AAAI Conference on Artificial Intelligence (AAAI 2021). 2021. V. 35. № 12. P. 11106−11115. URL: https://arxiv.org/abs/2012.07436.

