Анализ возможностей применения VLM для прогнозирования временных рядов

500 руб

Журнал «Информационно-измерительные и управляющие системы» №1 за 2026 г.

Статья в номере:

Тип статьи: научная статья

DOI: https://doi.org/10.18127/j20700814-202601-04

УДК: 004.912

Ключевые слова: VLM Time-VLM Time-LLM машинное обучение ARIMA нейронные сети временной ряд

Авторы:

С.Т. Цаплин¹

¹МГТУ им. Н.Э. Баумана (Москва, Россия)

¹tsaplin@bmstu.ru

Аннотация:

Постановка проблемы. Традиционные подходы к прогнозированию временных рядов, включающие в себя статистические методы (ARIMA, SARIMA) и современные алгоритмы машинного обучения, демонстрируют определенные ограничения при работе с комплексными данными, характеризующимися нелинейными зависимостями и многофакторной обусловленностью. Несмотря на развитие методов машинного обучения и больших языковых моделей, остается актуальной задача повышения точности прогнозирования временных рядов, особенно в условиях ограниченного объема обучающих данных и необходимости учета разнородных внешних факторов. Интеграция визуально-языковых моделей (VLM) в область прогнозирования временных рядов представляет собой малоизученный инновационный подход, требующий систематического анализа его применимости и эффективности.

Цель. Оценить применимость визуально-языковых моделей (VLM) для прогнозирования временных последовательностей путем сравнительного анализа с существующими методами на основе пяти ключевых критериев: точности прогноза, вычислительной скорости, простоты применения, интерпретируемости результатов и способности эффективно учитывать разнородные внешние факторы и экзогенные переменные.

Результаты. Проведено комплексное сопоставление классических статистических подходов, алгоритмов машинного обучения и инновационных мультимодальных систем с точки зрения их результативности при обработке темпоральных данных. Выполнен сравнительный анализ четырех классов моделей, который продемонстрировал значительное превосходство VLM по точности прогнозирования: среднеквадратичная ошибка у модели Time-VLM составила 4.80 против 15.80 у классической модели ARIMA, 8.90 у LSTM и 6.50 у Time-LLM, модель VLM получила наивысшие оценки по точности прогноза (5/5 баллов) и способности эффективно интегрировать разнообразные внешние факторы (5/5 баллов). Показано, что архитектура Time-VLM, объединяющая Retrieval-Augmented Learner для обработки временных данных, Vision-Augmented Learner для преобразования числовых рядов в информативные визуальные представления и Text-Augmented Learner для генерации релевантных контекстуальных описаний, обеспечивает эффективную обработку мультимодальных данных с синергетическим эффектом.

Практическая значимость. Полученные результаты определяют возможность использования VLM для принятия обоснованного выбора оптимальных методов прогнозирования в зависимости от специфики конкретной задачи, доступных вычислительных ресурсов и требований к точности предсказаний. Исследование подтверждает эффективность мультимодального подхода, объединяющего визуальную, текстовую и временную информацию, особенно в условиях ограниченного объема обучающих данных (few-shot и zero-shot обучение). Практическая значимость работы заключается в систематизации преимуществ и ограничений различных подходов к прогнозированию, что позволяет специалистам выбирать оптимальные методы для конкретных применений в экономике, финансах, промышленности и других областях. Научная новизна работы состоит в первом систематическом анализе применимости VLM для прогнозирования временных рядов. Основные ограничения VLM включают в себя высокую сложность практического применения и значительные вычислительные требования.

Страницы: 34-42

Для цитирования

Цаплин С.Т. Анализ возможностей применения VLM для прогнозирования временных рядов // Информационно-измерительные и управляющие системы. 2026. Т. 24. № 1. С. 34−42. DOI: https://doi.org/10.18127/j20700814-202601-04

Список источников

Zhong S., Ruan W., Jin M., Sengupta T., Kang Y., Jansen S., Nuenen van T. Time-VLM: Exploring Multimodal Vision-Language Models for Augmented Time Series Forecasting. 2025. URL: https://arxiv.org/abs/2502.04395.
Vision-Language Models for Vision Tasks: A Survey. 2024. URL: https://arxiv.org/pdf/2304.00685.pdf.
Hyndman R.J., Athanasopoulos G. Forecasting: Principles and Practice. Edit. 3rd. Melbourne, Australia: OTexts. 2021. 382 p.
Филаретов Г.Ф., Ларин А.А. Исследование и разработка EWMA-алгоритма обнаружения разладки гауссовского временного ряда по математическому ожиданию // Датчики и системы. 2022. № 6. С. 9−14. DOI: 10.25728/datsys.2022.6.2.
Box G.E.P., Jenkins G.M., Reinsel G.C., Ljung G.M. Time Series Analysis: Forecasting and Control. Edition 5th. Hoboken: John Wiley & Sons. 2016. 712 p.
Трегуб А.В., Трегуб И.В. Методика построения модели ARIMA для прогнозирования динамики временных рядов // Лесной вестник. 2011. № 5. С. 179−183.
Калугин Т.Р., Ким А.К., Петрусевич Д.А. Анализ моделей ADL(p, q), используемых для описания связей между временными рядами // Российский технологический журнал. 2020. Т. 8. № 2. С. 7−22. DOI: 10.32362/2500-316X-2020-8-2-7-22.
Chen T., Guestrin C. XGBoost: A Scalable Tree Boosting System // Proceedings of 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. San Francisco, USA. 2016. P. 785−794.
Goodfellow I., Bengio Y., Courville A. Deep Learning. Cambridge: MIT Press. 2016. 800 p.
Lim B., Zohren S. Deep Learning for Time Series Forecasting: Tutorial and Literature Survey. 2022. URL: https://arxiv.org/pdf/ 2004.10240.pdf.
Freitas C.M., Prates R.C., Ochi L.S. Prompt-Driven Time Series Forecasting with Large Language Models // Proceedings of 17th International Conference on Agents and Artificial Intelligence (ICAART 2025). Funchal, Portugal. 2025. P. 1−8.
Jin M., Wang S., Ma L., Chu Z., Zhang J.Y., Shi X., Chen P.Y., Liang Y., Li Y.F., Pan S., Wen Q. Time-LLM: Time Series Forecasting by Reprogramming Large Language Models. 2023. URL: https://arxiv.org/abs/2310.01728.
Gruver N., Finzi M., Zohren S., Roberts S.J. Large Language Models Are Zero-Shot Time Series Forecasters. 2023. URL: https://arxiv.org/abs/2310.07820.
Goyal A., Agarwal S., Gadekallu V.S. From Pixels to Predictions: Spectrogram and Vision Transformer for Better Time Series Forecasting. 2024. URL: https://arxiv.org/abs/2403.11047.
Wang Y., Cabrera A., Wilson A.G., Choi Y. XForecast: Evaluating Natural Language Explanations for Time Series Forecasting. 2024. URL: https://arxiv.org/html/2410.14180v1.
Tan M., Merrill M.A., Gupta V., Hartvigsen T., Alsentzer E. Are Language Models Actually Useful for Time Series Forecasting? // Advances in Neural Information Processing Systems 37 (NeurIPS 2024). Vancouver, Canada. 2024.
Nielsen A. Practical Time Series Analysis: Prediction with Statistics and Machine Learning. Sebastopol: O'Reilly Media. 2019. 368 p.
Liu H., Xu S., Zhao Z., Zheng W.L., Zhang Y., Zhao Y., Yu X., Yu C., Chen H., Bian J., Liu T.Y., Qin T., Fan W., Xie X. Time-MMD: Multi-Domain Multimodal Dataset for Time Series Analysis. Advances in Neural Information Processing Systems 37 (NeurIPS 2024). Vancouver, Canada. 2024.
Zhou H., Zhang S., Peng J., Zhang S., Li J., Xiong H., Zhang W. Informer: Beyond Efficient Transformer for Long Sequence Time-Series Forecasting // Thirty-Fifth AAAI Conference on Artificial Intelligence (AAAI 2021). 2021. V. 35. № 12. P. 11106−11115. URL: https://arxiv.org/abs/2012.07436.

Дата поступления: 08.12.2025

Одобрена после рецензирования: 17.12.2025

Принята к публикации: 14.01.2026