С.Р. Ермаков¹, С.В. Зыков²
¹Российский технологический университет МИРЭА (Москва, Россия)
²Национальный исследовательский университет «Высшая школа экономики» (Москва, Россия)
¹ermakov_s@mirea.ru, ²szykov@hse.ru
Постановка проблемы. В условиях развития интеллектуальных обучающих и образовательных систем в них возникает необходимость обработки потоковых данных с соблюдением строгих ограничений по качеству обслуживания, таких как потребление памяти, точность прогнозирования, время отклика в условиях динамичного изменения данных и других. Проблематика заключается в том, что традиционные методы обработки данных зачастую не позволяют обеспечить требуемое качество при ограниченных ресурсах.
Цель. Разработать математическую модель потоковой обработки данных в интеллектуальной образовательной системе, провести экспериментальную оценку эффективности разработанных на основе модели программных компонентов в заданных ограничениях по качеству обслуживания.
Результат. Описана математическая модель потоковой обработки данных в интеллектуальной образовательной системе, основанная на лямбда-исчислении и соответствующих формализациях. На основе математической модели разработаны модификация алгоритма инкрементального дерева решений и новый метод масштабирования и комбинированной потоковой обработки данных. Проведен экспериментальный анализ на потоковых, который показал, что предложенные решения не только удовлетворяют заданным требованиям качества (ограничение на оперативную память 4096 МБ и прогнозирование показателей с контролируемым снижением точности моделей не более 5%), но и способны улучшать время отклика при обработке данных на 40%, обеспечивая высокую эффективность и стабильность работы в условиях динамичного изменения входных данных (концептуального дрейфа).
Практическая значимость. Полученные результаты можно применять в разработках для создания современных интеллектуальных обучающих и образовательных систем и платформ, способных предоставлять оперативную и персонализированную обратную связь обучающимся при заданных ресурсных затратах.
Ермаков С.Р., Зыков С.В. Повышение эффективности потоковой обработки данных в интеллектуальной образовательной системе // Информационно-измерительные и управляющие системы. 2025. Т. 23. № 5. С. 41−54. DOI: https://doi.org/10.18127 /j20700814-202505-04
- Xu D., Wang H. Intelligent agent supported personalization for virtual learning environments // Decision Support Systems. 2006. V. 42. № 2. P. 825−843.
- Agrahari S., Singh A.K. Concept drift detection in data stream mining: a literature review // Journal of King Saud University. Computer and Information Sciences. 2022. V. 34. № 10. Part B. P. 9523−9540.
- Challenging cognitive load theory: the role of educational neuroscience and artificial intelligence in redefining learning efficacy. Электронный ресурс: https://www.mdpi.com/2076-3425/15/2/203 (дата обращения 05.04.2025).
- Razafinirina M.A., Dimbisoa W.G., Mahatody T. Pedagogical alignment of large language models (LLM) for personalized learning: a survey, trends and challenges // Journal of Intelligent Learning Systems and Applications. 2024. V. 16. № 4. P. 448−480.
- Зыков С.В. Кризис цифровизации и объектное моделирование: подходы к разработке конструктивно устойчивых программных систем // Информационно-измерительные и управляющие системы. 2024. Т. 22. № 5. С. 23−30.
- Sun Z., Kadry S.N., Krishnamoorthy S. Internet of things-assisted advanced dynamic information-processing system for physicaleducation system // Technology and Health Care. 2021. V. 29. № 6. P. 1263−1275.
- Erba T. A multi-agent architecture for an intelligent web-based educational system // Proceedings of the 5th International Conference on Web-Based Education. 2006. P. 295−300.
- Al-Shammari A. An incremental ensemble diversification in data-stream classification using improved Hoeffding trees with Thompson sampling // Journal of Al-Qadisiyah Computer Science and Mathematics. 2024. V. 16. № 2. P. 1−12.
- Gomes H.M. et al. Adaptive random forests for evolving data-stream classification // Machine Learning. 2017. V. 106. № 9. P. 1469−1495.
- Chen C., Yang M., Reniers G. A dynamic stochastic methodology for quantifying HAZMAT storage resilience // Reliability Engineering & System Safety. 2021. V. 215. P. 107909.
- Soshnikov D., Valieva Y. mPyPl: Python monadic pipeline library for complex functional data processing: arXiv:2106.09164. arXiv. 2021. 10 p.
- Сошников Д.В. Библиотека mPyPl: функциональный подход к обработке данных в глубоком обучении // Информационноизмерительные и управляющие системы. 2024. Т. 22. № 5. С. 88−96.
- Rondon P.M., Kawaguchi M., Jhala R. Liquid types // Proceedings of the 29th ACM SIGPLAN Conference on Programming Language Design and Implementation (PLDI’08). New York: Association for Computing Machinery. 2008. P. 159−169.
- Ермаков С.Р. Алгоритм инкрементального дерева решений для потоковой интеллектуальной образовательной системы // Научно-технич. вестник Поволжья. 2024. № 12. С. 292−296.
- Ермаков С.Р., Зыков С.В. Внедрение моделей машинного обучения в потоковой интеллектуальной образовательной системе // Современные наукоемкие технологии. 2025. № 2. С. 45−53.
- Köbschall K., Hartung L., Kramer S. Soft Hoeffding Tree: a transparent and differentiable model on data streams: arXiv:2411.04812. arXiv. 2024. 14 p.
- Zhang W. et al. FARF: a fair and adaptive random forests classifier: arXiv:2108.07403. arXiv. 2021. 18 p.
- Larner A. Communicating risk: developing an "efficiency index" for dementia-screening tests // Brain Sciences. 2021. V. 11. № 11. P. 1473.
- Ермаков С.Р. Модуль потокового машинного обучения интеллектуальной образовательной системы: свидетельство о гос. регистрации программы для ЭВМ № 2025612998; опубл. 07.02.2025.

