Р.Ю. Есиков1, В.И. Будзко2, Н.А. Рындин3
1, 2 ФИЦ ИУ РАН (Москва, Россия)
3 ФГБОУ ВО ВГТУ (г. Воронеж, Россия)
1 vhiteroman@gmail.com; 2 Vbudzko@frccsc.ru; 3 nikitaryndin@gmail.com
Постановка проблемы. Классические методы планирования производственных процессов в сельском хозяйстве, основанные на моделях линейного программирования, позволяют решать задачи распределения ресурсов и выбора культур при фиксированных условиях и ограничениях. Однако в реальных условиях деятельность аграрного предприятия подвержена динамическим и стохастическим факторам – изменению урожайности, цен, состояния почвы и ограничений по технике и трудовым ресурсам. Это требует перехода от статических оптимизационных моделей к системам, способным к адаптивному обучению и самообучающемуся принятию решений.
Цель. Разработать концептуальную архитектуру адаптивной системы управления производственным циклом аграрного предприятия, основанную на методе обучения с подкреплением (Reinforcement Learning, RL) и интеграции с классической моделью линейного программирования, для оптимизации последовательности севооборотов в условиях стохастической среды.
Результаты. Предложены теоретическая модель среды принятия решений, формализованная в терминах марковского процесса, и схема обучения агента с использованием алгоритма Proximal Policy Optimization (PPO). Показано, что данная архитектура обеспечивает устойчивость к стохастическим возмущениям за счёт итеративного обновления стратегии на основе наблюдаемых состояний и наград. Обосновано, что Reinforcement Learning позволяет реализовать механизм самообучения и долгосрочного прогнозирования, недостижимый в классических подходах с использованием линейного программирования.
Практическая значимость. Предложенная архитектура может быть применена в интеллектуальных системах поддержки управленческих решений, цифровых двойниках аграрных предприятий и платформах прогнозного планирования производственных циклов. RL-подход обеспечивает возможность адаптации к изменению внешней среды и повышения эффективности управления при наличии стохастических факторов.
Есиков Р.Ю., Будзко В.И., Рындин Н.А. Адаптивное управление варьируемой последовательностью действий аграрного предприятия на основе интеграции методов линейного программирования и обучения с подкреплением // Системы высокой доступности. 2025. Т. 21. № 3. С. 79−84. DOI: https://doi.org/10.18127/j20729472-202503-07
- Schulman J. et al. Proximal policy optimization algorithms // arXiv preprint arXiv:1707.06347. 2017.
- Fenz S. et al. AI-and data-driven crop rotation planning // Computers and electronics in agriculture. 2023. Т. 212. С. 108160.
- Goldenits G. et al. Tabular Reinforcement learning for Robust, Explainable CropRotation Policies Matching Deep Reinforcement LearningPerformance // EGU General Assembly Conference Abstracts. 2024. С. 9018.
- Goldenits G. et al. Current applications and potential future directions of reinforcement learning-based Digital Twins in agriculture // Smart Agricultural Technology. 2024. Т. 8. С. 100512.
- Будзко В.И., Меденников В.И. Экосистемный подход к стратегическому управлению на примере сельского хозяйства // Бизнес-информатика. 2025. Т. 19. № 2. С. 89–101.
- Есиков Р.Ю., Рындин Н.А. Управление организационной системой аграрного предприятия на основе оптимизации варьируемой последовательности деятельности // Системы высокой доступности. 2024. Т. 20. № 4. С. 44–51. DOI 10.18127/ j20729472-202404-05
- Меденников В.И., Райков А.Н. Анализ опыта цифровой трансформации в мире для сельского хозяйства России. Тенденции развития Интернет и цифровой экономики / Труды III Всеросс. c междунар. участием научно-практ. конф. Симферополь, 2020. С. 57–62.
- Меденников В.И. Системный анализ цифровых экосистем производственных отраслей на примере АПК // Цифровая экономика. 2021. № 3(15). С. 34–51.
- Никляев В.С., Косинский В.С., Ткачев В.В., Сучилина А.А. Основы технологии сельскохозяйственного производства. Земледелие и растениеводство. М.: Былина. 2000. 391 c.
- Евтефеев Ю.В., Казанцев Г.М. Основы агрономии: учебник для вузов. М.: Эксмо. 2013. 368 с.
- Gerdt V.P., Lassner W. Isomorphism verification for complex and real Life algebras by Grobner basis technique / Modern Group Analysis: Advanced Analytical and Computational Methods in Mathematical Physics: Proceedings of the International Workshop Acireale. Catania, Italy. October 27–31, 1992. Springer Netherlands. 1993. С. 245–254.
- Santos L.M.R., Michelon P.R.H., Arenales M.N., Santos R.H.S. Crop rotation scheduling with adjacency constraint // In Annals of Operations Research. 190. 2011. C. 165–180.
- Aliano Filho A.H., Florentino de Oliveira, Vaz Pato M. Metaheuristics for a crop rotation problem // International Journal of Metaheuristics. 2014. Т. 3. № 3. С. 199–222.
- Schoning J., Richter M.L. AI-based crop rotation for sustainable agriculture worldwide / 2021 IEEE Global Humanitarian Technology Conference (GHTC). IEEE. 2021. С. 142–146.
- Рындин Н.А., Скворцов Ю.С., Тишуков Б.Н. Цифровизация управления в организационных системах агропромышленных предприятий / Под ред. А.А. Рындина. Воронеж: Издательско-полиграфический центр «Научная книга». 2022. 148 с.

