350 руб
Журнал «Системы высокой доступности» №3 за 2025 г.
Статья в номере:
Адаптивное управление варьируемой последовательностью действий аграрного предприятия на основе интеграции методов линейного программирования и обучения с подкреплением
Тип статьи: научная статья
DOI: https://doi.org/10.18127/j20729472-202503-07
УДК: 658:631.1
Авторы:

Р.Ю. Есиков1, В.И. Будзко2, Н.А. Рындин3

1, 2 ФИЦ ИУ РАН (Москва, Россия)
3 ФГБОУ ВО ВГТУ (г. Воронеж, Россия)
1 vhiteroman@gmail.com; 2 Vbudzko@frccsc.ru; 3 nikitaryndin@gmail.com

Аннотация:

Постановка проблемы. Классические методы планирования производственных процессов в сельском хозяйстве, основанные на моделях линейного программирования, позволяют решать задачи распределения ресурсов и выбора культур при фиксированных условиях и ограничениях. Однако в реальных условиях деятельность аграрного предприятия подвержена динамическим и стохастическим факторам – изменению урожайности, цен, состояния почвы и ограничений по технике и трудовым ресурсам. Это требует перехода от статических оптимизационных моделей к системам, способным к адаптивному обучению и самообучающемуся принятию решений.

Цель. Разработать концептуальную архитектуру адаптивной системы управления производственным циклом аграрного предприятия, основанную на методе обучения с подкреплением (Reinforcement Learning, RL) и интеграции с классической моделью линейного программирования, для оптимизации последовательности севооборотов в условиях стохастической среды.

Результаты. Предложены теоретическая модель среды принятия решений, формализованная в терминах марковского процесса, и схема обучения агента с использованием алгоритма Proximal Policy Optimization (PPO). Показано, что данная архитектура обеспечивает устойчивость к стохастическим возмущениям за счёт итеративного обновления стратегии на основе наблюдаемых состояний и наград. Обосновано, что Reinforcement Learning позволяет реализовать механизм самообучения и долгосрочного прогнозирования, недостижимый в классических подходах с использованием линейного программирования.

Практическая значимость. Предложенная архитектура может быть применена в интеллектуальных системах поддержки управленческих решений, цифровых двойниках аграрных предприятий и платформах прогнозного планирования производственных циклов. RL-подход обеспечивает возможность адаптации к изменению внешней среды и повышения эффективности управления при наличии стохастических факторов.

Страницы: 79-84
Для цитирования

Есиков Р.Ю., Будзко В.И., Рындин Н.А. Адаптивное управление варьируемой последовательностью действий аграрного предприятия на основе интеграции методов линейного программирования и обучения с подкреплением // Системы высокой доступности. 2025. Т. 21. № 3. С. 79−84. DOI: https://doi.org/10.18127/j20729472-202503-07

Список источников
  1. Schulman J. et al. Proximal policy optimization algorithms // arXiv preprint arXiv:1707.06347. 2017.
  2. Fenz S. et al. AI-and data-driven crop rotation planning // Computers and electronics in agriculture. 2023. Т. 212. С. 108160.
  3. Goldenits G. et al. Tabular Reinforcement learning for Robust, Explainable CropRotation Policies Matching Deep Reinforcement LearningPerformance // EGU General Assembly Conference Abstracts. 2024. С. 9018.
  4. Goldenits G. et al. Current applications and potential future directions of reinforcement learning-based Digital Twins in agriculture // Smart Agricultural Technology. 2024. Т. 8. С. 100512.
  5. Будзко В.И., Меденников В.И. Экосистемный подход к стратегическому управлению на примере сельского хозяйства // Бизнес-информатика. 2025. Т. 19. № 2. С. 89–101.
  6. Есиков Р.Ю., Рындин Н.А. Управление организационной системой аграрного предприятия на основе оптимизации варьируемой последовательности деятельности // Системы высокой доступности. 2024. Т. 20. № 4. С. 44–51. DOI 10.18127/ j20729472-202404-05
  7. Меденников В.И., Райков А.Н. Анализ опыта цифровой трансформации в мире для сельского хозяйства России. Тенденции развития Интернет и цифровой экономики / Труды III Всеросс. c междунар. участием научно-практ. конф. Симферополь, 2020. С. 57–62.
  8. Меденников В.И. Системный анализ цифровых экосистем производственных отраслей на примере АПК // Цифровая экономика. 2021. № 3(15). С. 34–51.
  9. Никляев В.С., Косинский В.С., Ткачев В.В., Сучилина А.А. Основы технологии сельскохозяйственного производства. Земледелие и растениеводство. М.: Былина. 2000. 391 c.
  10. Евтефеев Ю.В., Казанцев Г.М. Основы агрономии: учебник для вузов. М.: Эксмо. 2013. 368 с.
  11. Gerdt V.P., Lassner W. Isomorphism verification for complex and real Life algebras by Grobner basis technique / Modern Group Analysis: Advanced Analytical and Computational Methods in Mathematical Physics: Proceedings of the International Workshop Acireale. Catania, Italy. October 27–31, 1992. Springer Netherlands. 1993. С. 245–254.
  12. Santos L.M.R., Michelon P.R.H., Arenales M.N., Santos R.H.S. Crop rotation scheduling with adjacency constraint // In Annals of Operations Research. 190. 2011. C. 165–180.
  13. Aliano Filho A.H., Florentino de Oliveira, Vaz Pato M. Metaheuristics for a crop rotation problem // International Journal of Metaheuristics. 2014. Т. 3. № 3. С. 199–222.
  14. Schoning J., Richter M.L. AI-based crop rotation for sustainable agriculture worldwide / 2021 IEEE Global Humanitarian Techno­logy Conference (GHTC). IEEE. 2021. С. 142–146.
  15. Рындин Н.А., Скворцов Ю.С., Тишуков Б.Н. Цифровизация управления в организационных системах агропромышленных предприятий / Под ред. А.А. Рындина. Воронеж: Издательско-полиграфический центр «Научная книга». 2022. 148 с.
Дата поступления: 28.07.2025
Одобрена после рецензирования: 12.08.2025
Принята к публикации: 29.08.2025