350 руб
Журнал «Нейрокомпьютеры: разработка, применение» №3 за 2010 г.
Статья в номере:
Моделирование адаптивного поведения автономных агентов
Ключевые слова:
формирование адаптивного поведения
автономные агенты
обучение с подкреплением
эволюционная оптимизация
Авторы:
В.Г. Редько - д. ф.-м. н., Научно-исследовательский институт системных исследований РАН. E-mail: vgredko@gmail.com
Г.А. Бесхлебнова - к. т. н. Научно-исследовательский институт системных исследований РАН. E-mail: gab19@list.ru
Аннотация:
Построена и исследована компьютерная модель адаптивного поведения автономных агентов, имеющих несколько естественных потребностей: питание, размножение, безопасность. Система управления агента основана на правилах вида «Если имеет место ситуация S, то необходимо выполнить действие A». Каждое правило имеет свой вес. Веса правил модифицируются как путем обучения с подкреплением, так и в процессе эволюционной оптимизации. Моделирование продемонстрировало формирование естественного поведения агентов.
Страницы: 33-38
Список источников
- Witkowski, M., An action-selection calculus // Adaptive Behavior. 2007. V. 15. No. 1. PP. 73-97.
- Butz, M.V., Sigaud, O., Pezzulo, G., Baldassarre, G. (Eds.). Anticipatory Behavior in Adaptive Learning Systems: From Brains to Individual and Social Behavior. LNAI 4520. Berlin. Heidelberg: Springer Verlag. 2007.
- Vernon, D., Metta, G., Sandini, G. A survey of artificial cognitive systems: Implications for the autonomous development of mental capabilities in computational agents // IEEE Transactions on Evolutionary Computation, special issue on Autonomous Mental Development. 2007. V. 11. No. 2. P. 151-180.
- Sutton, R. S., Barto, A. G., Reinforcement Learning: An Introduction. MIT Press. 1998.
- Редько В. Г. Перспективы моделирования когнитивной эволюции // Третья международная конференция по когнитивной науке: Тез. докл. В2-хт. Т. 2. М.: Художественно-издательскийцентр. 2008. С. 576-577.
- Red-ko, V. G., Evolution of cognition: Towards the theory of origin of human logic // Foundations of Science. 2000. V. 5. No. 3. P. 323-338.
- Holland, J. H., Holyoak, K. J., Nisbett, R. E., Thagard, P., Induction: Processes of Inference, Learning, and Discovery. Cambridge. MA: MIT Press. 1986.
- Red-ko, V. G., Mosalov, O. P., Prokhorov, D. V., A model of evolution and learning // Neural Networks. 2005. V. 18. No. 5-6. P. 738-745.
- Редько В. Г., Прохоров Д. В. Нейросетевые адаптивные критики // Научная сессия МИФИ-2004. VI Всероссийская научно-техническая конференция «Нейроинформатика-2004»: Сб. научных трудов. Ч. 2. М.: МИФИ. 2004. С. 77-84.
- Непомнящих В. А., Попов Е. Е., Редько В. Г. Бионическая модель адаптивного поискового поведения // Изв. РАН. Теория и системы управления. 2008. № 1. С. 85-93.
- Редько В. Г., Бесхлебнова Г. А. Модель формирования адаптивного поведения автономных агентов // Интегрированные модели и мягкие вычисления в искусственном интеллекте: Сб. тр. V-й Междунар. научн.-практической конференции. Т. 1. М.: Физматлит. 2009. С. 70-79.
- Витяев Е. Е. Извлечение знаний из данных. Компьютерное познание. Модели когнитивных процессов. Новосибирск: НГУ. 2006.