Моделирование адаптивного поведения автономных агентов

350 руб

Журнал «Нейрокомпьютеры: разработка, применение» №3 за 2010 г.

Статья в номере:

Ключевые слова: формирование адаптивного поведения автономные агенты обучение с подкреплением эволюционная оптимизация

Авторы:

В.Г. Редько - д. ф.-м. н., Научно-исследовательский институт системных исследований РАН. E-mail: vgredko@gmail.com Г.А. Бесхлебнова - к. т. н. Научно-исследовательский институт системных исследований РАН. E-mail: gab19@list.ru

Аннотация:

Построена и исследована компьютерная модель адаптивного поведения автономных агентов, имеющих несколько естественных потребностей: питание, размножение, безопасность. Система управления агента основана на правилах вида «Если имеет место ситуация S, то необходимо выполнить действие A». Каждое правило имеет свой вес. Веса правил модифицируются как путем обучения с подкреплением, так и в процессе эволюционной оптимизации. Моделирование продемонстрировало формирование естественного поведения агентов.

Страницы: 33-38

Список источников

Witkowski, M., An action-selection calculus // Adaptive Behavior. 2007. V. 15. No. 1. PP. 73-97.
Butz, M.V., Sigaud, O., Pezzulo, G., Baldassarre, G. (Eds.). Anticipatory Behavior in Adaptive Learning Systems: From Brains to Individual and Social Behavior. LNAI 4520. Berlin. Heidelberg: Springer Verlag. 2007.
Vernon, D., Metta, G., Sandini, G. A survey of artificial cognitive systems: Implications for the autonomous development of mental capabilities in computational agents // IEEE Transactions on Evolutionary Computation, special issue on Autonomous Mental Development. 2007. V. 11. No. 2. P. 151-180.
Sutton, R. S., Barto, A. G., Reinforcement Learning: An Introduction. MIT Press. 1998.
Редько В. Г. Перспективы моделирования когнитивной эволюции // Третья международная конференция по когнитивной науке: Тез. докл. В2-хт. Т. 2. М.: Художественно-издательскийцентр. 2008. С. 576-577.
Red-ko, V. G., Evolution of cognition: Towards the theory of origin of human logic // Foundations of Science. 2000. V. 5. No. 3. P. 323-338.
Holland, J. H., Holyoak, K. J., Nisbett, R. E., Thagard, P., Induction: Processes of Inference, Learning, and Discovery. Cambridge. MA: MIT Press. 1986.
Red-ko, V. G., Mosalov, O. P., Prokhorov, D. V., A model of evolution and learning // Neural Networks. 2005. V. 18. No. 5-6. P. 738-745.
Редько В. Г., Прохоров Д. В. Нейросетевые адаптивные критики // Научная сессия МИФИ-2004. VI Всероссийская научно-техническая конференция «Нейроинформатика-2004»: Сб. научных трудов. Ч. 2. М.: МИФИ. 2004. С. 77-84.
Непомнящих В. А., Попов Е. Е., Редько В. Г. Бионическая модель адаптивного поискового поведения // Изв. РАН. Теория и системы управления. 2008. № 1. С. 85-93.
Редько В. Г., Бесхлебнова Г. А. Модель формирования адаптивного поведения автономных агентов // Интегрированные модели и мягкие вычисления в искусственном интеллекте: Сб. тр. V-й Междунар. научн.-практической конференции. Т. 1. М.: Физматлит. 2009. С. 70-79.
Витяев Е. Е. Извлечение знаний из данных. Компьютерное познание. Модели когнитивных процессов. Новосибирск: НГУ. 2006.