Обучение нейронной сети с подкреплением в задаче объезда препятствий автономным мобильным роботом

350 руб

Журнал «Нейрокомпьютеры: разработка, применение» №6 за 2013 г.

Статья в номере:

Ключевые слова: обучение с подкреплением нейросетевое управление мобильные роботы

Авторы:

Р.А. Мунасыпов - д.т.н., профессор, кафедра «Техническая кибернетика», Уфимский государственный авиационный технический. E-mail: rust40@mail.ru Г.А. Саитова - к.т.н., доцент, кафедра «Техническая кибернетика», Уфимский государственный авиационный технический С.С. Москвичев - мл. науч. сотрудник, кафедра «Техническая кибернетика», Уфимский государственный авиационный технический. E-mail: mosk.sergey@gmail.com Т.Р. Шахмаметьев - мл. науч. сотрудник, кафедра «Техническая кибернетика», Уфимский государственный авиационный технический. E-mail: Shahmametevtr@gmail.com

Аннотация:

Показан подход к проблеме движения автономных мобильных роботов в незнакомой среде с препятствиями с использованием нейронной сети на основе метода обучения с подкреплением.

Страницы: 26-30

Список источников

Borenstein J., Koren Y. Real-time Obstacle Avoidance for Fast Mobile Robots // IEEE Transactions on Systems, Man, and Cybernetics. 1989.V. 19. №. 5. Sept./Oct. P. 1179-1187.
Станкевич Л.А. Интеллектуальные роботы и системы управления // Нейрокомпьютеры: разработка, применение. 2005. №8-9. С. 54-66.
Sutton R., Barto A. Reinforcement learning: An introduction. Adaptive Computation and Machine Learning series. MIT Press (Bradford Book). Cambridge. 1998. V. 18.
Watkins J., Dayan P. Q-learning // Machine Learning. 1992. V. 8. P. 279-292.
Onat A. Q-learning with recurrent neural networks as a controller for the inverted pendulum problem // The Fifth International Conference on Neural Information Processing, October 21-23. 1998. P. 83-840.
Cervera E., del Pobil A.P. Sensor-based learning for practical planning of fine motions in robotics // Information Sciences. 2002. V. 145. Is. 1-2. P. 147-168.