350 руб
Журнал «Нейрокомпьютеры: разработка, применение» №6 за 2013 г.
Статья в номере:
Обучение нейронной сети с подкреплением в задаче объезда препятствий автономным мобильным роботом
Авторы:
Р.А. Мунасыпов - д.т.н., профессор, кафедра «Техническая кибернетика», Уфимский государственный авиационный технический. E-mail: rust40@mail.ru
Г.А. Саитова - к.т.н., доцент, кафедра «Техническая кибернетика», Уфимский государственный авиационный технический
С.С. Москвичев - мл. науч. сотрудник, кафедра «Техническая кибернетика», Уфимский государственный авиационный технический. E-mail: mosk.sergey@gmail.com
Т.Р. Шахмаметьев - мл. науч. сотрудник, кафедра «Техническая кибернетика», Уфимский государственный авиационный технический. E-mail: Shahmametevtr@gmail.com
Аннотация:
Показан подход к проблеме движения автономных мобильных роботов в незнакомой среде с препятствиями с использованием нейронной сети на основе метода обучения с подкреплением.
Страницы: 26-30
Список источников
- Borenstein J., Koren Y. Real-time Obstacle Avoidance for Fast Mobile Robots // IEEE Transactions on Systems, Man, and Cybernetics. 1989.V. 19. №. 5. Sept./Oct. P. 1179-1187.
- Станкевич Л.А. Интеллектуальные роботы и системы управления // Нейрокомпьютеры: разработка, применение. 2005. №8-9. С. 54-66.
- Sutton R., Barto A. Reinforcement learning: An introduction. Adaptive Computation and Machine Learning series. MIT Press (Bradford Book). Cambridge. 1998. V. 18.
- Watkins J., Dayan P. Q-learning // Machine Learning. 1992. V. 8. P. 279-292.
- Onat A. Q-learning with recurrent neural networks as a controller for the inverted pendulum problem // The Fifth International Conference on Neural Information Processing, October 21-23. 1998. P. 83-840.
- Cervera E., del Pobil A.P. Sensor-based learning for practical planning of fine motions in robotics // Information Sciences. 2002. V. 145. Is. 1-2. P. 147-168.