Журнал «Нейрокомпьютеры: разработка, применение» №12 за 2011 г.
Статья в номере:
Вычисление значимости сенсорного стимула во фронтальной коре: два разных алгоритма в случаях положительного и отрицательного подкрепления
И. А. Смирнитская - с. н. с., Центр оптико-нейронных технологий НИИСИ РАН, Институт высшей нервной деятельности и нейрофизиологии РАН E-mail: i.a.i.a@mail.ru
Исследована возможность применения теории обучения с подкреплением (reinforcement learning, RL) в случае отрицательного подкрепления - наказания. Обсуждаются особенности представления вводимой в RL управляющей выбором характеристики - значимости, разными областями фронтальной коры. Рассмотрена схема влияния миндалины на формирование функции значимости в орбитофронтальной коре. Предложена модификация теории RL, заключающаяся в раздельном вычислении значимости в случаях награды и наказания.
Страницы: 33-44
