Журналы
Разделы книг
Статьи по ключевому слову reinforcement learning
Моделирование адаптивного поведения автономных агентов
В.Г. Редько - д. ф.-м. н., Научно-исследовательский институт системных исследований РАН. E-mail: vgredko@gmail.com Г.А. Бесхлебнова - к. т. н. Научно-исследовательский институт системных исследований РАН. E-mail: gab19@list.ru
Вычисление значимости сенсорного стимула во фронтальной коре: два разных алгоритма в случаях положительного и отрицательного подкрепления
И. А. Смирнитская - с. н. с., Центр оптико-нейронных технологий НИИСИ РАН, Институт высшей нервной деятельности и нейрофизиологии РАН E-mail: i.a.i.a@mail.ru
Обучение нейронной сети с подкреплением в задаче объезда препятствий автономным мобильным роботом
Р.А. Мунасыпов - д.т.н., профессор, кафедра «Техническая кибернетика», Уфимский государственный авиационный технический университет. E-mail: rust40@mail.ru Г.А. Саитова - к.т.н., доцент, кафедра «Техническая кибернетика», Уфимский государственный авиационный технический университет С.С. Москвичев - мл. науч. сотрудник, кафедра «Техническая кибернетика», Уфимский государственный авиационный технический университет. E-mail: mosk.sergey@gmail.com Т.Р. Шахмаметьев - мл. науч. сотрудник, кафедра «Техническая кибернетика», Уфимский государственный авиационный технический университет. E-mail: Shahmametevtr@gmail.com
Обучение нейронной сети с подкреплением в задаче объезда препятствий автономным мобильным роботом
Р.А. Мунасыпов - д.т.н., профессор, кафедра «Техническая кибернетика», Уфимский государственный авиационный технический. E-mail: rust40@mail.ru Г.А. Саитова - к.т.н., доцент, кафедра «Техническая кибернетика», Уфимский государственный авиационный технический С.С. Москвичев - мл. науч. сотрудник, кафедра «Техническая кибернетика», Уфимский государственный авиационный технический. E-mail: mosk.sergey@gmail.com Т.Р. Шахмаметьев - мл. науч. сотрудник, кафедра «Техническая кибернетика», Уфимский государственный авиационный технический. E-mail: Shahmametevtr@gmail.com
Распределение заданий по узлам вычислительной системы на платформе Интернета вещей на основе машинного обучения

О.Ю. Ерёмин – к.т.н.,  кафедра «Компьютерные системы и сети», МГТУ им. Н.Э.Баумана

E-mail: ereminou@bmstu.ru

М.В. Степанова – аспирант,  кафедра «Компьютерные системы и сети», МГТУ им. Н.Э.Баумана

E-mail: stepanova@bmstu.ru

Обзор интеллектуальных методов управления инновационными научно-техническими проектами

Е.Н. Горлачева¹, Н.П. Гончарова²

1,2 Московский государственный технический университет им. Н.Э. Баумана (Москва, Россия),  1 gorlacheva@yandex.ru, 2 nataly.gonn79@gmail.com

Метод решения социальных дилемм на основе репутации и глубокого мультиагентного обучения с подкреплением

А.Н. Алфимцев1, С.А. Сакулин2, В.Э. Большаков3, Н.В. Быков4, М.С. Товарнов5, Н.С. Власова6

1–6 МГТУ им. Н.Э. Баумана (Москва, Россия)

Решение задачи коммивояжера с использованием обучения с подкреплением

Н.В. Блохин1, К.А. Зиновьева2, Р.А. Кочкаров3

1–3 ФГОБУ ВО «Финансовый университет при Правительстве Российской Федерации» (Москва, Россия)
1 nvblokhin@fa.ru, 2 215888@edu.fa.ru, 3 rkochkarov@fa.ru