Адрес e-mail:

Система искусственного интеллекта для Minecraft: команда МФТИ победила в международном конкурсе MineRL

Сотрудники лаборатории когнитивных динамических систем МФТИ стали победителями соревнования MineRL. Они предложили новый метод обучения с подкреплением на основе демонстраций, с помощью которого можно быстро и эффективно решать иерархические задачи в среде Minecraft: поиск ресурсов и создание новых инструментов. Использовать разработанные алгоритмы можно будет при создании автономных мобильных роботов и роботов-манипуляторов. Конкурс прошел в рамках международной конференции по нейросетевым технологиям Neural Information Processing Systems-2019. 

Обучение с подкреплением — один из перспективных методов искусственного интеллекта, который демонстрирует поразительные успехи в игровых и робототехнических задачах, но требует большого количества вычислительных ресурсов и времени обучения. Сотрудники и стажеры лаборатории когнитивных динамических систем МФТИ и Института проблем искусственного интеллекта ФИЦ ИУ РАН — Алексей Скрынник, Эрмек Айтыгулов, Алексей Староверов, Кирилл Аксенов, Василий Давыдов и Александр Панов — предложили новый подход с использованием механизма забывания некорректных экспертных демонстраций решения поставленной задачи.

«Команда лаборатории достигла отличного результата, достойно представив Физтех и Россию на международной конференции. Игровая среда Minecraft, в которой мы смогли продемонстрировать интеллектуальное поведение агента, реализует большое разнообразие разных типов взаимодействия человека со сложной, непредсказуемой внешней средой. В этом плане она является отличным симулятором, приближенным к реальности, и для нее намного сложнее разрабатывать методы обучения поведения, чем для таких сред как Go, Dota или Starcraft. Предложенный нами метод открывает новые пути для применения обучения с подкреплением уже в прикладных задачах, таких как беспилотный транспорт и роботы-манипуляторы», — сказал заведующий лабораторией когнитивных динамических систем Центра когнитивного моделирования Александр Панов.

Соревнование длилось пять месяцев, всего было два раунда. В первом команда Физтеха заняла третье место, во втором — обошла девять финалистов и заняла первое место с существенным отрывом. В конкурсе участвовали более 40 команд со всего мира. 

«MineRL — это соревнование для интеллектуальных алгоритмов, а не вычислительных возможностей. До этого многие достойные результаты в области искусственного интеллекта достигались за счет “грубой силы” — большого количества GPU и CPU для обучения сложных систем, — добавил директор Физтех-школы прикладной математики и информатики Андрей Райгородский. — Как только в требования добавилась необходимость разработки вычислительно-эффективных методов, шансы всех команд уравнялись. В таких условиях наши ребята оказались лучше всех, опередив команды из США, Китая, Японии, Финляндии, Германии и других стран. Это в очередной раз подтверждает, что Физтех в целом и ФПМИ в частности — мировые лидеры в области искусственного интеллекта. И это на самом деле закономерно, потому что в Физтех-школе построена уникальная система взаимодействия академических базовых организаций и индустриальных партнеров. В данном случае я бы отметил крайне удачную стыковку ИСА РАН и АймТеха на площадке ФПМИ».

Соревнование организовано Microsoft и Carnegie Mellon University, в организационный и программные комитеты входили Катя Хофманн (Microsoft Research), Руслан Салахутдинов (Carnegie Mellon University), Сергей Левин (UC Berkeley) и Челси Финн (Google Brain and UC Berkeley).

Поздравляем команду МФТИ с заслуженной победой и благодарим индустриального партнера лаборатории — компанию AIMTech за предоставленную вычислительную и финансовую поддержку. Запись выступления на конференции NIPS можно посмотреть здесь (начиная с 1:05). Описание предложенного алгоритма — в расширенной аннотации

ID
CODE
NAME
PREVIEW_TEXT
PREVIEW_PICTURE
DETAIL_TEXT
DETAIL_PICTURE
DATE_ACTIVE_FROM
ACTIVE_FROM
IBLOCK_ID
IS_STANDOUT
/Заочная олимпиада по комбинаторике
/Поддержать целевой капитал ФПМИ
/Трое физтехов стали лауреатами научной премии имени Ильи Сегаловича от Яндекса
/Студенты ФПМИ заняли первое и второе места на Колмогоровской студенческой олимпиаде по теории вероятностей в МГУ
/Выборы заведующих кафедрами
/ФПМИ приглашает старшеклассников принять участие в летней школе «Комбинаторика и алгоритмы»
/Идет прием статей для участия в международной конференции «Оптимизация и приложения» в Черногории
/Яндекс учредил стипендию для студентов 1-2 курсов ФПМИ
/ФПМИ открывает первую в России продвинутую магистерскую программу в области информационных технологий
/В МФТИ откроется базовая кафедра Математического института имени В.А. Стеклова РАН
/Обновленный список абитуриентов, рекомендованных на грант ФПМИ
/Школа глубокого обучения ФПМИ открывает набор на курсы осеннего семестра
/Кружок Computer Science для школьников от ФПМИ и ЦРИТО МФТИ
/ФПМИ и ЦРИТО МФТИ организуют кружок по олимпиадному программированию для старшеклассников
/ABBYY и МФТИ открывают совместную научную лабораторию
/Олимпиада ФПМИ для школьников
/Открыта регистрация на Зимнюю школу ФПМИ «Комбинаторика и алгоритмы»
/Аспирант МФТИ занял третье место в конкурсе Мёбиуса
/Лаборатория ФПМИ выиграла грант на 79 млн рублей
/Яндекс и ФПМИ открывают совместную лабораторию
/Система искусственного интеллекта для Minecraft: команда МФТИ победила в международном конкурсе MineRL
/Аспирант ФПМИ стал победителем конкурса «Молодая математика России»
/Открытие новых лабораторий
/Открыт набор на весенний курс Школы глубокого обучения от ФПМИ
/Конкурс на дополнительные места в магистратуру и аспирантуру МФТИ
/S7 Group открывает в МФТИ кафедру «Информационные технологии в авиации»
/МФТИ и Huawei открыли совместную R&D-лабораторию по разработке технологий искусственного интеллекта
/Студенты ФПМИ получат повышенную стипендию от ИСП РАН
/Продолжаем работать онлайн
/Сотрудники ФПМИ стали лауреатами конкурса фонда Саймонса
Если вы заметили в тексте ошибку, выделите её и нажмите Ctrl+Enter.

© 2001-2020 Московский физико-технический институт (национальный исследовательский университет)

Противодействие коррупции | Сведения о доходах

Политика обработки персональных данных МФТИ

Техподдержка сайта | API

Использование новостных материалов сайта возможно только при наличии активной ссылки на https://mipt.ru

МФТИ в социальных сетях