Адрес e-mail:

Открытие новых лабораторий

Одним из итогов уходящего года в Физтех-школе прикладной математики и информатики стало открытие сразу шести новых лабораторий. Редакция журнала «За науку» расспросила ученых о планах на будущее и узнала, каких прорывов нам ждать от лабораторий в ближайшие 5–7 лет. Ведущие ученые также рассказывают, какие тенденции в их областях существуют в настоящее время и являются наиболее значимыми.


Основной целью двух лабораторий — лаборатории когнитивных динамических систем и лаборатории интеллектуального транспорта НКБ ВС, которые входят в Центр когнитивного моделирования, — является создание интеллектуальных систем управления для робототехнических платформ. Это могут быть как мобильные, небольшие тележки или манипуляторы, так и полноценные беспилотные автомобили или работающие в группе роботы, дроны. Сотрудники лабораторий хотят преодолеть технологический барьер, связанный с современными беспилотными технологиями.

Руководитель лаборатории когнитивных динамических систем Александр Панов в разговоре о тенденциях в области искусственного интеллекта заявил: «Прежде всего надо назвать увеличение производительности существующих методов машинного обучения. Проблема в низкой эффективности. Во-первых, на это влияет дороговизна по потребляемой энергии, во-вторых — по времени вычислений и по количеству дополнительных данных, которые готовит специально подготовленный человек — разметчик. Второй тренд — это универсализация. Мы хотим, чтобы существующие методы не применялись в узкоспециализированной задаче, чтобы у нас была некоторая универсальность и высокая обобщающая способность. Третий тренд — это междисциплинарность. Прорывные идеи появляются на стыке разных областей. В искусственном интеллекте — на стыке компьютерных наук с психологией и с нейрофизиологией. В качестве примера мы могли бы предложить новые варианты архитектур нейронных сетей, которые являются более биологически правдоподобными, а не те архитектуры, которые сейчас очень далеки от того, как реально работают нейронные сети мозга человека. Еще их называют кортикоморфными алгоритмами обучения. Или, например, можно использовать представления психологов о том, как работает мышление человека и что такое инсайт. Эти идеи могут быть использованы и для того, чтобы увеличить эффективность и повысить универсальность». 

Руководитель лаборатории интеллектуального транспорта НКБ ВС Дмитрий Юдин уверен: «Наша молодая команда готова к серьезным исследованиям и разработкам, она “рвется в бой” и хочет внести свой вклад в создание и внедрение новых методов искусственного интеллекта. Мы ожидаем больших результатов. Сейчас именно то время, и Физтех — именно то место, где удастся сделать что-то реально работающее! В первую очередь, для интеллектуального транспорта, роботов, беспилотных машин сейчас требуются продвинутые системы компьютерного зрения, а также навигации. Допустим, как роботу в реальном времени анализировать окружающую обстановку, как построить карту, как найти себя на ней, как спланировать свою траекторию движения в неизвестной среде? Здесь большие планы, большие перспективы. Еще задача — как обучить систему распознавания изображений по маленькому количеству изображений? Это очень сложно для современных нейронных сетей, потому что им нужны тысячи картинок, чтобы они запомнили образ, ситуацию. И вот здесь новые решения и технологии очень нужны — новые архитектуры и модели, в том числе, нейросетевые. И еще, сейчас идет большой переход на распознавание, анализ и синтез 3D-изображений. То есть если большой успех уже достигнут в области распознавания и анализа двумерных изображений, то чтобы эффективно строить 3D-модели, трехмерные образы и как-то их распознавать, требуются другие технологии. Вот дрон пролетел и пытается построить точную 3D-модель здания или наблюдаемой сцены — сейчас это происходит очень долго. Ну и проблемы локализации внутри замкнутых пространств. Сегодня большинство беспилотных автомобилей работают на основе глобальной системы позиционирования (GPS, ГЛОНАСС и т. п.) со специальными дополнительными сигналами (так называемыми RTK-поправками). Это дорого и надежно работает только на открытой территории в условиях хорошего сигнала от базовой станции. Идет поиск и совершенствование подходов, которые позволят с тем же качеством получать текущие координаты машины или робота без данных спутниковых систем. Требуются большие исследования — а мы такие работы сейчас активно проводим и ключевым трендам следуем».


В лаборатории Яндекса будут заниматься самыми разными задачами из области Data Science, связанными с Natural Language Processing и с компьютерным зрением, с поисковыми технологиями в целом и с общими вопросами машинного обучения. В частности, в лаборатории рассчитывают получить более робастные модели машинного перевода, продвинутые алгоритмы градиентного бустинга, новые результаты в теории аукционов. 

Артём Бабенко, руководитель лаборатории Яндекс, выделил три основных вызова в области Data Science: первое — масштабирование (данных много, и нужны большие модели), второе — обучение на шумных и неразмеченных данных (хорошая разметка — дорогая) и третье — интерпретируемость моделей глубинного обучения (все устали от черных ящиков).


В лаборатории искусственного интеллекта ВКонтакте планируют создать методы машинного интеллекта, которые будут решать большой класс задач: от высокоэффективных языковых моделей автоподдержки до нейросетевых рекомендаций.

Руководитель лаборатории ВКонтакте Павел Калайдин рассказал: «Важный челленж на ближайшие годы — unsupervised learning, обучение без размеченных данных или их использование для предобучения. Также считаю, что поиск эффективных архитектур глубокого обучения еще только начался, и нас ждет много открытий, с учетом острой нужды запуска ML-моделей на мобильных устройствах и встроенных системах». 


Лаборатория комбинаторных и геометрических структур открылась в рамках мегагранта и в результате жесточайшего конкурса. Ее руководитель Янош Пах — выдающийся специалист в области современной комбинаторики, а в самой лаборатории будут работать как лучшие наши математики, так и известные зарубежные ученые. Андрей Купавский, заместитель руководителя лаборатории, рассказал: «Наш проект посвящен изучению структур, возникающих в задачах вычислительной геометрии и комбинаторики, в приложениях к машинному обучению, статистической физике, компьютерному зрению и поиску. В различных задачах из этих областей мы зачастую оказываемся в ситуации, в которой нам необходимо анализировать огромные наборы однотипных объектов. Самые перспективные методы для решения подобных задач находятся на стыке экстремальной комбинаторики, теории вероятностей и вычислительной геометрии. Однако, например, в задачах о больших данных многие из наиболее эффективных на практике методов не имеют под собой теоретического обоснования. Наш проект нацелен на развитие математического аппарата для этого направления исследований». 


В ABBYY Lab нам рассказали, что в области глубокого машинного обучения в задачах анализа языка (NLP) и изображений (CV) изменения происходят столь быстро, что 5–7 лет — это целая «геологическая» эпоха. Для лаборатории очень важно добиться того, чтобы новые замечательные методы и технологии работали не только в идеальных условиях академических соревнований, но и при решении реальных задач. Большие данные, от количества которых напрямую зависит успех работы алгоритма, в реальной жизни часто оказываются не очень большими, а иногда и вовсе малыми. Поэтому важнейшая мета-задача и в области CV, и в области NLP — это борьба с нехваткой обучающих данных: либо за счет автоматической генерации новых данных, либо за счет переноса моделей, обученных на больших данных, на те области и задачи, где их недостаточно. 

Алексей Журавлев, руководитель лаборатории, пояснил: «Мы также ожидаем новых интересных результатов в области анализа языка социальных медиа. Основная задача, которую тут предстоит решить, — невероятная степень загрязнения данных в интернете. Надежных данных достаточно для работы современных методов классификации текстов, но их нужно еще извлечь из кучи мусора, возникшего в результате действий ботов, практики репостов, скрытого и явного цитирования — иначе полученным результатам нельзя доверять. Одна из наших задач — создание чистых размеченных мегакорпусов текстов интернета в десятки миллиардов слов для задач компьютерных исследований». 

В разговоре об актуальных тенденциях он добавил: "Одна из областей, которыми мы занимаемся, — применение глубоких сверточных сетей в различных задачах компьютерного зрения, таких как классификация изображений, поиск объектов и т. д. На наш взгляд, одна из важных тенденций состоит в том, что исследовательское сообщество постепенно уходит от вопроса решения той или иной задачи с максимальным качеством в сторону более рационального подхода: поиска баланса между качеством и скоростью. Это позволяет сделать шаг от академического исследования к реальной задаче, например, к поиску текста на изображениях сразу на мобильном телефоне. И мы уже говорили выше о проблеме нехватки данных: часто у вас есть не 10 миллионов размеченных изображений, а всего 5–10 штук. Так что основная тенденция сегодняшнего дня — переход от идеальных постановок задач к реальным".

31.01.2020Практикум
28.01.2020DAFEVISION 2020
Если вы заметили в тексте ошибку, выделите её и нажмите Ctrl+Enter.

МФТИ в социальных сетях

soc-vk soc-fb soc-tw soc-li
Яндекс.Метрика