Одним из главных принципов уникальной «системы Физтеха», заложенной в основу образования в МФТИ, является тщательный отбор одаренных и склонных к творческой работе представителей молодежи. Абитуриентами Физтеха становятся самые талантливые и высокообразованные выпускники школ всей России и десятков стран мира.

Студенческая жизнь в МФТИ насыщенна и разнообразна. Студенты активно совмещают учебную деятельность с занятиями спортом, участием в культурно-массовых мероприятиях, а также их организации. Администрация института всячески поддерживает инициативу и заботится о благополучии студентов. Так, ведется непрерывная работа по расширению студенческого городка и улучшению быта студентов.

Адрес e-mail:

Учёные из МФТИ разработали модель, предсказывающую активность молекул для агрохимии

Учёные из МФТИ и МГУ под руководством Яна Иваненкова впервые разработали компьютерную модель, позволяющую предсказывать агрохимическую активность — наличие полезного воздействия на растения — простых молекул. С использованием независимого тестового набора и результатов собственного исследования было показано, что модель обладает высокой предсказательной способностью. Работа опубликована в научном журнале Phytochemistry.


Для построения модели авторы применили методы машинного обучения, в частности — самоорганизующиеся карты Кохонена. В качестве обучающей выборки использовалась уникальная выборка, включающая 1800 тщательно отобранных известных агрохимикатов. В качестве источников информации авторы использовали патенты, научные публикации и специализированные базы данных. Важно отметить, что модель также способна прогнозировать класс активности молекул (какое именно воздействие на растение она будет оказывать), причём с довольно высокой точностью — 87%, и предсказывать активность молекулы с точностью  67%.


photo_2016-02-09_23-15-19.jpg

Построенная модель Кохонена: зелёный градиент на заднем фоне соответствует молекулам — активаторам роста растений из обучающей выборки, более темные области заселены большим количеством молекул. Кружками показаны молекулы из тестового (экспериментального) набора. Видно, что большинство протестированных молекул лежит в темных областях, что свидетельствует о высокой предсказательной способности модели.

Изображение: адаптировано из Bushkov et. al. / Phytochemistry


Молекулы, интересные с точки зрения агрохимии, принято делить на 2 категории: пестициды (которые борются с насекомыми, сорняками и грибками) и регуляторы роста растений (стимулирующие или подавляющие их рост). Для того, чтобы обнаружить новую активную молекулу из какой—либо группы, проводят дорогостоящие эксперименты — синтезируют большое количество (обычно несколько тысяч) разнообразных молекул, а затем проверяют их эффект на клетках или целых растениях. При этом в таких экспериментах значителен процент промахов — активными в лучшем случае могут оказаться лишь несколько десятков молекул. Иными словами, модель может быть использована с целью обоснованного уменьшения изначального количества молекул из числа доступных для дальнейшей экспериментальной проверки. Это позволит значительно снизить как временные, так и финансовые затраты на поиск активных молекул.

photo_2016-02-16_17-04-43.jpg

Дибензазепин — регулятор роста растений, одна из молекул, правильно классифицированная моделью.

Изображение: Bushkov et. al. / Phytochemistry


В своей работе авторы для моделирования использовали представление химического пространства, в котором каждая молекула описывается набором особых параметров — молекулярных дескрипторов. Значение такого дескриптора отражает особое свойство молекулы — растворимость, размер, площадь полярной поверхности и т.д. Каждая молекула в химическом пространстве задаётся (кодируется) набором таких параметров, как точка — своими координатами на плоскости.


С использованием алгоритма Кохонена без учителя можно уменьшить размерность этих данных с наименьшей ошибкой (этот этап назвается обучением алгоритма) и визуализировать результат в виде удобной для анализа двумерной карты, на которой можно поочередно выделить области, занимаемые молекулами из различных категорий. Тогда по этой карте можно оценить классификационную способность модели. Если эта способность в высока (например, для подобных масштабных задач это больше 70%), то модель можно протестировать с использованием независимого тестового набора молекул, которые не принимали участие в обучении. Именно это и сделали авторы работы, наглядно продемонстрировав, что их модель способна прогнозировать специфическую активность новых молекул, относя их к одной из общепринятых категорий: гербициды, регуляторы роста растений и т.п.


“Важно отметить, что разработанная модель обладает хорошей дифференциальной прогностической способностью и является первой в области агрохимии, построенной с использованием такой представительной обучающей выборки. В ходе работы нам совместно с коллегами из Лаборатории разработки инновационных лекарственных средств удалось протестировать модель с использованием результатов реального тестирования, осуществленного нами. В дальнейшем мы планируем расширить обучающую выборку и повысить прогностическую способность модели, возможно с применением других алгоритмов машинного обучения” —


комментирует основные результаты работы и дальнейшие планы Ян Иваненков, главный автор статьи и заведующий Лабораторией медицинской химии и биоинформатики МФТИ.


В будущем подобные вычислительные модели позволят значительно удешевить поиск новых активных молекул и внесут свой вклад в понимание механизмов их действия.


Если вы заметили в тексте ошибку, выделите её и нажмите Ctrl+Enter.

© 2001-2016 Московский физико-технический институт
(государственный университет)

Техподдержка сайта

МФТИ в социальных сетях

soc-vk soc-fb soc-tw soc-li soc-li
Яндекс.Метрика