Одним из главных принципов уникальной «системы Физтеха», заложенной в основу образования в МФТИ, является тщательный отбор одаренных и склонных к творческой работе представителей молодежи. Абитуриентами Физтеха становятся самые талантливые и высокообразованные выпускники школ всей России и десятков стран мира.

Студенческая жизнь в МФТИ насыщенна и разнообразна. Студенты активно совмещают учебную деятельность с занятиями спортом, участием в культурно-массовых мероприятиях, а также их организации. Администрация института всячески поддерживает инициативу и заботится о благополучии студентов. Так, ведется непрерывная работа по расширению студенческого городка и улучшению быта студентов.

Адрес e-mail:

Введение в алгоритмы биоинформатики

Вяххи Николай Иванович

vyahhi@gmail.com

Санкт-Сетербургский академический университет РАН.

Лаборатория биологических алгоритмов.

 nikolay-vyahhi-2
Певзнер Павел Аркадьевич

Калифорнийский университет в Сан-Диего, Санкт-Петербургский академический университет РАН.

д.ф.-м.н., профессор.

Pevzner-headshot


Описание курса


Проект по секвенированию генома, начатый в 2001 году, произвел революцию в области вычислительной биологии. Результатом является постоянная востребованность в новых алгоритмах, в которых современная биология нуждается, вероятно, больше, чем любая другая область научной деятельности. Возникшая связь между информатикой и биологией влияет на процесс обучение и биологов, и программистов.


Секвенирование генома лишь одна из множества проблем, решение которых тесно связано с вычислительными методами. В этом курсе будут рассмотрены базовые алгоритмы, необходимые для понимания современной биологии. Будут рассмотрены такие методы, как динамическое программирование и сетевой анализ, применимые к широкому кругу биологических задач (от поиска генов до построения филогенетического древа жизни). Процесс обучения будет построен на применении настоящих биоинформатических алгоритмов для анализа реальных генетических образцов.


Для выполнения домашнего задания и закрепления изученного материала будет применяться интернет-платформа Rosiland (http://rosalind.info) — ресурс для изучения биоинформатики, созданный при участии авторов курса. Мы надеемся, что с помощью Rosiland вы поймете, насколько увлекательным может быть решение биоинформатических задач.


Программа курса:


Каждое домашнее задание будет состоять приблизительно из 5 задач по пограммированию, при этом будет использована интернет-платформа для обучения алгоритмам биоинформатики Rosiland http://rosalind.info.

 

  1. Введение
    • Введение в алгоритмы
    • Введение в молекулярную биологию
    • Задача поиск мотива
    • Перестройка генома
    • Домашнее задание: вычисление эволюционного расстояния между последовательностями, поиск мотивов
    • Рекомендуемая литература: J&P, главы 1–5
  2. Расстояние между последовательностями
    • Парное выравнивание последовательностей
    • Множественное выравнивание последовательностей
    • Домашнее задание: построение оптимального перекрывающегося выравнивния, построение химерных алгоритмов
    • Рекомендуемая литература: J&P, глава 6 (разделы 6.1–6.10)
  3. Предсказание генов и скрещивающееся выравнивание
    • Выравнивание с пробелами
    • Приложения для суффиксных деревьев и суффиксных массивов в биоинформатике
    • BLAST
    • Домашнее задание: проблема изменения экзонов, нахождение повторов максимальной длины
    • Рекомендуемая литература: J&P, глава 6 (разделы 6.11–6.14) и глава 7
  4. Секвенирование ДНК
    • Преобразование Барроуза-Уилера для картирования ридов при секвенировании ДНК
    • Домашнее задание: построение графов де Брёйна и фрагментарная сборка
    • Рекомендуемая литература: J&P, глава 8 (разделы 8.1–8.9)
  5. Секвенирование и распознавание белков
    • Спектральное выравнивание
    • Семплирование по Гиббсу и случайные выборки при поиске мотивов
    • Домашнее задание: проблема асиметричности при секвенировании белков de novo, поиск мотивов с использованием семпленирования по Гиббсу
    • Рекомендуемая литература: J&P, глава 8 (разделы 8.10–8.15) и глава 12
  6. ДНК-чипы и алгоритмы кластеризации
    • Алгоритм построения филогенетического дерева на основе эволюционых расстояний
    • Алгоритм построения филогенетического дерева на основе точечных замен
    • Скрытые марковские модели в выравнивании последовательностей
    • Домашнее задание: проблема наименьшей парсимонии, поиск скрытых марковских моделей
    • Рекомендуемая литература:J&P, главы 10 и 11

Необходимые навыки для прохождения курса.


Знание основ программирования на любом языке, который выберет обучающийся. При отсутствии этих навыков рекомендуем пройти вводный курс в программирование на Python на сайте Rosiland http://rosalind.info (приблизительно 10часов работы).


Материалы курса.


Всю необходимую литературу можно будет скачать на сайте курса.


Формат курса.


Каждый урок делится на тематические сегменты, описывающие определенные темы. Каждый сегмент сопровождается текстовыми материалами, презентацией PowerPiont, записью видеолекции (приблизительно 10–15 минут) и тестом. Домашине задания в виде задач по программированию будут автоматически проверяться через платформу Rosiland. Финальный экзамен ориентирован на проверку основных тем курса.


Рекомендуемая литература. 

  • Book (J&P)   
  • An Introduction to Bioinformatics Algorithms 
  • Neil C. Jones, Pavel A. Pevzner

Если вы заметили в тексте ошибку, выделите её и нажмите Ctrl+Enter.

© 2001-2016 Московский физико-технический институт
(государственный университет)

Техподдержка сайта

МФТИ в социальных сетях

soc-vk soc-fb soc-tw soc-li soc-li
Яндекс.Метрика