Одним из главных принципов уникальной «системы Физтеха», заложенной в основу образования в МФТИ, является тщательный отбор одаренных и склонных к творческой работе представителей молодежи. Абитуриентами Физтеха становятся самые талантливые и высокообразованные выпускники школ всей России и десятков стран мира.

Студенческая жизнь в МФТИ насыщенна и разнообразна. Студенты активно совмещают учебную деятельность с занятиями спортом, участием в культурно-массовых мероприятиях, а также их организации. Администрация института всячески поддерживает инициативу и заботится о благополучии студентов. Так, ведется непрерывная работа по расширению студенческого городка и улучшению быта студентов.

Адрес e-mail:

Алгоритмы в биоинформатике

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ
Федеральное государственное автономное образовательное учреждение
высшего профессионального образования
«Московский физико-технический институт (государственный университет)»
«УТВЕРЖДАЮ»
Проректор по учебной и методической работе
Д.А. Зубцов
Рабочая программа дисциплины (модуля)
по дисциплине: Алгоритмы в биоинформатике
по направлению: Прикладные математика и физика (бакалавриат)
профиль подготовки:
факультет: биологической и медицинской физики
кафедра: молекулярной и биологической физики
курс: 3
квалификация: бакалавр
Семестр, формы промежуточной аттестации: 6(Весенний) - Экзамен
Аудиторных часов: 30 всего, в том числе:
лекции: 30 час.
практические (семинарские) занятия: 0 час.
лабораторные занятия: 0 час.
Самостоятельная работа: 12 час.
Подготовка к экзамену: 30 час.
Всего часов: 72, всего зач. ед.: 2
Количество курсовых работ, заданий: 1
Программу составили:
Программа обсуждена на заседании кафедры
10 июля 2015 г.
СОГЛАСОВАНО:
Заведующий кафедрой И.А. Попов
Декан факультета биологической и медицинской физики
Начальник учебного управления И.Р. Гарайшина
1. Цели и задачи
Цель дисциплины
Дисциплина «Алгоритмы в биоинформатике» представляет обучающимся возможность освоить базовые определения из биоинформатики, которые понадобятся для понимания дальнейшего материала. Студенты получат широкий обзор разделов алгоритмической биоинформатики с упором на методы сборки геномов, а также на алгоритмы сравнения строк и алгоритмы неточного поиска подпоследовательстей в больших текстах.  Цель изучения дисциплины: знакомство студентов с известными на данный момент алгоритмами, применимыми в биоинформатике.
Задачи дисциплины
• формирование базовых знаний об основных алгоритмических принципах, применяемых в биоинформатике, а также о наиболее популярных алгоритмах, решающих конкретные биологические задачи;
• практическое освоение студентами методов построения алгоритмов для анализа биологических данных, включая анализ геномных последовательностей;
• формирование у студентов основных навыков реализации алгоритмов и приобретение ими практического опыта, необходимого для проведения самостоятельных научных исследований в области вычислительной обработки биологических данных.
2. Место дисциплины (модуля) в структуре образовательной программы
Данная дисциплина относится к вариативной части образовательной программы.
Дисциплина «Алгоритмы в биоинформатике» базируется на дисциплинах:
Физические методы исследований;
Биофизика;
Молекулярная биология;
Основы биологии;
Молекулярная микробиология ;
Информатика.
Дисциплина «Алгоритмы в биоинформатике» предшествует изучению дисциплин:
Научно-исследовательская работа.
3. Перечень планируемых результатов обучения по дисциплине (модулю), соотнесенных с планируемыми результатами освоения образовательной программы
Освоение дисциплины направлено на формирование следующих общекультурных, общепрофессиональных и профессиональных компетенций:
способность понимать ключевые аспекты и концепции в области их специализации (ОПК-3);
способность планировать и проводить научные эксперименты (в избранной предметной области) и (или) теоретические (аналитические и имитационные) исследования (ПК-1);
способность анализировать полученные в ходе научно-исследовательской работы данные и делать научные выводы (заключения) (ПК-2);
способность выбирать и применять подходящее оборудование, инструменты и методы исследований для решения задач в избранной предметной области (ПК-3);
способность критически оценивать применимость применяемых методик и методов (ПК-4).
В результате освоения дисциплины обучающиеся должны
знать:
- основные принципы построения и оценки сложности алгоритмов,
- основные алгоритмы и структуры данных, включая, графовые и строковые алгоритмы, динамическое программирование, вероятностные алгоритмы;
- вычислительные задачи, возникающие в биоинформатике;
- алгоритмы, применяемые для решения вычислительных задач в биоинформатике.
уметь:
- эффективно реализовывать изученные алгоритмы;
- применять основные алгоритмические идеи для разработки новых алгоритмов.
владеть:
- навыками освоения большого объёма информации;
- культурой постановки и моделирования вычислительных задач обработки биологических данных.
4. Содержание дисциплины (модуля), структурированное по темам (разделам) с указанием отведенного на них количества академических часов и видов учебных занятий
4.1. Разделы дисциплины (модуля) и трудоемкости по видам учебных занятий
             
Тема (раздел) дисциплины Виды учебных занятий, включая самостоятельную работу
Лекции Практич. (семинар.) задания Лаборат. работы Задания, курсовые работы Самост. работа
1 Введение 4       2
2 Геномные перестройки, алгоритмы кластеризации 6       2
3 Расстояние между последовательностями 5       2
4 Секвенирование ДНК 5       2
5 Секвенирование и распознавание белков, поиск мотивов 5       2
6 Эффективный поиск множеств фрагментов ДНК в геноме 5       2
Итого часов 30       12
Подготовка к экзамену 30 час.
Общая трудоёмкость 72 час., 2 зач.ед.
             
4.2. Содержание дисциплины (модуля), структурированное по темам (разделам)
Семестр: 6 (Весенний)
1. Введение
Введение в алгоритмы. Введение в молекулярную биологию. Задача поиск мотива. Перестройка генома.
2. Геномные перестройки, алгоритмы кластеризации
Алгоритмы построения графа перестроек, алгоритмы нахождения эволюционного расстояния между геномами по графу. Основные методы кластеризации. Скрытые марковские модели в выравнивании последовательностей.
3. Расстояние между последовательностями
Парное выравнивание последовательностей. Множественное выравнивание последовательностей. Построение оптимального перекрывающегося выравнивния, построение химерных алгоритмов.
4. Секвенирование ДНК
Преобразование Барроуза-Уилера для картирования ридов при секвенировании ДНК. Построение графов де Брёйна и фрагментарная сборка.
5. Секвенирование и распознавание белков, поиск мотивов
Спектральное выравнивание. Семплирование по Гиббсу и случайные выборки при поиске мотивов. Проблема асиметричности при секвенировании белков de novo, поиск мотивов с использованием семпленирования по Гиббсу.
6. Эффективный поиск множеств фрагментов ДНК в геноме
Выравнивание с пробелами. Приложения для суффиксных деревьев и суффиксных массивов в биоинформатике. BLAST. Проблема изменения экзонов, нахождение повторов максимальной длины.
5. Описание материально-технической базы, необходимой для осуществления образовательного процесса по дисциплине (модулю)
Оборудование, необходимое для лекций и семинаров: компьютер и мультимедийное оборудование (проектор, звуковая система).
6. Перечень основной и дополнительной литературы, необходимой для освоения дисциплины (модуля)
Основная литература
1. Neil C. Jones, Pavel A. Pevzner An Introduction to Bioinformatics Algorithms 2004 Book (J&P)   rning Approach 2014 Book
2. С. Дасгупта, Х. Пападимитриу, У. Вазирани. Алгоритмы. Перевод с английского А. С. Куликова под редакцией А. Шеня. Москва. Издательство МЦНМО. 2014.
Дополнительная литература
1. Pavel A. Pevzner. Computational Molecular Biology 2000 Book
2. Phillip Compeau, Pavel Pevzner, Bioinformatics Algorithms: An Active Lea
7. Перечень ресурсов информационно-телекоммуникационной сети "Интернет", необходимых для освоения дисциплины (модуля)
Научно-библиографические и патентные базы данных  в области физико-химической биологии, доступные по сети Интернет в бесплатном режиме - Science Citation Index (Web of Science), Medline (PubMed), Научная электронная библиотека (НЭБ), Российская патентная БД ФГУ ФИПС и американская патентная БД USPAFULL; электронные адреса крупных научных издательств, предоставляющих доступ к полным текстам текущих и архивным выпускам этих журналов.
8.  Перечень информационных технологий, используемых при осуществлении образовательного процесса по дисциплине (модулю), включая перечень программного обеспечения и информационных справочных систем (при необходимости)
На лекционных занятиях используются мультимедийные технологии, включая демонстрацию презентаций PowerPoint. Алгоритмы и анализа данных производятся с использованием:язык программирования python среда анализа R.
9. Методические указания для обучающихся по освоению дисциплины
Студент, изучающий дисциплину, должен с одной стороны, овладеть общим понятийным аппаратом, а с другой стороны, должен научиться применять теоретические знания на практике.
В результате изучения дисциплины студент должен знать основные определения дисциплины, уметь применять полученные знания для решения различных  задач.
Успешное освоение курса требует:
– посещения всех занятий, предусмотренных учебным планом по дисциплине;
– ведения конспекта занятий;
– напряжённой самостоятельной работы студента.
Самостоятельная работа включает в себя:
– чтение рекомендованной литературы;
– проработку учебного материала, подготовку ответов на вопросы, предназначенных для самостоятельного изучения;
– решение задач, предлагаемых студентам на занятиях;
– подготовку к выполнению заданий текущей и промежуточной аттестации.
Показателем владения материалом служит умение без конспекта отвечать на вопросы по темам дисциплины.
Важно добиться понимания изучаемого материала, а не механического его запоминания. При затруднении изучения отдельных тем, вопросов, следует обращаться за консультациями преподавателю.
Возможен промежуточный контроль знаний студентов в виде решения задач в соответствии с тематикой занятий.
10. Фонд оценочных средств для проведения промежуточной аттестации по итогам обучения
Приложение
ПРИЛОЖЕНИЕ
ФОНД ОЦЕНОЧНЫХ СРЕДСТВ
ДЛЯ ПРОВЕДЕНИЯ ПРОМЕЖУТОЧНОЙ АТТЕСТАЦИИ ОБУЧАЮЩИХСЯ
ПО ДИСЦИПЛИНЕ
по направлению: Прикладные математика и физика (бакалавриат)
профиль подготовки:
факультет: биологической и медицинской физики
кафедра (название): молекулярной и биологической физики
курс: 3
квалификация: бакалавр
Семестр, формы промежуточной аттестации: 6(Весенний) - Экзамен
Разработчики:
Н.И. Вяххи
М.Ю. Бородовский , канд. физ.-мат. наук, старший научный сотрудник
1. Компетенции, формируемые в процессе изучения дисциплины
Освоение дисциплины направлено на формирование у обучающегося следующих общекультурных (ОК), общепрофессиональных (ОПК) и профессиональных (ПК) компетенций:
способность понимать ключевые аспекты и концепции в области их специализации (ОПК-3);
способность планировать и проводить научные эксперименты (в избранной предметной области) и (или) теоретические (аналитические и имитационные) исследования (ПК-1);
способность анализировать полученные в ходе научно-исследовательской работы данные и делать научные выводы (заключения) (ПК-2);
способность выбирать и применять подходящее оборудование, инструменты и методы исследований для решения задач в избранной предметной области (ПК-3);
способность критически оценивать применимость применяемых методик и методов (ПК-4).
2. Показатели оценивания компетенций
В результате изучения дисциплины «Алгоритмы в биоинформатике» обучающийся должен:
знать:
- основные принципы построения и оценки сложности алгоритмов,
- основные алгоритмы и структуры данных, включая, графовые и строковые алгоритмы, динамическое программирование, вероятностные алгоритмы;
- вычислительные задачи, возникающие в биоинформатике;
- алгоритмы, применяемые для решения вычислительных задач в биоинформатике.
уметь:
- эффективно реализовывать изученные алгоритмы;
- применять основные алгоритмические идеи для разработки новых алгоритмов.
владеть:
- навыками освоения большого объёма информации;
- культурой постановки и моделирования вычислительных задач обработки биологических данных.
3. Перечень типовых контрольных заданий, используемых для оценки знаний, умений, навыков
Промежуточная аттестация по дисциплине «Алгоритмы в биоинформатике» осуществляется в форме экзамена (зачета). Экзамен (зачет) проводится в письменной (устной) форме.
1. Нахождение часто встречающихся слов в тексте
2. Реверс-комплементарность в строковых задачах
3. Нахождение шаблона в строке
4. Нахождение шаблона в строке с ошибками
5. Нахождение часто встречающихся слов в тексте с ошибками
6. Трансляция белков
7. Генерация теоретического спектра
8. Секвенирование пептидов
9. Спектральная свертка
10. Перечисление мотивов
11. Задача о медианной строке
12. Поиск наиболее частого К-мера по профилю
13. Жадный поиск мотивов
14. Рандомизированный поиск мотивов
15. Семплирование по Гиббсу
16. Задача композиции строк
17. Построение графа перекрытий
18. Построение графа де Брюйна по строке
19. Построение графа де Брюйна по множеству К-меров
20. Задачи поиска эйлерового цикла и пути
21. Реконструкция строки по множеству К-меров
22. Реконструкция генома по парным ридам
23. Наибольшая общая подпоследовательность
24. Наибольший путь в графе без циклов
25. Глобальное выравнивание
26. Локальное выравнивание
27. Редакционное расстояние
28. Выравнивание с аффинными штрафами
29. выравнивание за линейное время
30. Множественное выравнивание
31. Поиск breakpoints в геноме
32. Нахождение расстояния по 2-breaks
33. Структура данных "Бор"
34. Нахождение множественных шаблонов в тексте
4. Критерии оценивания
Оценка отлично (10 баллов) -  выставляется студенту, показавшему всесторонние, систематизированные, глубокие знания учебной программы дисциплины, проявляющему интерес к данной предметной области, продемонстрировавшему умение уверенно и творчески применять их на практике при решении конкретных задач, свободное и правильное обоснование принятых решений.
Оценка отлично (9 баллов) - выставляется студенту, показавшему всесторонние, систематизированные, глубокие знания учебной программы дисциплины и умение уверенно применять их на практике при решении конкретных задач, свободное и правильное обоснование принятых решений.
Оценка отлично (8 баллов)  - выставляется студенту, показавшему всесторонние, систематизированные, глубокие знания учебной программы дисциплины и умение уверенно применять их на практике при решении конкретных задач, правильное обоснование принятых решений, с некоторыми недочетами.
Оценка хорошо (7 баллов) - выставляется студенту, если он твердо знает материал, грамотно и по существу излагает его, умеет применять полученные знания на практике, но недостаточно грамотно обосновывает полученные результаты.
Оценка хорошо (6 баллов) - выставляется студенту, если он твердо знает материал, грамотно и по существу излагает его, умеет применять полученные знания на практике, но допускает в ответе или в решении задач некоторые неточности.
Оценка хорошо (5 баллов) - выставляется студенту, если он в основном знает материал, грамотно  и по существу излагает его, умеет применять полученные знания на практике, но допускает в ответе или в решении задач достаточно большое количество неточностей.
Оценка удовлетворительно (4 балла)  - выставляется студенту, показавшему фрагментарный, разрозненный характер знаний, недостаточно правильные формулировки базовых понятий, нарушения логической последовательности в изложении программного материала, но при этом он освоил основные разделы учебной программы, необходимые для дальнейшего обучения, и может применять полученные знания по образцу в стандартной ситуации.
Оценка удовлетворительно  (3 балла) - выставляется студенту, показавшему фрагментарный, разрозненный характер знаний, допускающему ошибки в формулировках базовых понятий, нарушения логической последовательности в изложении программного материала, слабо владеет основными разделами учебной программы, необходимыми для дальнейшего обучения и с трудом применяет полученные знания даже в стандартной ситуации.
Оценка неудовлетворительно (2 балла) - выставляется студенту, который не знает большей части основного содержания учебной программы дисциплины, допускает грубые ошибки в формулировках основных принципов и не умеет использовать полученные знания при решении типовых задач.
Оценка неудовлетворительно (1 балл) - выставляется студенту, который не знает основного содержания учебной программы дисциплины, допускает грубейшие ошибки в формулировках базовых понятий дисциплины и вообще не имеет навыков решения типовых практических задач.
5. Методические материалы, определяющие процедуры оценивания знаний, умений, навыков и (или) опыта деятельности
При проведении устного экзамена обучающемуся предоставляется 30 минут на подготовку. Опрос обучающегося по билету на устном экзамене не должен превышать одного астрономического часа.
Если вы заметили в тексте ошибку, выделите её и нажмите Ctrl+Enter.

© 2001-2016 Московский физико-технический институт
(государственный университет)

Техподдержка сайта

МФТИ в социальных сетях

soc-vk soc-fb soc-tw soc-li soc-li
Яндекс.Метрика