Одним из главных принципов уникальной «системы Физтеха», заложенной в основу образования в МФТИ, является тщательный отбор одаренных и склонных к творческой работе представителей молодежи. Абитуриентами Физтеха становятся самые талантливые и высокообразованные выпускники школ всей России и десятков стран мира.

Студенческая жизнь в МФТИ насыщенна и разнообразна. Студенты активно совмещают учебную деятельность с занятиями спортом, участием в культурно-массовых мероприятиях, а также их организации. Администрация института всячески поддерживает инициативу и заботится о благополучии студентов. Так, ведется непрерывная работа по расширению студенческого городка и улучшению быта студентов.

Адрес e-mail:

Введение в химическую информатику

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ
Федеральное государственное автономное образовательное учреждение
высшего профессионального образования
«Московский физико-технический институт (государственный университет)»
«УТВЕРЖДАЮ»
Проректор по учебной и методической работе
Д.А. Зубцов
Рабочая программа дисциплины (модуля)
по дисциплине: Введение в химическую информатику
по направлению: Прикладные математика и физика (бакалавриат)
профиль подготовки: Химическая физика и свойства наноструктур
факультет: молекулярной и химической физики
кафедра: молекулярной и биологической физики
курс: 2
квалификация: бакалавр
Семестр, формы промежуточной аттестации: 4(Весенний) - Дифференцированный зачет
Аудиторных часов: 30 всего, в том числе:
лекции: 30 час.
практические (семинарские) занятия: 0 час.
лабораторные занятия: 0 час.
Самостоятельная работа: 42 час.
Всего часов: 72, всего зач. ед.: 2
Количество курсовых работ, заданий: 1
Программу составил: Н.В. Киреева, канд. хим. наук, доцент
Программа обсуждена на заседании кафедры
10 июля 2015 г.
СОГЛАСОВАНО:
Заведующий кафедрой И.А. Попов
Декан факультета молекулярной и химической физики
Начальник учебного управления И.Р. Гарайшина
1. Цели и задачи
Цель дисциплины
Приобретение теоретических знаний по химической информатике и навыков практического применения ее методов в химии (медицинской, физической, органической и т.д.).
Задачи дисциплины
- формирование у обучающихся общих представлений о химической информатике в контексте её применения для прогнозирования физических, химических и биологических свойств соединений и материалов, для поиска новых лекарственных препаратов, анализа спектральной информации, для предсказания хода химических реакций и планирования органического синтеза;
- ознакомление обучающихся с проблемами создания и работы с химическими базами данных;
- ознакомление обучающихся с последними наиболее успешными работами в области химической информатики.
2. Место дисциплины (модуля) в структуре образовательной программы
Дисциплина «Введение в химическую информатику» относится к вариативной части ООП.
Дисциплина «Введение в химическую информатику» базируется на дисциплинах:
Дополнительные главы общей и органической химии;
Планирование эксперимента и обработка данных;
Введение в математический анализ;
Линейная алгебра;
Химия;
Информатика;
Общая физика: термодинамика и молекулярная физика;
Аналитическая геометрия;
Кратные интегралы и теория поля;
Общая физика: механика;
Многомерный анализ, интегралы и ряды.
Дисциплина «Введение в химическую информатику» предшествует изучению дисциплин:
Профильные дисциплины.
3. Перечень планируемых результатов обучения по дисциплине (модулю), соотнесенных с планируемыми результатами освоения образовательной программы
Освоение дисциплины направлено на формирование следующих общекультурных, общепрофессиональных и профессиональных компетенций:
способность к самоорганизации и самообразованию (ОК-7);
способность решать стандартные задачи профессиональной деятельности на основе информационной и библиографической культуры с применением информационно-коммуникационных технологий и  с учетом основных требований информационной безопасности (ОПК-1);
способность применять теорию и методы математики для построения качественных и количественных моделей объектов и процессов в естественнонаучной сфере деятельности (ОПК-2);
способность применять полученные знания для анализа систем, процессов и методов (ОПК-4);
способность представлять результаты собственной деятельности с использованием современных средств, ориентируясь на потребности аудитории, в том числе в форме отчетов, презентаций, докладов (ОПК-6);
способность анализировать полученные в ходе научно-исследовательской работы данные и делать научные выводы (заключения) (ПК-2);
способность критически оценивать применимость применяемых методик и методов (ПК-4).
В результате освоения дисциплины обучающиеся должны
знать:
актуальные области применения задач химической информатики и ее связь с другими науками;
основные способы представления химеческой информации для решения задач химической информатики;
отличия и особенности наиболее известных химических баз данных;
достоинства и недостатки существующих алгоритмов классификации, регрессии и хемографии, основные принципы их работы;
причины, обуславливающие потребность в применении методов определения области применимости моделей и адаптации области данных, основные алгоритмы для решения этих задач.
уметь:
извлекать и анализировать информацию о химических соединениях из публичных химических баз данных;
выбирать и применять на практике наиболее подходящие для решения поставленной задачи методы классификации, регрессии и хемографии, оценивать качество полученных моделей.
владеть:
навыками работы с основными хемоинформационными программными пакетами для расчета различных типов дескрипторов.
базовыми навыками применения молекулярного докинга.
4. Содержание дисциплины (модуля), структурированное по темам (разделам) с указанием отведенного на них количества академических часов и видов учебных занятий
4.1. Разделы дисциплины (модуля) и трудоемкости по видам учебных занятий
             
Тема (раздел) дисциплины Виды учебных занятий, включая самостоятельную работу
Лекции Практич. (семинар.) задания Лаборат. работы Задания, курсовые работы Самост. работа
1 3D QSAR, основанный  на пространственном выравнивании. 4       4
2 Виртуальный скрининг по структуре. Докинг. 2       4
3 Внутреннее и внешнее представление химической информации. 1       4
4 История развития, определение, базовые понятия и области применения химической информатики. 1       4
5 Консенсусные подходы. Методы определения области применимости моделей. Методы адаптации области данных 4       4
6 Концепция молекулярных дескрипторов 2       4
7 Навигация в химическом пространстве данных: базовые понятия, область применения. 4       4
8 Подготовка данных. Классификационные методы машинного обучения, используемые в химической информатике. 4       4
9 Работа с химическими базами данных 4       4
10 Регрессионные методы машинного обучения, используемые в химической информатике. 4       6
Итого часов 30       42
Подготовка к экзамену 0 час.
Общая трудоёмкость 72 час., 2 зач.ед.
             
4.2. Содержание дисциплины (модуля), структурированное по темам (разделам)
Семестр: 4 (Весенний)
1. 3D QSAR, основанный  на пространственном выравнивании.
Методы 3D QSAR, независимые от выравнивания.
2. Виртуальный скрининг по структуре. Докинг.
Основные алгоритмические подходы, используемые для докинга.
Скоринг. Типы скоринг функций.
Наиболее популярные программы докинга
3. Внутреннее и внешнее представление химической информации.
Понятие об уровнях представления химических структур. Линейные обозначения (имена, WLN, SMILES, SLN, InChi, InChIKey, RInChI).
Битовые строки (структурные ключи, молекулярные отпечатки пальцев, хэшированные отпечатки пальцев).
Матричное представление, виды матриц. Табличное представление.
Трехмерные представления. Координаты атомов. Поверхности. Виды поверхностей (ван-дер-ваальсова поверхность, поверхность Коннолли, доступная растворителю поверхность, поверхность исключенного растворителя, поверхность полости фермента, поверхность изоплотности)
Типичные форматы файлов (MDL, Sybyl, PDB). Перекодировка форматов.
4. История развития, определение, базовые понятия и области применения химической информатики.
История развития химической информатики. Определение химической информатики как части теоретической химии. Базовые понятия.
Общее представление о задачах химической информатики и ее связи с другими науками. Области применения.
Типичные представления молекул в химии (структурная формула, химическая формула, тривиальное имя). Особенности представления в химической информатике, требования
5. Консенсусные подходы. Методы определения области применимости моделей. Методы адаптации области данных
Консенсусные подходы.
Методы определения области применимости моделей.
Методы адаптации области данных.
Методы пространственного выравнивания.
6. Концепция молекулярных дескрипторов
Понятие молекулярного подобия. Понятие "ландшафт структура-активность" (структура-свойство) (Structure-Activity Landscape), методы анализа.
2D-дескрипторы: фрагментные дескрипторы, топологические индексы, физико-химические дескрипторы.
3D-дескрипторы: геометрические и квантово-химические дескрипторы, дескрипторы молекулярных полей.
Свободно доступные компьютерные программы расчета дескрипторов.
Методы отбора дескрипторов (переменных)
7. Навигация в химическом пространстве данных: базовые понятия, область применения.
Иерархические деревья молекулярных остовов (Hierarchical Scaffold Trees).
Сетеобразующие графы сходства (Network-like Similarity Graphs).
Метод главных компонент (Principal Component Analysis).
Метод многомерного шкалирования (Multidimensional Scaling).
Самоорганизующиеся карты Кохонена  (Kohonen Self-Organizing Maps).
Генеративные топографические карты (Generative Topographic Maps).
Диффузионные карты (Diffusion Maps).
Метод Isomap.
Метод локально-линейного встраивания (Locally linear Embedding).
Метод LaplacianEigenmaps.
8. Подготовка данных. Классификационные методы машинного обучения, используемые в химической информатике.
Химическая предобработка данных: отбор данных и стандартизация.
Математическая предобработка данных: стандартизация, шкалирование, нормализация.
"Метод ближайших соседей" (k-Nearest Neighbors).
Классификация с помощью метода опорных векторов (Support Vector Classification).
"Деревья решений" (Decision Trees).
"Случайный лес" (Random Forest).
Оценка качества классификационных моделей. ROC-кривые (Receiver Operator Characteristic).
9. Работа с химическими базами данных
Типы баз. Наиболее известные химические базы данных.
Виды поиска в химических базах данных: структурный поиск, подструктурный поиск, надструктурный поиск, поиск по молекулярному подобию, поиск фармакофоров.
10. Регрессионные методы машинного обучения, используемые в химической информатике.
Множественная линейная регрессия (Multiple Linear Regression).
Гребневая регрессия.
Метод частичных наименьших квадратов (Partial Least Squares).
Регрессия с помощью метода опорных векторов (Support Vector Regression).
Многослойные нейронные сети (Multilayer Neural Networks).
Оценка качества регрессионных моделей.
5. Описание материально-технической базы, необходимой для осуществления образовательного процесса по дисциплине (модулю)
Необходимое оборудование для лекций и практических занятий:
учебная аудитория, оборудованная мультимедиапроектором и экраном, персональными компьютерами (для практических занятий).
6. Перечень основной и дополнительной литературы, необходимой для освоения дисциплины (модуля)
Основная литература
1) T.I. Oprea, Chemoinformatics in Drug Discovery, Wiley-VCH, 2005, ISBN 3-527-30753-2
2) Varnek A., Tropsha, A. Chemoinformatics Approaches to Virtual Screening, RSCPublishing, 2008, ISBN 978-0-85404-144-2
3) Хельтье Х.-Д. и др. Молекулярное моделирование: теория и практика: под ред. В. А. Палюлина и Е. В. Радченко; пер. с англ. - М: Бином. Лаборатория знаний, 2009.-318 с.
4) R. Todeschini, V. Consonni. Molecular Descriptors for chemoinformatics. Т. 1. Изд. 2, доп. Weinheim: Wiley-VCH, 2009 - 967 с.
Дополнительная литература
1) Gasteiger J.(Editor), Engel T.(Editor): Chemoinformatics : A Textbook. John Wiley & Sons, 2004, ISBN 3-527-30681-1
2) J. Bajorath, Chemoinformatics: Concepts, Methods, and Tools for Drug Discovery, Humana Press: Totowa, New Jersey, 2004, ISBN 1-58829-261-4
7.  Перечень информационных технологий, используемых при осуществлении образовательного процесса по дисциплине (модулю), включая перечень программного обеспечения и информационных справочных систем (при необходимости)
Программное обеспечение на основе QSAR, MS Office, Origin.
8. Методические указания для обучающихся по освоению дисциплины
Студент, изучающий дисциплину, должен с одной стороны, овладеть общим понятийным аппаратом, а с другой стороны, должен научиться применять теоретические знания на практике.
В результате изучения дисциплины студент должен знать основные определения дисциплины, уметь применять полученные знания для решения различных  задач.
Успешное освоение курса требует:
– посещения всех занятий, предусмотренных учебным планом по дисциплине;
– ведения конспекта занятий;
– напряжённой самостоятельной работы студента.
Самостоятельная работа включает в себя:
– чтение рекомендованной литературы;
– проработку учебного материала, подготовку ответов на вопросы, предназначенных для самостоятельного изучения;
– решение задач, предлагаемых студентам на занятиях;
– подготовку к выполнению заданий текущей и промежуточной аттестации.
Показателем владения материалом служит умение без конспекта отвечать на вопросы по темам дисциплины.
Важно добиться понимания изучаемого материала, а не механического его запоминания. При затруднении изучения отдельных тем, вопросов, следует обращаться за консультациями преподавателю.
Возможен промежуточный контроль знаний студентов в виде решения задач в соответствии с тематикой занятий.
9. Фонд оценочных средств для проведения промежуточной аттестации по итогам обучения
Приложение
ПРИЛОЖЕНИЕ
ФОНД ОЦЕНОЧНЫХ СРЕДСТВ
ДЛЯ ПРОВЕДЕНИЯ ПРОМЕЖУТОЧНОЙ АТТЕСТАЦИИ ОБУЧАЮЩИХСЯ
ПО ДИСЦИПЛИНЕ
по направлению: Прикладные математика и физика (бакалавриат)
профиль подготовки: Химическая физика и свойства наноструктур
факультет: молекулярной и химической физики
кафедра (название): молекулярной и биологической физики
курс: 2
квалификация: бакалавр
Семестр, формы промежуточной аттестации: 4(Весенний) - Дифференцированный зачет
Разработчик: Н.В. Киреева , канд. хим. наук, доцент
1. Компетенции, формируемые в процессе изучения дисциплины
Освоение дисциплины направлено на формирование у обучающегося следующих общекультурных (ОК), общепрофессиональных (ОПК) и профессиональных (ПК) компетенций:
способность к самоорганизации и самообразованию (ОК-7);
способность решать стандартные задачи профессиональной деятельности на основе информационной и библиографической культуры с применением информационно-коммуникационных технологий и  с учетом основных требований информационной безопасности (ОПК-1);
способность применять теорию и методы математики для построения качественных и количественных моделей объектов и процессов в естественнонаучной сфере деятельности (ОПК-2);
способность применять полученные знания для анализа систем, процессов и методов (ОПК-4);
способность представлять результаты собственной деятельности с использованием современных средств, ориентируясь на потребности аудитории, в том числе в форме отчетов, презентаций, докладов (ОПК-6);
способность анализировать полученные в ходе научно-исследовательской работы данные и делать научные выводы (заключения) (ПК-2);
способность критически оценивать применимость применяемых методик и методов (ПК-4).
2. Показатели оценивания компетенций
В результате изучения дисциплины «Введение в химическую информатику» обучающийся должен:
знать:
актуальные области применения задач химической информатики и ее связь с другими науками;
основные способы представления химеческой информации для решения задач химической информатики;
отличия и особенности наиболее известных химических баз данных;
достоинства и недостатки существующих алгоритмов классификации, регрессии и хемографии, основные принципы их работы;
причины, обуславливающие потребность в применении методов определения области применимости моделей и адаптации области данных, основные алгоритмы для решения этих задач.
уметь:
извлекать и анализировать информацию о химических соединениях из публичных химических баз данных;
выбирать и применять на практике наиболее подходящие для решения поставленной задачи методы классификации, регрессии и хемографии, оценивать качество полученных моделей.
владеть:
навыками работы с основными хемоинформационными программными пакетами для расчета различных типов дескрипторов.
базовыми навыками применения молекулярного докинга.
3. Перечень типовых контрольных заданий, используемых для оценки знаний, умений, навыков
Промежуточная аттестация по дисциплине «Введение в химическую информатику» осуществляется в форме экзамена (зачета). Экзамен (зачет) проводится в письменной (устной) форме.
Примерный перечень вопросов к дифференцированному зачету:
1) История развития химической информатики. Определение химической информатики как части теоретической химии. Базовые понятия.
2) Общее представление о задачах химической информатики и ее связи с другими науками. Области применения.
3) Типичные представления молекул в химии (структурная формула, химическая формула, тривиальное имя). Особенности представления в химической информатике, требования.
4) Понятие об уровнях представления химических структур. Линейные обозначения (имена, WLN, SMILES, SLN, InChi, InChIKey, RInChI).
5) Битовые строки (структурные ключи, молекулярные отпечатки пальцев, хэшированные отпечатки пальцев).
6) Матричное представление, виды матриц. Табличное представление.
7) Трехмерные представления. Координаты атомов. Поверхности. Виды поверхностей (ван-дер-ваальсова поверхность, поверхность Коннолли, доступная растворителю поверхность, поверхность исключенного растворителя, поверхность полости фермента, поверхность изоплотности)
8) Типичные форматы файлов (MDL, Sybyl, PDB). Перекодировка форматов.
9) Типы баз. Наиболее известные химические базы данных.
10)Виды поиска в химических базах данных: структурный поиск, подструктурный поиск, надструктурный поиск, поиск по молекулярному подобию, поиск фармакофоров.
11)Понятие молекулярного подобия. Понятие "ландшафт структура-активность" (структура-свойство) (Structure-Activity Landscape), методы анализа.
12)2D-дескрипторы: фрагментные дескрипторы, топологические индексы, физико-химические дескрипторы.
13)3D-дескрипторы: геометрические и квантово-химические дескрипторы, дескрипторы молекулярных полей.
14)Свободно доступные компьютерные программы расчета дескрипторов.
15)Методы отбора дескрипторов (переменных)
16)Иерархические деревья молекулярных остовов (Hierarchical Scaffold Trees).
17)Сетеобразующие графы сходства (Network-like Similarity Graphs).
18)Метод главных компонент (Principal Component Analysis).
19)Метод многомерного шкалирования (Multidimensional Scaling).
20)Самоорганизующиеся карты Кохонена  (Kohonen Self-Organizing Maps).
21)Генеративные топографические карты (Generative Topographic Maps).
22)Диффузионные карты (Diffusion Maps).
23)Метод Isomap.
24)Метод локально-линейного встраивания (Locally linear Embedding).
25)Метод LaplacianEigenmaps.
26)Химическая предобработка данных: отбор данных и стандартизация.
27)Математическая предобработка данных: стандартизация, шкалирование, нормализация.
28)"Метод ближайших соседей" (k-Nearest Neighbors).
29)Классификация с помощью метода опорных векторов (Support Vector Classification).
30)"Деревья решений" (Decision Trees).
31)"Случайный лес" (Random Forest).
32)Оценка качества классификационных моделей. ROC-кривые (Receiver Operator Characteristic).
33)Множественная линейная регрессия (Multiple Linear Regression).
34)Гребневая регрессия.
35)Метод частичных наименьших квадратов (Partial Least Squares).
36)Регрессия с помощью метода опорных векторов (Support Vector Regression).
37)Многослойные нейронные сети (Multilayer Neural Networks).
38)Оценка качества регрессионных моделей.
39)Консенсусные подходы.
40)Методы определения области применимости моделей.
41)Методы адаптации области данных.
42)Методы пространственного выравнивания.
43) Методы 3D QSAR, независимые от выравнивания.
44) Основные алгоритмические подходы, используемые для докинга.
45) Скоринг. Типы скоринг функций.
46) Наиболее популярные программы докинга.
4. Критерии оценивания
Оценка отлично 10 баллов -  выставляется студенту, показавшему всесторонние, систематизированные, глубокие знания учебной программы дисциплины, проявляющему интерес к данной предметной области, продемонстрировавшему умение уверенно и творчески применять их на практике при решении конкретных задач, свободное и правильное обоснование принятых решений.
Оценка отлично 9 баллов - выставляется студенту, показавшему всесторонние, систематизированные, глубокие знания учебной программы дисциплины и умение уверенно применять их на практике при решении конкретных задач, свободное и правильное обоснование принятых решений.
Оценка отлично 8 баллов  - выставляется студенту, показавшему всесторонние, систематизированные, глубокие знания учебной программы дисциплины и умение уверенно применять их на практике при решении конкретных задач, правильное обоснование принятых решений, с некоторыми недочетами.
Оценка хорошо 7 баллов - выставляется студенту, если он твердо знает материал, грамотно и по существу излагает его, умеет применять полученные знания на практике, но недостаточно грамотно обосновывает полученные результаты.
Оценка хорошо 6 баллов - выставляется студенту, если он твердо знает материал, грамотно и по существу излагает его, умеет применять полученные знания на практике, но допускает в ответе или в решении задач некоторые неточности.
Оценка хорошо 5 баллов - выставляется студенту, если он в основном знает материал, грамотно  и по существу излагает его, умеет применять полученные знания на практике, но допускает в ответе или в решении задач достаточно большое количество неточностей.
Оценка удовлетворительно 4 балла  - выставляется студенту, показавшему фрагментарный, разрозненный характер знаний, недостаточно правильные формулировки базовых понятий, нарушения логической последовательности в изложении программного материала, но при этом он освоил основные разделы учебной программы, необходимые для дальнейшего обучения, и может применять полученные знания по образцу в стандартной ситуации.
Оценка удовлетворительно  3 балла - выставляется студенту, показавшему фрагментарный, разрозненный характер знаний, допускающему ошибки в формулировках базовых понятий, нарушения логической последовательности в изложении программного материала, слабо владеет основными разделами учебной программы, необходимыми для дальнейшего обучения и с трудом применяет полученные знания даже в стандартной ситуации.
Оценка неудовлетворительно 2 балла - выставляется студенту, который не знает большей части основного содержания учебной программы дисциплины, допускает грубые ошибки в формулировках основных принципов и не умеет использовать полученные знания при решении типовых задач.
Оценка неудовлетворительно 1 балл - выставляется студенту, который не знает основного содержания учебной программы дисциплины, допускает грубейшие ошибки в формулировках базовых понятий дисциплины и вообще не имеет навыков решения типовых практических задач.
5. Методические материалы, определяющие процедуры оценивания знаний, умений, навыков и (или) опыта деятельности
При проведении устного дифференцированного зачета обучающемуся предоставляется 30 минут на подготовку. Опрос обучающегося по билету на устном дифференцированном зачете  не должен превышать одного астрономического часа.
Если вы заметили в тексте ошибку, выделите её и нажмите Ctrl+Enter.

© 2001-2016 Московский физико-технический институт
(государственный университет)

Техподдержка сайта

МФТИ в социальных сетях

soc-vk soc-fb soc-tw soc-li soc-li
Яндекс.Метрика