Адрес e-mail:

Алгоритмическая аннотация сотен тысяч внутриклеточных взаимодействий: на Физтехе всего за секунду

На рисунке: активация сигнального пути гормона роста для образца рака желудка GC. Зеленый цвет обозначает активированное молекулярное взаимодействие, красный – ингибированное. 

Сотрудники Лаборатории трансляционной геномной биоинформатики опубликовали в высокоимпактном швейцарском журнале Frontiers in Genetics статью, где представили первый в своем роде алгоритм для аннотации функциональной роли белков, вовлеченных в комплексные сети межмолекулярных взаимодействий внутри клетки.

Для всестороннего анализа профилей активации различных сигнальных каскадов в клетках требуется высокопроизводительная аннотация функциональных ролей молекулярных взаимодействий. Авторы предложили алгоритм, который определяет функциональные роли компонентов пути, и применили его для аннотирования 3044 молекулярных путей человека, извлеченных из баз данных Biocarta, Reactome, KEGG, Qiagen Pathway Central, NCI и HumanCYC, всего 9022 гена. Полученная база знаний может быть применена для установления крупномасштабных профилей регуляции сигнальных, метаболических и репарационных путей ДНК с использованием данных экспрессии генов.

Рассказывает старший научный сотрудник лаборатории Максим Сорокин: «Современные экспериментальные методы позволили накопить огромные массивы данных, где собраны сотни тысяч молекулярных взаимодействий человеческой клетки. Большинство таких взаимодействий входит в состав молекулярных путей, каждый из которых отвечает за какой-то элементарный процесс внутри клетки.

Для того, чтобы количественно оценивать уровень активности молекулярных путей, необходимо знать функцию каждого из участников для каждого из путей: насколько его роль способствует активации пути, или наоборот. Раньше такую роль можно было определить только с помощью так называемого экспертного курирования – то есть с помощью анализа «вручную». Конечно же, это взрывает мозг того, кто этим занимается, и ведет к неизбежному накоплению ошибок оператора. Кроме того, это невозможно применить к современным массивам в десятки тысяч молекулярных путей, каждый из которых может содержать сотни генных продуктов. Добавьте к этому и еще один уровень сложности: один и тот же ген может играть совершенно разные роли в разных молекулярных путях.

Таким образом, росла пропасть между массивами информации и реальными возможностями их обработать. Для решения этой проблемы мы создали совершенно новый инструмент: алгоритм, который анализирует структуру молекулярных путей и природу каждого из межмолекулярных взаимодействий, и автоматически определяет функцию для каждого из генных продуктов, для каждого молекулярного пути. Это позволяет точно и единообразно аннотировать целый интерактом – то есть всю совокупность молекулярных взаимодействий внутри клетки. Причем не только для человека, но и для любого другого организма.

Помимо самой презентации алгоритма, мы также аннотировали с его помощью наиболее известные базы молекулярных путей: KEGG, Reactome, HumanCyc, Qiagen Pathway Central и другие. Мы также выложили в открытый доступ программу, с помощью который каждый может быстро рассчитать уровень активности тысяч молекулярных путей в любом человеческом образце».

 «По моим оценкам, наш алгоритм за секунду делает то, на что раньше понадобился бы ручной труд десяти квалифицированных специалистов в течение как минимум года! Мы думаем, что это серьезный шаг вперед в практической биоинформатике, и что наши новые инструменты будут широко востребованы во всем мире. А хорошо для науки – значит хорошо для Физтеха» – резюмирует директор Физтех-школы биологической и медицинской физики и соавтор статьи Денис Кузьмин.

 

20.06.2018Радуга 2018
26.04.2018ПРАГА 2018!
Если вы заметили в тексте ошибку, выделите её и нажмите Ctrl+Enter.

МФТИ в социальных сетях

soc-vk soc-fb soc-tw soc-li
Яндекс.Метрика