История высокопроизводительных вычислений в МФТИ началась еще в конце 1970-х годов прошлого века.

Ректор МФТИ (1962-1987 гг.) академик Олег Михайлович Белоцерковский осознал важность образования в области суперкомпьютерных технологий в результате бесед с академиком Никитой Николаевичем Моисеевым, который  после одной из своих заграничных командировок рассказал ему о введенной в действие в США машине CRAY-1.

Почти сразу же на кафедре вычислительной математики МФТИ по инициативе Олега Михайловича, ею заведующего, профессор В.В. Щенников начал читать студентам и аспирантам Факультета управления и прикладной математики (ФУПМ) курс лекций «Программирование на векторно-конвейерных ЭВМ». Слухи о заморском чуде – компьютере CRAY-1 со скромной по сегодняшним меркам производительностью 133 Мфлоп – казались волшебными сказками, тем более, что реальные расчеты в нашей стране в это время велись на БЭСМ-6, машине с гораздо более скромными возможностями. Тогда же группа энтузиастов написала на БЭСМ-6 эмулятор CRAY-1. Затем суперкомпьютеры стали появляться на базовых кафедрах МФТИ. В 1991-1992 годах в Институте автоматизации проектирования РАН (ИАП РАН) появилась индийская суперкомпьютерная система «Param 8000». Желающие – студенты Физтеха, аспиранты, молодые исследователи – смогли попробовать себя в программировании на этой транспьютерной системе. Самым активным энтузиастом и пропагандистом параллельных вычислений оставался академик О.М. Белоцерковский, основавшим и возглавившим ИАП РАН.

В самом Долгопрудном потребности в высокопроизводительных вычислительных системах стали ощущать научные сотрудники, преподаватели, студенты, занимавшиеся численным моделированием в механике сплошных сред. Часть расчетов выполнялась в ИАП РАН (там стала появляться более мощная индийская техника), появились первые кластеры, собранные из персональных компьютеров. В конце 1990-х годов группы энтузиастов собирали кластеры «на коленках» – на базе учебных классов МФТИ. Днем они функционировали как класс для практических занятий студентов, вечером и ночью – как кластер для научных расчетов.

Перелом наступил после того, как МФТИ в 2006 году стал победителем общероссийского конкурса в рамках приоритетного национального проекта «Образование» Министерства образования и науки РФ. В рамках проекта был построен кластер «МФТИ-60». Такое название – неслучайное: в дни объявления результатов мега-конкурса физтехи отмечали 60-летие со дня организации физико-технического факультета МГУ им. М. В. Ломоносова. В мае 2007 года в рамках выполнения национального проекта «Образование», при большой поддержке и постоянном внимании ректора МФТИ члена-корреспондента РАН Николая Николаевича Кудрявцева, кластер «МФТИ-60» был собран и протестирован. На момент тестирования кластер занимал 415 позицию в мировом суперкомпьютерном рейтинге Top 500. В октябре 2007 года кластер был пущен в эксплуатацию. Системным интегратором кластера стал Институт системного программирования РАН (директор – выпускник МФТИ академик В.П. Иванников), поставщиком оборудования – ООО «ИВО Модуль». Кластер имеет 136 узлов (процессоры Intel Xeon) с пиковой производительностью 6,5 терафлопс. В процессе эксплуатации кластера был разработан технологический прием «отладочный кластер». Его авторы – доцент кафедры информатики Карпов В.Е., и профессор кафедры вычислительной математики Лобанов А.И..

Сущность данного приема заключается в том, что для отладки программ и обучения новых пользователей целевым образом создается отладочный кластер. Программное обеспечение отладочного кластера дублирует  программное обеспечение основного. В результате, пользователи, научившиеся работать и добившиеся работоспособности своих программ на отладочном кластере, могут с минимальными затратами перейти на основной. В то же время, сбои, создаваемые ошибками неопытных пользователей, неработоспособными программами и т. п., не влияют на работу основного кластера. Опыт показал, что такой подход гарантирует практически полное отсутствие сбоев во время «массового счета», что значительно повышает эффективность работы системы для пользователей и административной группы и снижает стоимость использования системы.

Петр Пуговкин

Выпуск №12 журнал - ноябрь 2011