Одним из главных принципов уникальной «системы Физтеха», заложенной в основу образования в МФТИ, является тщательный отбор одаренных и склонных к творческой работе представителей молодежи. Абитуриентами Физтеха становятся самые талантливые и высокообразованные выпускники школ всей России и десятков стран мира.

Студенческая жизнь в МФТИ насыщенна и разнообразна. Студенты активно совмещают учебную деятельность с занятиями спортом, участием в культурно-массовых мероприятиях, а также их организации. Администрация института всячески поддерживает инициативу и заботится о благополучии студентов. Так, ведется непрерывная работа по расширению студенческого городка и улучшению быта студентов.

Адрес e-mail:

Технология NVidia CUDA

Программа курса по выбору “Технология NVidia CUDA"

(осенний семестр, 34 часа, 1-4 курс)

Программу составили Казённов А.М., доц. Яворский В.А.

версия для печати (zip/doc), версия для просмотра (PDF)

Лекции проходят по субботам, 17.05, ауд. 117 ГК, семинары - 408 ЛК

В 2010 г. есть интенсивный курс, который проходит ежедневно (кроме четверга и воскресенья), 18.30, 408 ЛК

Сайт курса: hpc.mipt.ru

 

 

Лекция 1. Введение в курс

История развития вычислительных систем. Основная терминология курса. Типы параллелизма. Обоснование необходимости использования распределенных систем. Критерии применимости параллельных вычислений. Примеры применения параллельных вычислений. Различные типы параллельных систем. Классическая и гибридная схема. Кластеры и суперкомпьютеры на гибридной схеме.

Семинар 1. Внутреннее устройство компьютера

Системный блок изнутри. Платы расширения. Слоты и порты. Принципиальные различия между GPU и CPU с точки зрения железа. Скорости доступа для различных слотов.

Лекция 2. Архитектура CPU и GPU

Сравнение классической архитектуры Intel и AMD. Принципиальное отличие классической и CUDA архитектуры GPU. Необходимые шаги к единой архитектуре вычислительных устройств. Сравнительные характеристики чипов G80, G92, G200, G300 NVIDIA.

Лекция 3. Аппаратная реализация единой архитектуры

Объединённая архитектура графических процессоров. Основные составные элементы аппаратной реализации GPU. Преимущества унифицированной архитектуры. Составные части аппаратной реализации: TPC, SM, SP. Буфер инструкций SM. Регистровый файл SM. Конвейеры исполнения команд. Ветвление внутри варпа.

Лекция 4. Программная модель CUDA

Основные  модификаторы языка C. Введение в особенности программирования под GPU. Понятия треда, варпа, блока и грида. Программный стек CUDA. Описание пользовательского интерфейса разработчика, основные компоненты. Команды работы с памятью. Пример вызова CUDA.

Семинар 2.Первая программа на CUDA

Необходимые приложения для написания программы. Установка программного обеспечения. Использование Putty и WinSCP для доступа к серверу. Написание «Hello World».

Лекция 5. Модель памяти GPU

Глобальная, константная, текстурная, локальная, разделяемая и регистровая память. Особенности использования каждого типа памяти. Размещение различных данных в различной памяти. Сравнения производительности глобальной и текстурной памяти на задачах произвольного чтения. Характерные размеры каждой памяти на примере чипа G200. Когерентное общение с глобальной памятью.

Семинар 3. Глобальная и разделяемая память

Написание программы перемножения матриц с использованием глобальной памяти. Оптимизация написанной программы с использованием разделяемой памяти. Способы избегания конфликта банков в разделяемой памяти. Постановка 1й и 2й задачи на дом.

Лекция 6. Оптимизация основных алгоритмов

Scan, Reduce, Histogram, Bitonic sort.

Семинар 4. Текстурная память

Использование текстурной памяти. Способы размещения данных в текстурной памяти. Использование аппаратной интерполяции.

Постановка 3й задачи на дом.

Семинар 5. Проверка домашних заданий

Проверка домашних заданий. Сдача зачета.

 

СПИСОК ЛИТЕРАТУРЫ.

  1. Архитектура и программирование массивно параллельных процессоров: http://www.nvidia.ru/object/cuda_state_university_courses_ru.html
  2. GPU Gems 1, 2, 3 edited Hubert Nquyen from NVIDIA.
  3. Курс лекций по CUDA (МГУ): http://groups.google.ru/group/cudacsmsusu?hl=ru&pli=1
  4. Боресков А.В., Харламов А.В. Основы работы с технологией CUDA. – Изд-во: ДМК Пресс, 2010, 232 стр.
Если вы заметили в тексте ошибку, выделите её и нажмите Ctrl+Enter.

© 2001-2016 Московский физико-технический институт
(государственный университет)

Техподдержка сайта

МФТИ в социальных сетях

soc-vk soc-fb soc-tw soc-li soc-li
Яндекс.Метрика