Одним из главных принципов уникальной «системы Физтеха», заложенной в основу образования в МФТИ, является тщательный отбор одаренных и склонных к творческой работе представителей молодежи. Абитуриентами Физтеха становятся самые талантливые и высокообразованные выпускники школ всей России и десятков стран мира.

Студенческая жизнь в МФТИ насыщенна и разнообразна. Студенты активно совмещают учебную деятельность с занятиями спортом, участием в культурно-массовых мероприятиях, а также их организации. Администрация института всячески поддерживает инициативу и заботится о благополучии студентов. Так, ведется непрерывная работа по расширению студенческого городка и улучшению быта студентов.

Адрес e-mail:

Архитектура нейроплат на ПЛИС

И.И. Киселёв

Московский физико-технический институт

 

В докладе рассматривается аппаратная реализация многослойных НС на FPGA Xilinx серии Virtex-E. Выбор архитектуры обрабатывающего элемента, для реализации многослойных НС, направлен на оптимальное использование аппаратных ресурсов FPGA Xilinx. Представлены результаты моделирования потоков данных при прямом распространении и обучении НС. Выдвинуты предложения по усовершенствованию архитектура нейроплаты. FPGA являются удобным средством аппаратной реализации алгоритмов, обладающих «естественным» параллелизмом. Использовались платы формата PCI, на которых расположены 4 FPGA. В одной из них размещен контроллер PCI 2.1, а к остальным трем подключены микросхемы ZBT RAM. FPGA соединены между собой по кольцу 32х-разрядными шинами.

Моделировались режимы прямого распространения и обучения 3х-слойной НС, содержащей N нейронов в каждом слое для различных N на данной плате. В процессе моделирования выяснилось, что предлагавшаяся ранее структура нейрона (8 8-ми разрядных входов, дерево сумматоров, выход взвешенной суммы, функция активации) оказалась неудобной для реализации больших НС с большой размерностью входного вектора. На кристалле XCV400E размещается 4 таких нейрона. Размещение затруднено тем, что для каждого умножителя необходимо подавать по 2 байта различных данных, а также тем, что дерево сумматоров плохо "ложится" на кристалл. В общем случае каждый такт на каждый нейрон необходимо подавать 8 компонент входного вектора и 8 весовых коэффициентов. Таким образом на кристалл необходимо каждый такт подавать 64 байта данных.

Предложена новая архитектура (рис 1.) вычислительного элемента, эмулирующего нейрон, которая позволяет более гибко варьировать число входов и уменьшить количество пересылок данных.

Рис.1

Здесь 1 – восьмиразрядный умножитель, 2 – накапливающий сумматор, 3 – функция активации, x_i- i-я компонента входного вектора, w_{ij} - весовые коэффициенты j-го нейрона y_j - выход j-го нейрона, u - управляющий сигнал, передающий взвешенную сумму на функцию активации и обнуляющий накопительный регистр сумматора.

Можно разместить 32 нейрона такого типа. Тогда если производить умножение одной компоненты входного вектора на соответствующие коэффициенты 32-х различных нейронов, то каждый такт следует подавать всего 33 байта данных. При данной архитектуре значительно упрощается наращивание числа входов нейрона (от 1 до \infty). Также упрощается реализация неполносвязных НС. Для этого достаточно подавать на вход умножителя только те данные, для которых весовые коэффициенты не равны нулю.

Имеется возможность кэшировать данные, что позволяет значительно снизить объем данных, пересылаемых через PCI.

Если вы заметили в тексте ошибку, выделите её и нажмите Ctrl+Enter.

© 2001-2016 Московский физико-технический институт
(государственный университет)

Техподдержка сайта

МФТИ в социальных сетях

soc-vk soc-fb soc-tw soc-li soc-li
Яндекс.Метрика