Нейрокомпьютерная обработка сигналов и изображений перспективные программно-аппаратные эмуляторы нейронных сетей на базе мультиядерных микропроцессоров с параллельной архитектурой




Скачать 237.41 Kb.
НазваниеНейрокомпьютерная обработка сигналов и изображений перспективные программно-аппаратные эмуляторы нейронных сетей на базе мультиядерных микропроцессоров с параллельной архитектурой
страница1/3
Дата19.12.2012
Размер237.41 Kb.
ТипДокументы
  1   2   3

Нейрокомпьютерная обработка сигналов и изображений




Нейрокомпьютерная обработка сигналов и изображений


ПЕРСПЕКТИВНЫЕ ПРОГРАММНО-АППАРАТНЫЕ ЭМУЛЯТОРЫ НЕЙРОННЫХ СЕТЕй НА БАЗЕ МУЛЬТИЯДЕРНЫХ МИКРОПРОЦЕССОРОВ С ПАРАЛЛЕЛЬНОЙ АРХИТЕКТУРой

Аляутдинов М.А., Галушкин А.И., Троепольская Г.В.

ФГУП НИИ Автоматической Аппаратуры им. академика В.С. Семенихина


Проблема создания эффективных масштабируемых нейрокомпьютерных конфигураций является весьма актуальной в связи с расширением сферы применения нейросетевых технологий.

В настоящее время реализация нейросетевых алгоритмов осуществляется программной, программно-аппаратной эмуляцией и чисто аппаратными средствами[1]. Программно-аппаратные эмуляции выполняются на базе компьютеров с широко масштабным параллелизмом. Чисто аппаратными средствами реализации нейронных сетей (НС) являются многопроцессорные нейроподобные СБИС, ПЛИС и нейрочипы. Аппаратная реализация НС алгоритмов является самым быстродействующим, но и дорогостоящим вариантом.

На сегодняшний день достигнут предел увеличения вычислительной мощности одноядерных вычислительных процессоров, базирующийся на увеличении тактовой частоты и архитектурных инновациях[2].

Ведущие изготовители микроэлектронных компонентов для сохранения тенденций роста производительности, переходят на разработку многоядерных процессоров с новой архитектурой, обеспечивающих распараллеливание обработки данных.

Появление многоядерных процессоров является качественным скачком на пути создания эффективных супервычислителей, обладающих существенно более высокими показателями производительность/стоимость, по сравнению с существующими высокопроизводительными системами вычислений на базе суперЭВМ и кластерных систем.

Многоядерные процессоры в силу своих исключительных вычислительных возможностей являются наиболее перспективными средствами аппаратной поддержки нейросетевых и информационных технологий, связанных с интенсивными вычислениями.

Использование многоядерных процессоров предоставляет гибкие возможности в части варьирования конфигураций и масштабирования мощности вычислительных систем от персональных компьютеров, рабочих станций, серверов до кластерных систем [3].

Среди многоядерных процессоров в настоящее время наибольший интерес представляют многоядерные графические и вычислительные микропроцессоры.

Графические микропроцессоры с параллельной архитектурой. В последнее десятилетие наблюдается стремительное развитие графической аппаратуры или GPU(Graphics Processing Unit). Современные GPU содержат полностью программируемые параллельные геометрические и пиксельные процессоры с полным и мощным набором команд для выполнения арифметических и логических операций с поддержкой 32-битного формата векторных и скалярных операций с плавающей точкой. Для быстрой обработки больших графических наборов данных (вершин и фрагментов) используют потоковую модель обработки с параллелизмом. В связи с этим возникло направление по использованию GPU для неграфических вычислений, получившее название GPGPU (GP - General Purpose GPU). Оно стимулировалось двумя основными факторами:

-критерием производительность/стоимость. Вычислительная мощность современных GPU при приблизительно одинаковой стоимости превышает возможности центральных процессоров (CPU) персональных компьютеров;

-темпами роста производительности GPU (рис. 1), удваиваемой каждые 6 месяцев, что быстрее, чем рост производительности CPU, которая в среднем удваивается каждые 18 мес. (по закону Мура), и эта тенденция будет сохраняться, благодаря параллелизму, присущему аппаратуре современных GPU[4].

Используя массивный параллелизм и векторные процессоры, современные графические устройства способны исполнять многие из приложений, ранее реализованных на векторных (SIMD) суперкомпьютерах. В настоящее время сфера использования GPU расширяется, благодаря программируемости GPU на высокоуровневых языках программирования. На GPU сегодня эффективно реализованы задачи физического моделирования, операции линейной алгебры, решение дифференциальных уравнений в частных производных, обработка сигналов и изображений, нейросетевая обработка и др.

В настоящее время по своим показателям наилучшим является графический процессор GeForce 8800 (G80)ф. nVidia[5]. Его основные характеристики: технология 90 нм; 681 млн. транзисторов; унифицированная архитектура: массив 128 (блоками 8х16) скалярных ALU с плавающей точкой (поддержка FP 32бит точности в рамках стандарта IEE 754); 384 бит шина памяти; 6 независимых контроллеров памяти шириной 64 бита, поддержка GDDR4 (1.8Ггц); частота ядра 575 МГц (G80 GTX); ALU работают на удвоенной частоте (1.35ГГц для 8800GTX); масштабируемость архитектуры (реконфигурирование контроллеров памяти, процессорных блоков). Блок из 16 ALU (в контексте графической специализации) является шейдерным процессором. Каждый такой процессор снабжен собственным КЭШем первого уровня. Входные данные не кэшируются , а идут потоком. ALU работают на удвоенной частоте и, соответствуют или превосходят (в зависимости от операций в шейдере) 8 четырехкомпонентных векторных ALU предшествующих моделей GPU (G70) на равной базовой частоте ядра.



Рис. 1 Производительность современных GPU относительно CPU Intel Pentium 4

Графическая плата с чипом GeForce 8800 обеспечивает суперкомпьютерные возможности. Пиковая производительность плавающей арифметики нового ускорителя превышает любой из доступных сейчас настольных процессоров. NVIDIA приводит следующие показатели пиковой производительности передовых на сегодня GPU [5]:

Таблица 1. Характеристики пиковой производительности современных GPU

Графический процессор

G71(nVidia)

R580(ATI)

GeForce 8800(nVidia)

Операции

Vec3+scalar MAD

Vec3+scalar MAD

Vec3+scalar ADD

Scalar MAD+

Scalar MUL

Число параллельных процессорных элементов

48

48

128

Тактовая частота ALU(GHz)

0.65

0.65

1.35

Пиковая производительность

GFlops(GMuls)

125

125

345

NVIDIA также приводит цифры прироста от 10х и до нескольких сотен раз в зависимости от задачи при сравнении G80 c двухядерным Intel Core2 duo на частоте 2.66 ГГц [5]: Унифицированная архитектура G80 обладает гибкостью, достаточной не только для графических приложений, но и более серьезных задач - математического и физического моделирования, распознавания образов, обработки изображений, нейросетевых вычислений и других задач потоковой обработки. Для эффективной поддержки неграфических приложений для чипов NVIDIA создана среда программирования – “CUDA” (Compute Unified Device Architecture) -унифицированная вычислительная архитектура для различных задач, содержащую специальный SDK, API и компилятор. С, обеспечивающие быструю разработку и адаптацию программ, для исполнения на GPU.

Мультиядерные микропроцессоры CELL. В феврале 2005 года компания IBM совместно с компаниями Sony и Toshiba представила прототип нового процессора под кодовым названием CELL. Процессор основан на новой архитектуре компании IBM, которая называется “ CELLular architecture”[6]. Кристалл содержит 64-разрядное управляющее ядро с архитектурой Power и восьми синергетических 32-разрядных процессорных ядер (Synergistic Processing Element, SPE) c SIMD архитектурой, работающих на частоте порядка 3,2 ГГц, поддерживающих операции с плавающей запятой. Чип изготавливается по 90-нанометровой технологии и содержит 234 млн. транзисторов. Кэш-память L1 объемом 256 кбайт и L2 объемом 512 кбайт на каждое ядро. Производительность нового процессора составляет 250 GFlops. Современные процессоры Intel по меньшей мере в 10 раз медленнее, чем новый процессор CELL.

SPE соединяются по внутренней кольцевой шине Element Interconnect Bus, по которой передаются данные между единицами SPE, быстродействующей памятью и контроллерами ввода/вывода. Скорость обработки данных CELL может составить 16 Гбайт в секунду. CELL способен адресовать до 64 Гбайт памяти. CELL можно применять как одиночный процессор или в составе многопроцессорной системы - его шина ввода/вывода предусматривает возможность прямого соединения с другими CELL. Для соединения нескольких процессоров CELL используется специальный коммутатор.

Первоначально процессор CELL будет применяться в графических станциях Play Station 3, позже в компьютерах корпоративного класса, в серверах, суперкомпьютерах. Серверы на базе CELL будут ориентированы на задачи, требующие интенсивных вычислений: графической визуализации, обработки данных сейсморазведки, обработки космических изображений и картографии, шифрование и сжатие данных.


Мультиядерные микропроцессоры Intel Core. В ноябре 2006 г.- компания Intel представила первые четырехядерные процессоры нового поколения на базе многоядерной процессорной архитектуры Intel Core под шифром Kentsfield с названием Core 2 Extreme QX6700[7].

К инновациям, реализованными в новом поколении процессорной архитектуры Intel: Core относятся [10]:

-Технология Intel Wide Dynamic Execution призвана обеспечить выполнение большего количества команд за каждый такт (до четырех), повышая эффективность выполнения приложений и сокращая энергопотребление.

-Технология Intel Intelligent Power Capability, активируя отдельные узлы чипа только по мере необходимости, значительно снижает энергопотребление системы в целом.

-Технология Intel Advanced Smart Cache подразумевает наличие общей для всех ядер кэш-памяти L2, совместное использование которой снижает энергопотребление и повышает производительность. Технология Intel Smart Memory Access повышает производительность системы, сокращая время отклика памяти и оптимизируя, таким образом, использование пропускной способности подсистемы памяти.

-Технология Intel Advanced Digital Media Boost позволяет обрабатывать все 128-разрядные команды SSE, SSE2 и SSE3, широко используемые в мультимедийных и графических приложениях, за один такт, что увеличивает скорость их выполнения.

Процессоры Kentsfield состоят из двух двуядерных ядер на базе архитектуры Conroe, помещенные на единую подложку в единый корпус. Основные характеристики процессоров Core 2 Extreme QX670: производство по 65-нм техпроцессу; количество процессорных ядер - 4; число транзисторов 582 миллионов; рабочая частота - 2,67 ГГц; 1066 МГц системная шина; объем кэш-памяти второго уровня - по 4 Мбайт на ядро; потребляемая мощность - 120 Вт. Теоретическая пиковая производительность порядка 4х(10-12) = 40-50MFlops.Следующим шагом станут четыре процессора на едином кристалле с общим кэшем L2[8]. На середину 2007 года намечен переход на 45-нм техпроцесс. Это позволит начать в 2008 г. выпуск первых 8-ядерных процессоров[9].

Следующие поколения микропроцессоров на базе архитектуры Intel Core будут содержать ещё большее количество ядер на одном чипе. В 2009 году, благодаря субмикронной ультрафиолетовой литографии (EUV), Intel планирует перейти на техпроцесс 32 нанометра.

Мультипроцессоры Intel Core планируется использовать на серверных, настольных и мобильных системах.

Предполагается[5], что через 5-10 лет графические ускорители, идущие по пути все большей универсальности и гибкости и центральные процессоры, идущие по пути все большего параллелизма, сойдутся в едином продукте. Один чип будет содержать в себе набор, возможно, разнородных ядер, как выделенных вычислительных или графических, так и общего назначения.

Выводы. Современные и последующие поколения графических процессоров являются более предпочтительными для эффективной реализации на них нейрокомпьютерных конфигураций по сравнению с многоядерными микропроцессорами типа CELL и Intel Core. Это объясняется упрощением структуры параллельных ядерных элементов GPU, что позволяет реализовать при одинаковых техпроцессах и площадях большее число ядер и обеспечивать лучшие показатели производительность/стоимость. Вышесказанное можно отнести и к будущим гибридным мультипроцессорам с разнородными вычислительными и графическими ядрами.

В настоящей статье изложены результаты, полученные в рамках проекта по разработке пакета программ для решения инженерных задач с плотными системами уравнений со сверхбольшим числом неизвестных (тема ИТ-13.3/001. Решение Конкурсной комиссии Роснауки № 3/протокол от 04 июля 2005г. № 16). В проекте использовались современные графические платы с параллельной архитектурой для построения масштабируемых кластерных нейрокомпьютерных конфигураций и реализации на них нейросетевых алгоритмов обработки сложных сигналов, изображений и других задач [3].

Литература

  1. Аляутдинов М.А., Галушкин А.И., Назаров Л.Е. Методы распараллеливания и программно-аппаратной реализации нейросетевых алгоритмов обработки изображений”, Москва, “Нейрокомпьютеры” №2, 2003 , с.3-21

  2. Зюбин В. Многоядерные процессоры и программирование. "Открытые системы",#07-08, 2005 год // Издательство "Открытые системы" . http://www.osp.ru/os/2005/07-08/012.htm.

  3. Аляутдинов М.А, Галушкин А.И., Троепольская Г.В. Использование графических процессоров с параллельной архитектурой для построения масштабируемых нейрокомпьютерных конфигураций. Москва, “Нейрокомпьютеры” №8-9,2006 , с.18-28

  4. Jown D.Owens, David Luebke, Naga Govindaraju, Mark Harris, Jens Kruger, Aaron E. Lefohn, Timothy J. Purcell. A survey of General-Purpose Computation on Graphics Hardware. Eurographics 2005, State of the Art Reports, August 2005, pp.21-51

  5. Воробьев А., Медведев А. NVIDIA GeForce 8800 GTX (G80). http://www.ixbt.com/video2/g80-part1.shtml

  6. Introduction to the Cell multiprocessor. by J. A. Kahle, M. N. Day,H. P. Hofstee,C. R. Johns,T. R. Maeurer, and D. Shippy. IBM journal of research and development. POWER5 and Packaging.Volume 49, Number 4/5, 2005

  7. Официальный релиз Core 2 Extreme QX6700 aka Kentsfield.: 03.11.2006. http://www.webscaner.ru/newsprint-1348.html

  8. Чеканов Д.Core 2 Quad (Kentsfield): тесты первого четырёхядерного процессора Intel .http://www.thg.ru/cpu/intel_core_2_quadro_kentsfield/index.html

  9. Четырехъядерные процессоры Intel Kentsfield. http://www.nicom-media.ru/articles/?prod_id=10165

  10. Романченко В. Эволюция многоядерной процессорной архитектуры Intel Core: Conroe, Kentsfield, далее по расписанию. 27/06/2006. http://www.3dnews.ru/cpu/new_core_conroe/print.




PERSPECTIVE HARDWARE AND SOFTWARE EMULATORS OF NEURAL NETWORKS ON THE BASIS OF MULTICORE MICROPROCESSORS WITH PARALLEL ARCHITECTURE

Alyautdinov M., Galushkin A., Troepolskaya G.

Scientific Research Institute of the Automatic Equipment it Academician V.S. Semenikhin

The problem of creation effective scalable neurocomputers configurations is actual through of the expansion of sphere of application neuralnetwork technologies.

At present manufacturers of microprocessors for maintenance of tendencies of growth of performance pass to development of multicore processors with the parallel architecture, possessing essentially higher parameters performance/cost in comparison with existing systems of calculations on the basis of the super computer and cluster systems.

Among multicore processors now the greatest interest is represented with modern multicore graphic and computing microprocessors.

In paper modern graphic and multicore microprocessors with parallel architecture (G80 nVidia, CELL (IBM) and Intel Core) for creation effective by criterion performance/cost scalable neurocomputer configurations are considered.

In paper the results received within the frame of the project on development of the software package for the decision of engineering problems with dense systems of the equations with huge number of unknown variables (theme ИТ-13.3/001. The decision of Competitive commission Rosnauki № 3 / protocol from July, 04th 2005ú. № 16). In the project modern graphics processing units with parallel architecture for construction scalable cluster neurocomputer configurations and realization on them neuralnetwork algorithms of processing complex signals, images were used.

On the basis of the executed development and the analysis of tendencies of development of microprocessors the conclusion is done, that modern and subsequent generations of graphic processors are more preferable to effective realization on them neurocomputer configurations in comparison with multicore microprocessors of type CELL and Intel Core. It speaks simplification of structure of parallel core elements GPU that allows to realize at identical technology and the areas greater number of cores to provide the best parameters performance/cost.



  1   2   3

Похожие:

Нейрокомпьютерная обработка сигналов и изображений перспективные программно-аппаратные эмуляторы нейронных сетей на базе мультиядерных микропроцессоров с параллельной архитектурой iconФ. Уоссермен Нейрокомпьютерная техника
В книге американского автора в общедоступной форме излагаются основы построения нейрокомпьютеров. Описаны структура нейронных сетей...
Нейрокомпьютерная обработка сигналов и изображений перспективные программно-аппаратные эмуляторы нейронных сетей на базе мультиядерных микропроцессоров с параллельной архитектурой iconФ. Уоссермен Нейрокомпьютерная техника
В книге американского автора в общедоступной форме излагаются основы построения нейрокомпьютеров. Описаны структура нейронных сетей...
Нейрокомпьютерная обработка сигналов и изображений перспективные программно-аппаратные эмуляторы нейронных сетей на базе мультиядерных микропроцессоров с параллельной архитектурой iconФ. Уоссермен Нейрокомпьютерная техника
В книге американского автора в общедоступной форме излагаются основы построения нейрокомпьютеров. Описаны структура нейронных сетей...
Нейрокомпьютерная обработка сигналов и изображений перспективные программно-аппаратные эмуляторы нейронных сетей на базе мультиядерных микропроцессоров с параллельной архитектурой iconФ. Уоссермен Нейрокомпьютерная техника
В книге американского автора в общедоступной форме излагаются основы построения нейрокомпьютеров. Описаны структура нейронных сетей...
Нейрокомпьютерная обработка сигналов и изображений перспективные программно-аппаратные эмуляторы нейронных сетей на базе мультиядерных микропроцессоров с параллельной архитектурой iconАдаптивная обработка сигналов
Обработки сигналов» и «Радиотехнические цепи и сигналы». Знания и навыки, полученные при изучении дисциплины «Адаптивные системы»,...
Нейрокомпьютерная обработка сигналов и изображений перспективные программно-аппаратные эмуляторы нейронных сетей на базе мультиядерных микропроцессоров с параллельной архитектурой iconИсследование нейронных сетей с контуром настройки
Он же был разработчиком первых нейрокомпьютеров – персептронов. Причем. По нашему твердому убеждению именно постоянная ориентация...
Нейрокомпьютерная обработка сигналов и изображений перспективные программно-аппаратные эмуляторы нейронных сетей на базе мультиядерных микропроцессоров с параллельной архитектурой iconЛитература. Обработка изображений
Ярославский Л. П. Цифровая обработка сигналов в оптике и голографии. М.: Радио и связь, 1987. 296 с
Нейрокомпьютерная обработка сигналов и изображений перспективные программно-аппаратные эмуляторы нейронных сетей на базе мультиядерных микропроцессоров с параллельной архитектурой iconИнформационно-измерительный комплекс спектрального анализа на базе программно-аппаратных средств компании national instruments spectrum ana
Ктура программно-аналитического комплекса анализа вторичных параметров спектральных характеристик, обеспечивающего исследование сигналов,...
Нейрокомпьютерная обработка сигналов и изображений перспективные программно-аппаратные эмуляторы нейронных сетей на базе мультиядерных микропроцессоров с параллельной архитектурой iconАлгоритмы и программная система классификации полутоновых изображений на основе нейронных сетей
Работа выполнена в Томском государственном университете систем управления и радиоэлектроники
Нейрокомпьютерная обработка сигналов и изображений перспективные программно-аппаратные эмуляторы нейронных сетей на базе мультиядерных микропроцессоров с параллельной архитектурой iconЦифровая обработка многомерных сигналов модифицированный билатеральный фильтр для улучшения качества jpeg-изображений
Для удаления блочного эффекта в сжатых изображениях можно использовать билатеральный фильтр (БФ) [4, 5]. Однако прямое его применение...
Разместите кнопку на своём сайте:
Библиотека


База данных защищена авторским правом ©lib.znate.ru 2014
обратиться к администрации
Библиотека
Главная страница