Аппаратное ускорение алгоритмов решения уравнений газовой динамики с применением графических процессоров




Скачать 220.5 Kb.
НазваниеАппаратное ускорение алгоритмов решения уравнений газовой динамики с применением графических процессоров
страница1/3
Дата03.10.2012
Размер220.5 Kb.
ТипДокументы
  1   2   3

Нейрокомпьютерная обработка сигналов и изображений




CELLULAR NEURAL NETWORKS FOR AERODYNAMICS PROBLEMS

Korobkova S.

V.S. Semenikhin Scientific Research Institute of Automatic Equipment

The paper presents methods of solving aerodynamics problems using cellular neural networks.

Two specific problems are taken into consideration: wind load in built up quarters prediction and aircraft control using ejection effects. The efficiency of proposed neural network methods is demonstrated.

Two-dimensional and three-dimensional neural networks were used for these problems. Neural network dimensionality depends on the dimensionality of the problem being solved.

The following real-life aerodynamics problems are discussed in the paper:

  • The problem of F15 aircraft wing streamline;

  • The problem of Sidney opera building wind influence analysis.

The initial data for these problems are presented in the files containing aerodynamic parameters of the analyzed area such as pressure, energy, speed values for each discreet cell of the area and the geometry of the objects in the area. The estimation of the problem’s difficulty is considered to be equal to the dimensionality of the initial data, which is 1,4х107 and 4х 107 for the problem of F15 aircraft wing streamline and the problem of Sidney opera building wind influence analysis accordingly.

The proposed neural network had been realized in 3 different hardware implementations – pc implementation, classic cluster implementation and GPU implementation.

It has been shown that the resulting values of the aerodynamics parameters in the analyzed area were equal to the ones obtained using GDT environment considered to be model. Moreover the proposed methods proved to be more time-efficient even when counted using PC.

The dependence of count time on the number of node is classic cluster is shown. It is well seen that optimal number of nodes is 14 for the problem of Sidney opera building wind influence analysis and 11 for the problem of F15 aircraft wing streamline. This means that the developed system and algorithms are efficient enough to solve even more complicated tasks in terms of dimensionality and computational complexity.




АППАРАТНОЕ УСКОРЕНИЕ АЛГОРИТМОВ РЕШЕНИЯ УРАВНЕНИЙ ГАЗОВОЙ ДИНАМИКИ С ПРИМЕНЕНИЕМ ГРАФИЧЕСКИХ ПРОЦЕССОРОВ

Воронков И.М.1, Скрибцов П.В.2

1ФГУП НИИ Автоматической Аппаратуры им. В.С. Семенихина НТЦ НК,

2 ООО «ПАВЛИН ТЕХНОЛОГИИ»

1. Введение

В настоящее время получили распространение алгоритмы численного решения системы нелинейных нестационарных уравнений динамики вязкого, сжимаемого, теплопроводного газа при наличии диффузии и химических реакций в плоской, ассиметричной и трехмерной постановках. Типичная система уравнений, решаемая для случая горения «горючая смесь -> продукты» имеет вид (1). Первые три уравнения выражают законы сохранения массы, импульса и энергии, четвертое – изменение концентрации, пятое – уравнение состояния. Для описания процесса горения используется Аррениусовское соотношение для скорости химической реакции.

Система уравнений (1) решается численно с помощью модифицированного метода крупных частиц.

Метод крупных частиц - одна из разновидностей методов частиц, широко используемая в современных исследованиях. Разработка метода крупных частиц проводилась О.М.Белоцерковским и Ю.М.Давыдовым в ВЦ АН СССР, начиная с 1965 года [1]. Эта разработка явилась развитием идей метода частиц в ячейках (PIC) Ф. Харлоу. Если отвлечься от физики, то с точки зрения вычислительного алгоритма решения системы (1), он устроен следующим образом. Есть трехмерный объем газа, представляющий собой массив структур такого типа:

struct PWNGasCell {

float u; // x- компонента скорости в ячейке

float v; // y- компонента скорости

float w; // z- компонента скорости

float e; // внутренняя энергия

float p; // давление

float ro; // плотность

float gamma; // показатель адиабаты

float type; // тип ячейки (газ, постоянный газ, стенка, твердое тело, и т.п.)

};

Тип ячейки (компонента type) имеет тип float для однородности структуры данных, хотя, по-сути, там хранятся натуральные числа. Для каждого момента времени, необходимо по всему газу сделать два прохода, и на каждом проходе для каждой ячейки выполнить вычисления, в которых участвуют 6 сильно связанных соседей (слева, справа, сверху, снизу, спереди и сзади). К сожалению, мощности современных процессоров, крайне недостаточно для быстрого решения таких задач. Это легко объяснить «размерностью» задачи, если размерностью в данном случае назвать число ячеек, как число независимых переменных задачи. Легко подсчитать, что для газа, объема 1000х1000х1000 ячеек, и около 100 операций с плавающей точкой для каждой ячейки, для выполнения одной итерации в секунду (двух проходов) требуется вычислитель с производительностью около 200 GFLOPS, что намного превышает показатели современных ПЭВМ. Использование кластера затрудняет высокую степень обмена данными между вычислительными узлами. В данной работе рассматривается подход применения технологии GPGPU (General Programming on Graphics Processing Units) [2] для решения упомянутых проблем. Данная технология зарекомендовала себя в большой сфере вычислительных алгоритмов, в частности, в сфере нейросетевых алгоритмов [3].

(

    2. Технология GPGPU

    В настоящее время существует несколько компаний мирового масштаба, таких как NVIDIA, ATI, которые производят общедоступные вычислители, встраиваемые в материнские платы персональных компьютеров, предназначенных (специализированных) для ускорений графических вычислений. Как правило, такие вычислители называются «графическими платами» или «графическими картами» (Graphics Processing Unit = GPU) и используются, в основном, в индустрии компьютерных игр и симуляторов, предоставляя широкому кругу пользователей возможности интерактивной, высокореалистичной, компьютерной графики, требующей высоких вычислительных мощностей. Компании-производители графических плат постоянно выпускают новые версии своих систем, используют передовые достижения в области элементной базы для получения максимальных показателей по скорости расчета, доступных для текущего уровня техники. Начиная с 2000 г., вычислительная мощность графических плат начала устойчиво обгонять мощность процессоров общего назначения, производимых компаниями Intel, AMD, IBM (см. рис.1).



1)




Рис. 1. Тенденции роста производительности аппаратных вычислителей в миллиардах операций с плавающей точкой (цитата материалов c сайта www.gpgpu.org)

    На настоящий момент, к примеру, графическая плата NVIDIA 7800 GTX превосходит по вычислительной мощности процессоры Intel Pentium IV 4Ghz, как минимум, на порядок величины. Массовость выпуска графических карт позволяет компаниям-производителям установить на них относительно низкую стоимость на рынке, по сравнению со специализированными аппаратными ускорителями алгоритмов, разрабатываемыми под конкретную задачу. Графические платы доступны в широкой продаже любому пользователю персональной ЭВМ современной конфигурации, при этом они позволяют достигнуть существенно более высокого уровня производительности вычислений (~10 GFLOPS). Стоит отметить, что компания NVIDIA выпустила технологию SLI, которая при наличии специальной материнской платы позволяет практически прозрачно для GPU-программы работать одновременно с двумя GPU платам, распараллеливая вычисления. Указывается, что подобный подход может привести к ускорению вычислений до 1.9 раз. Использование сдвоенных карт одновременно с технологией SLI (технология QUAD) позволяет достичь еще большей скорости вычислений на GPU (ускорение до 4 раз по сравнению с одной картой). Таким образом, использование GPU позволяет на одной персональной ЭВМ организовывать вычисления с такой производительностью, которая могла бы быть доступна только на дорогих кластерных системах.

3. Общая схема GPU-алгоритма

Для привлечения в качестве аппаратного ускорителя графического процессора, необходимо загрузить в графическую плату поочередно все слои трехмерного объема, причем для каждого слоя необходимо иметь в памяти графической платы соседский слой «слева» и соседский слой «справа» (см. Рис. 2).



Рис. 2. Схема представления структуры данных в текстурах графической платы

Поскольку механизм текстур графической платы позволяет записывать только 4 числа с плавающей точкой на один элемент изображения, для представления структуры данных, упомянутой выше, требуется пара последовательных пикселей. Как следствие, размер текстуры, получается, по ширине в 2 раза больше, чем размер рассчитываемого объема газа. Отрисовка специализированного графического примитива, вызывает для каждой ячейки вызов пользовательской микропрограммы, заданной, например, на языке Cg [4]. В теле микропрограммы выполняются вычисления, соответствующие системе уравнений (1), а результаты укладываются, в текстуру, которая затем, выгружается в память центрального процессора для участия в следующих проходах или, непосредственно визуализации или записи на постоянный носитель.

4. Результаты и направление дальнейших исследований

Сравнение с аналогичным алгоритмом, выполняемым на процессоре Pentium 2 Ghz (CPU), показало преимущество по скорости выполнения до 5 раз, с применением одной карты NVidia 7800 GTX (GPU). Однако дальнейшая оптимизация С++ кода CPU сократила разрыв в скорости вычислений относительно GPU-алгоритма до 2.5 раз. Дальнейшие направления исследований должны быть направлены на оптимизацию кода для GPU, которая позволит улучшить показатели. В частности, из-за невозможности в теле одной микропрограммы записывать результаты вычислений более чем в один пиксель выходной текстуры, для каждого элемента приходилось повторять значительное количество общих вычислений. Такая проблема отсутствует для CPU. Для решения данной проблемы необходимо воспользоваться механизмом «multiple render targets», позволяющим записывать значения сразу в несколько выходных текстур. Структура данных при этом должна усложниться по сравнению с рис. 2, а именно наборы переменных «u,w,v,e» и «p,r,g,t» должны быть разнесены в разные слои, и таким образом, при каждом вызове микропрограммы, необходимо будет работать не с 3 входными текстурами, а с 6. Дополнительно компания NVIDA сообщает о новом подходе к программированию графических вычислителей, названном CUDA (Compute Unified Device Architecture) [5], позволяющих существенно более эффективно строить вычислительные алгоритмы на базе графических плат нового поколения, таких как NVIDA GeForce 8800 [6]. Предположительно, это позволит достичь коэффициента ускорения не менее чем 10 раз, по сравнению с оптимизированным алгоритмом для Pentium IV.

Литература

  1. 3. О.М.Белоцерковский, Ю.М.Давыдов. Метод крупных частиц в газовой динамике. // М: Наука, 1982.

  2. General Programming on Graphics Processing Units // http://www.gpgpu.org

  3. Скрибцов П.В. Аппаратное ускорение нейросетевых алгоритмов с применением графических процессоров // Труды III международной конференции «Параллельные вычисления и задачи управления», Институт Проблем Управления РАН, Москва, Октябрь, 2006, ISBN 5-201-14990-1

  4. Язык Nvidia Сд // http://developer.nvidia.com/page/cg_main.html

  5. Технология CUDA // http://developer.nvidia.com/object/cuda.html

  6. GPU nVidia GeForce 8800 // http://www.nvidia.com/page/geforce8.html




HARDWARE ACCELERATION OF GAS DYNAMICS COMPUTATION PROBLEM USING GRAPHICAL PROCESSORS

Voronkov I.1, Skribtsov P.2

1 V.S. Semenikhin Scientific Research Institute of Automatic Equipment, 2 Pawlin Technologies, Ltd

In present time a number of gas dynamics computational algorithms exist. GPU approach enables 2.5 times improvement in the speed of calculations compared with an highly optimized single Pentium IV CPU-based computational algorithms, although theoretical performance limits of the GPU cards were not yet achieved. Futher investigations should be aimed on the new technology called CUDA (Compute Unified Device Architecture) that provides the base for creating more effective GPU algorithms that will make it possible to approach theoretical calculations performance limits of such new generation GPU as NVIDA GeForce 8800 and receive the speed-up of at least an order of magnitude.




НЕЙРОСЕТЕВОЙ СИНТЕЗ МИКРОПОЛОСКОВОЙ АНТЕННЫ С ВОЗБУЖДЕНИЕМ КОАКСИАЛЬНЫМ ЗОНДОМ

Казанцев П.А.

ФГУП НИИ Автоматической Аппаратуры им. В.С. Семенихина НТЦ Нейрокомпьютеры

Введение

В настоящее время нейронные сети активно применяются в задачах синтеза СВЧ-устройств, в том числе и полосковых антенн. Основной целью данного применения является ускорение процесса синтеза. Классические методы синтеза антенн и СВЧ-устройств зачастую требуют множество циклов расчета численной электромагнитной модели на ЭВМ. Под расчетом антенны здесь понимается вычисление электрических параметров антенны по ее геометрическим параметрам. Современный стандартный подход к проектированию антенн основывается на использовании моделирующих программных пакетов (МПП), которые базируются на математических моделях антенн. Проектировщик антенны, имея в наличии заданные заказчиком электрические характеристики, конструирует в МПП модель антенны с некоторыми геометрическими параметрами. Выбор типа антенны, а также геометрических параметров основывается исключительно на его личном опыте. Далее, он запускает расчет электрических параметров в МПП. Опытному разработчику антенн требуется запустить множество проходов МПП, чтобы получить антенну с желаемыми электрическими характеристиками. Каждый проход МПП может занимать до 9 часов счета на современном универсальном ПК. При этом, если через какое-то время разработчику опять придется подбирать геометрию антенны такого же типа, но уже для получения несколько других электрических характеристик, то ему придется таким же образом, посредством множества прогонов МПП, рассчитывать геометрию антенны. Ситуация становится совсем неприемлемой, когда полученную антенну требуется оптимизировать по какому-либо параметру, зависящему от геометрических параметров (например, по массе антенны).

В то время как МПП рассчитывает электрические параметры антенны по геометрическим параметрам, можно решать обратную задачу – вычисление геометрических параметров антенны по заданным электрическим [1]. Так, разработчик антенны может создать нейросетевую обратную модель антенны, сохранить данную модель для использования в будущих проектах, и затем использовать ее для нахождения геометрии антенны непосредственно, без необходимости многократного запуска МПП[3]. Разумеется, разработка нейросетевой модели не может обойтись без использования программного обеспечения для численного расчета антенн проведения непосредственных измерений, однако, полученная нейросетевая модель позволит значительно сократить время проектирования каждого конкретного варианта антенны.

Нейросетевой синтез однослойной микрополосковой антенны (МПА) с возбуждением пластины коаксиальной линией.

Микрополосковые антенны (МПА) приобрели широкую популярность за последние два десятилетия благодаря целому ряду преимуществ перед традиционными антеннами, вытекающих из особенностей их конструкции – пригодностью для массового изготовления (технологичностью) и малым весом.

Выберем в качестве примера для задачи синтеза антенн нейросетевым методом однослойную микрополосковую антенну (МПА) с возбуждением коаксиальным зондом. Обозначения элементов и основные геометрические размеры МПА приведены на рис.1.
  1   2   3

Похожие:

Аппаратное ускорение алгоритмов решения уравнений газовой динамики с применением графических процессоров iconМ. Е. Жуковский, Р. В. Усков о применении графических процессоров видеоускорителей в прикладных задачах
В работе рассмотрены основы применения технологии nVidia© cuda для распараллеливания вычислений с использованием графических процессоров....
Аппаратное ускорение алгоритмов решения уравнений газовой динамики с применением графических процессоров iconRussian national committee on theoretical and applied mechanics
Алгоритмы рапараллеливания решения нестационарных уравнений газовой динамики на примерах расчета конкретных задач
Аппаратное ускорение алгоритмов решения уравнений газовой динамики с применением графических процессоров iconПрограммирование современных графических процессоров с использованием основных языков платформы. Net
Большинство современных интерактивных графических приложений основано на использовании специализированных графических процессоров...
Аппаратное ускорение алгоритмов решения уравнений газовой динамики с применением графических процессоров iconПрограмма поспецкурс у "газовая динамика"
Основные части и разделы газовой динамики. Области применения. Характерные черты газовой динамики. Качественные и оценочные данные...
Аппаратное ускорение алгоритмов решения уравнений газовой динамики с применением графических процессоров iconУрок по теме: Методы решения логарифмических уравнений
Систематизировать и обобщить знания, умения и навыки, связанные с применением методов решения логарифмических уравнений
Аппаратное ускорение алгоритмов решения уравнений газовой динамики с применением графических процессоров iconИсследование новых моделей задач математической физики и создание алгоритмов их решения. В рамках этого проекта: подпроект «Законы сохранения, инварианты, точные и приближенные решения для уравнений гидродинамического типа и интегральных уравнений»
Математические проблемы алгебры, топологии, теории приближения функций и приложения
Аппаратное ускорение алгоритмов решения уравнений газовой динамики с применением графических процессоров iconЧисленные методы газовой динамики и теплопереноса
...
Аппаратное ускорение алгоритмов решения уравнений газовой динамики с применением графических процессоров iconПроект web-syndic: web-сервер для тестирования и экспериментального анализа алгоритмов решения линейных диофантовых уравнений в неотрицательных целых числах
Целью проекта является разработка алгоритмов генерации тестовых систем оданлду различных классов, разработка web-сервера Web-SynDic...
Аппаратное ускорение алгоритмов решения уравнений газовой динамики с применением графических процессоров iconПрименение rkdg метода для численного решения задач газовой динамики
Лакса Фридрихса, кир, hll и hllc. Проведенные расчеты позволяют оценить качество различных схем. Rkdg метод имеет более высокий порядок...
Аппаратное ускорение алгоритмов решения уравнений газовой динамики с применением графических процессоров iconРадиофизический факультет
Ип в различных системах. Также содержание дисциплины направлено на обучение студентов основам решения задач линейной алгебры, решения...
Разместите кнопку на своём сайте:
Библиотека


База данных защищена авторским правом ©lib.znate.ru 2014
обратиться к администрации
Библиотека
Главная страница