принципы адаптации вычислительных алгоритмов к архитектуре графических акселераторов




Скачать 28.38 Kb.
Названиепринципы адаптации вычислительных алгоритмов к архитектуре графических акселераторов
Дата16.02.2013
Размер28.38 Kb.
ТипДокументы

УДК

Принципы адаптации вычислительных алгоритмов

к архитектуре графических акселераторов


С.М. Вишняков, гр. 6538, кафедра КТ

Санкт-Петербургский государственный университет информационных технологий, механики и оптики


Руководитель – директор НИИ НКТ СПбГУ ИТМО, д.т.н., профессор А.В. Бухановский


В последние годы интенсивное развитие получила специфическая отрасль высокопроизводительных вычислений – расчеты на системах с параллельными акселераторами, как дополнительными устройствами, принимающими на себя существенную часть вычислительной нагрузки работающего приложения. К таким устройствам относятся, в частности, графические акселераторы [1–8], которые по сути являются многопроцессорными системами SIMD-архитектуры с достаточно высокой (до 1 ТФлоп/с) пиковой производительностью. Предметом исследования данной работы являются особенности отображения вычислительных алгоритмов на графические акселераторы («GPU-устройства») nVidia [9], представляющие собой набор вычислительных узлов – мультипроцессоров, имеющих доступ к данным, хранящимся в памяти самого GPU-устройства.

Целью работы является изучение ключевых особенностей отображения вычислительных алгоритмов на GPU-архитектуру, выявление ряда факторов, влияющих на получаемую производительность, и исследование их влияния. Работа состоит из трех глав. В первой главе приводится описание архитектуры исследуемого графического акселератора и средств отображения вычислительных алгоритмов на данную архитектуру. В качестве примеров вычислительных алгоритмов, отображаемых на GPU-архитектуру, в данной работе были выбраны две задачи: задача параметрической аппроксимации функции двух переменных с использованием метода случайного поиска [10, 11] и задача выделения ключевых точек на изображении при помощи алгоритма Scale-invariant feature transform (SIFT) [12, 13]. Описание этих алгоритмов также приводится в первой главе. Во второй главе описываются способы отображения исследуемых алгоритмов на архитектуру GPU-устройства. В третьей главе производится анализ результатов отображения этих алгоритмов на исследуемую архитектуру.

В результате выполнения данной работы были предложены и реализованы три варианта адаптации алгоритма параметрической аппроксимации спектров климатического волнения методом случайного поиска и способы адаптации всех этапов алгоритма поиска ключевых точек SIFT к архитектуре графических акселераторов. Результаты вычислительных экспериментов на задаче аппроксимации климатических спектрах морского волнения показывают, что адаптация алгоритма параметрической оптимизации к архитектуре GPU позволяет получить ускорение более 30 раз по сравнению с реализацией без использования GPU. Учитывая, что стоимость простейшей кластерной системы на основе стандартных комплектующих, обеспечивающих такое же ускорение, примерно в 30 раз превышает стоимость рассматриваемого GPU-устройства, это подтверждает целесообразность применения GPU-устройств при решении вычислительных задач подобного класса. Результаты вычислительных экспериментов на задаче поиска ключевых точек алгоритмом SIFT показали, что адаптация этого алгоритма к GPU-архитектуре, учитывающая особенности данной архитектуры, позволяет получить ускорение в 8-9 раз по сравнению с реализацией без GPU, что позволяет обрабатывать изображения небольших разрешений в режиме реального времени. Предложенная в работе модель производительности упрощает выбор оптимальной конфигурации ядра при использовании ядер, для которых при изменении конфигурации пропорционально изменяется количество входных данных.

ИСТОЧНИКИ

  1. Hasle G., Lie K.-A., Quak E. Geometric Modelling, Numerical Simulation, and Optimization: Applied Mathematics at SINTEF – Springer, 2007.

  2. General-Purpose Computation Using Graphics Hardware: [http://gpgpu.org/]

  3. Purcell T.J., Donner C., Commarano M., Jensen H.W., Hanrahan P. Photon mapping on programmable graphic hardware // Proceeding of the ACM SIGGRAPH/EUROGRAPHICS Conference on Graphics Hardware – Eurographics Association, 2003. – pp. 41-50.

  4. Göddeke M., Strzodka R., Turek S. Accelerating Double Precision FEM Simulations with GPUs // Proceeding of ASIM 2005 – 18th Symposium on Simulation Technique, 2005. – pp. 139-144.

  5. Hagen T.R., Henriksen M.O., Hjelmervik J.M., Lie K.-A. Using the graphic processor as a high-performance computational engine for solving system of hyperbolic conservation low // Geometric Modelling, Numerical Simulation, and Optimization: Applied Mathematics at SINTEF – Springer, 2007, pp. 211-264.

  6. Hagen T.R., Hjelmervik J.M., Lie K.-A., Natvig J.R., Henriksen M.O. Visual simulation of shallow-water waves // Simulation Practice and Theory. Special Issue on Programmable Graphics Hardware, 13(9), 2005. – pp. 716-726.

  7. Hagen T.R., Lie K.-A., Natvig J.R. Solving the Euler equation on graphical processing units // Computational Science – ICCS 2006: 6th International Conference, Reading, UK, May 28-31, 2006, Proceedings, Part IV, volume 3994 of Lecture Notes in Computational Science (LNCS) – Springer Verlag, 2006. – pp. 220-227.

  8. GPUBench: How much does your GPU bench: [http://graphics.stanford.edu/projects/gpubench/]

  9. NVIDIA CUDA Compute Unified Device Architecture Programming Guide. Ver 2.1. – NVIDIA Corporation, 2008.

  10.  Boukhanovsky A.V., Lopatoukhin L.J., Guedes Soares C. Spectral wave climate of the North Sea – Applied Ocean Research, 2007.

  11.  Растригин Л.А. Адаптация сложных систем – Рига: Зинатне, 1981. 375 с.

  12.  Lowe D. G. Object recognition from local scale-invariant features. // International Conference on Computer Vision, Corfu, Greece, 1999, pp. 1150-1157.

  13. Lowe D. G. Distinctive image features from scale-invariant keypoints. // International Journal of Computer Vision, 60, 2, 2004, pp. 91-110.


Похожие:

принципы адаптации вычислительных алгоритмов к архитектуре графических акселераторов iconЗадача параметрической аппроксимации двумерной функции с использованием метода случайного поиска 10
Принципы адаптации вычислительных алгоритмов под параллельную архитектуру графических акселераторов
принципы адаптации вычислительных алгоритмов к архитектуре графических акселераторов iconОсобенности адаптации вычислительных алгоритмов под параллельную архитектуру графических акселераторов
В работе обсуждаются вопросы отображения вычислительных алгоритмов на параллельную архитектуру gpu-акселератора. В качестве примера...
принципы адаптации вычислительных алгоритмов к архитектуре графических акселераторов iconОглавление 4
Архитектура графических акселераторов, средства отображения на них вычислительных алгоритмов и исследуемые алгоритмы 10
принципы адаптации вычислительных алгоритмов к архитектуре графических акселераторов iconпринципы адаптации вычислительных алгоритмов
Целью работы является изучение ключевых особенностей отображения вычислительных алгоритмов на gpu -архитектуру, выявление ряда факторов,...
принципы адаптации вычислительных алгоритмов к архитектуре графических акселераторов iconРеферат: Шайдуров А. Г. Исследование и разработка некоторых графических алгоритмов. Квалификационная работа на степень магистра наук по направлению «Математика. Прикладная математика»
Шайдуров А. Г. Исследование и разработка некоторых графических алгоритмов. Квалификационная работа на степень магистра наук по направлению...
принципы адаптации вычислительных алгоритмов к архитектуре графических акселераторов iconАппаратное ускорение алгоритмов решения уравнений газовой динамики с применением графических процессоров

принципы адаптации вычислительных алгоритмов к архитектуре графических акселераторов iconПрограмма вступительного экзамена в магистратуру по направлению подготовки 231000. 68 «Программная инженерия»
...
принципы адаптации вычислительных алгоритмов к архитектуре графических акселераторов icon1. цели и задачи дисциплины, ее место в учебном процессе согласно гос впо в дисциплину «Вычислительные системы, сети и телекоммуникации» должно включаться
Вычислительных машин: общие принципы построения и архитектуры вычислительных машин, информационно-логические основы вычислительных...
принципы адаптации вычислительных алгоритмов к архитектуре графических акселераторов iconАлгоритмы
Основы алгоритмизации. Понятие об алгоритме. Применение алгоритмов. Свойства алгоритмов. Типы алгоритмов: линейные, циклические,...
принципы адаптации вычислительных алгоритмов к архитектуре графических акселераторов iconСодержание, основные понятия
Понятие алгоритма, свойства алгоритмов. Использование алгоритмов, система команд исполнителя. Способы записей алгоритмов. Формальное...
Разместите кнопку на своём сайте:
Библиотека


База данных защищена авторским правом ©lib.znate.ru 2014
обратиться к администрации
Библиотека
Главная страница