Оглавление 4




Скачать 391.07 Kb.
НазваниеОглавление 4
страница1/9
Дата18.04.2013
Размер391.07 Kb.
ТипДокументы
  1   2   3   4   5   6   7   8   9



ОГЛАВЛЕНИЕ


ОГЛАВЛЕНИЕ 4

Введение 6

Глава 1. Архитектура графических акселераторов, средства отображения на них вычислительных алгоритмов и исследуемые алгоритмы 10

1.1. Краткое описание архитектуры графических акселераторов 10

1.2. Средства отображения алгоритмов на архитектуру графических акселераторов 11

1.3. Задача параметрической аппроксимации двумерной функции с использованием метода случайного поиска 14

1.4. Задача поиска ключевых точек на изображении при помощи алгоритма SIFT 16

Выводы по главе 1 19

Глава 2. Отображение исследуемых алгоритмов на архитектуру графических акселераторов 20

2.1. Способы адаптации задачи параметрической аппроксимации двумерной функции с использованием метода случайного поиска к архитектуре графических акселераторов 20

2.2. Задача поиска ключевых точек на изображении при помощи алгоритма SIFT 22

Выводы по главе 2 24

Глава 3. Анализ параллельной производительности 26

3.1. Сравнение параллельных реализаций задачи аппроксимации климатических спектров 26

3.2. Влияние конфигурации ядра на получаемую производительность 27

3.3. Модель производительности 32

3.4. Производительность реализации алгоритма SIFT, использующей графический акселератор и некоторые особенности исследуемой архитектуры 37

Выводы по главе 3 51

Заключение 54

ИСТОЧНИКИ 55



Введение


В последние годы интенсивное развитие получила специфическая отрасль высокопроизводительных вычислений – расчеты на системах с параллельными акселераторами, как дополнительными устройствами, принимающими на себя существенную часть вычислительной нагрузки работающего приложения. К таким устройствам относятся: программируемые логические схемы [1], сигнальные процессоры [2], графические акселераторы [3] и т.д.

Под графическими акселераторами, или GPU (Graphic Processor Unit)-устройствами, в данном случае подразумеваются современные графические адаптеры, которые по сути являются многопроцессорными системами SIMD-архитектуры с достаточно высокой (до 1 ТФлоп/с) пиковой производительностью (рис. 1).



Рис. 1. Динамика развития производительности графических акселераторов


По сравнению с традиционными архитектурами (например, кластерами), они обладают несопоставимо низкой характеристикой «цена/производительность», что стимулирует интерес к использованию GPU-устройств не только для обработки графической информации, но и для решения произвольных вычислительных задач [4]. В частности, к таким задачам относятся сортировки больших объемов данных [5], решения систем линейных уравнений [6], уравнений математической физики [7-9] и пр.

Параллельное программирование для GPU традиционно использует графический программный инструментарий, например, на основе библиотеки OpenGL [10] или DirectX [11]. Для удобства работы с ними применяются пакеты более высокого уровня, например, Gg [12], HLSL [13] и OpenGL Shading Language [14]. Однако реализация вычислительных задач общего плана требует использования более универсальных средств, облегчающих отображение задач различного типа на архитектуру GPU-устройств и позволяющих абстрагироваться от особенностей работы графических алгоритмов. Например, компанией nVidia разрабатывается набор библиотек CUDA SDK [15], предназначенный для использования вычислительных мощностей видеокарт и, в перспективе, специализированных ускорителей вычислений для решения вычислительных задач общего назначения. Кроме того, существует ряд проектов по разработке методов и средств, предназначенных для отображения вычислительных алгоритмов на GPU-устройства различных производителей, например, языки С$ [16] и OpenCL [17].

Несмотря на высокую производительность, вычислительные акселераторы на базе GPU являются специфическим классом многопроцессорных систем, характеризуемым существенными ограничениями на масштабируемость, использование памяти и управление данными и задачами. Потому представляет интерес изучение способов отображения различных типов вычислительных алгоритмов на GPU-архитектуру с целью выявления ключевых особенностей этого процесса и факторов, влияющих на получаемую производительность.

Целью данной работы является изучение ключевых особенностей отображения вычислительных алгоритмов на GPU-архитектуру, выявление ряда факторов, влияющих на получаемую производительность, и исследование их влияния.

Работа состоит из трех глав. В первой главе приводится описание архитектуры исследуемого графического акселератора и средств отображения вычислительных алгоритмов на данную архитектуру. В качестве примеров вычислительных алгоритмов, отображаемых на GPU-архитектуру, в данной работе были выбраны две задачи: задача параметрической аппроксимации функции двух переменных с использованием метода случайного поиска [18] и задача выделения ключевых точек на изображении при помощи алгоритма Scale-invariant feature transform (SIFT) [19, 20]. Описание этих алгоритмов также приводится в первой главе. Во второй главе описываются способы отображения исследуемых алгоритмов на архитектуру GPU-устройства. В третьей главе производится анализ результатов отображения этих алгоритмов на исследуемую архитектуру.

    В результате выполнения данной работы были предложены и реализованы различные варианты адаптации алгоритма параметрической аппроксимации спектров климатического волнения методом случайного поиска и всех этапов алгоритма поиска ключевых точек SIFT к архитектуре графических акселераторов. Был проведен анализ параллельной производительности предложенных способов адаптации и сделаны выводы о целесообразности использования графических акселераторов для решения данных задач. Также было исследовано влияние различных аспектов, характерных для исследуемой архитектуры, на получаемую производительность и предложен ряд практических рекомендаций, касающихся эффективности отображения вычислительных задач на архитектуру графических акселераторов.

Результаты данной работы были представлены на конференции «Параллельные вычислительные технологии»-2008 и «Конференции молодых ученых»-2008 и -2009 и опубликованы в трудах конференции ПаВТ-2008 [21] и «Научно-техническом вестнике СПб ГУ ИТМО» [22].
  1   2   3   4   5   6   7   8   9

Похожие:

Оглавление 4 iconЮжно-Уральский государственный университет
После того, как документ готов, здесь следует вставить оглавление (меню "Вставка", команда "Оглавление и указатели…").]
Оглавление 4 iconОглавление оглавление 1 введение 2 постановка задачи 3 анализ методов решения задачи 3
Всемирная тенденция к объединению компьютеров в сети обусловлена рядом важных причин, таких
Оглавление 4 iconОглавление оглавление 2 введение 3
Так, в западной экономической системе сфера услуг играет главенствующую роль, а в промышленности на первый план выходят наукоемкие...
Оглавление 4 iconПрограмма начального общего образования сош с. Перекопное 2011 г. Оглавление. Муниципальное общеобразовательное учреждение 1 Оглавление. 2 Раздел 1 Пояснительная записка. 6 Закон РФ «Об Образовании»
«средняя общеобразовательная школа с. Перекопное ершовского района саратовской области»
Оглавление 4 iconОглавление оглавление 1
В двадцать первом веке объемы учебного материала, высокие требования к современному ученику и учителю подталкивают педагога к поиску...
Оглавление 4 iconОбщие Требования, предъявляемые к учебной литературе Общие требования
Федеральному государственному образовательному стандарту. Оглавление учебника должно соответствовать всему перечню разделов учебной...
Оглавление 4 iconИсследовательская работа 2010 год. Оглавление Сотовый телефон в нашей жизни. 1 Оглавление 2 Глава 1 Теоретическая часть «Сотовый телефон в нашей жизни»
«Осторожно! Высокое напряжение», и находится там продолжительное время. В результате, организм человека работает уже не в тех оптимальных...
Оглавление 4 icon3 оглавление

Оглавление 4 iconРуководство по Mysql оглавление

Оглавление 4 icon2011 201 оглавление
Лекция 3
Разместите кнопку на своём сайте:
Библиотека


База данных защищена авторским правом ©lib.znate.ru 2014
обратиться к администрации
Библиотека
Главная страница