Preview

Известия Юго-Западного государственного университета

Расширенный поиск

АЛГОРИТМИЧЕСКАЯ ОПТИМИЗАЦИЯ ПРОГРАММНОЙ РЕАЛИЗАЦИИ АЛГОРИТМОВ УМНОЖЕНИЯ ПЛОТНЫХ ВЕЩЕСТВЕННЫХ МАТРИЦ НА ГРАФИЧЕСКИХ ПРОЦЕССОРАХ С ПОДДЕРЖКОЙ ТЕХНОЛОГИИ OPENGL

https://doi.org/10.21869/2223-1560-2017-21-5-06-15

Полный текст:

Аннотация

Приведено описание подходов к выполнению операции умножения плотных вещественных матриц одинарной точности на видеокартах с поддержкой технологии OpenCL. Произведен обзор известных подходов к алгоритмической оптимизации процедуры умножения матриц и оценка возможности их исполь-зования с учетом особенностей организации и программирования для GPU. Сделан сравнительный анализ производительности выполняемых действий без характерных для GPU оптимизаций и с оптимизациями, который показал, что вычисления без оптимизации работы с глобальной памятью GPU имеют низкую производительность обработки данных. Оптимизация распределения данных в глобальной и локальной памяти GPU позволяет многократно сократить время вычисления и увеличить реальную производи-тельность. Для сравнения производительности разработанных программных реализаций для технологий OpenCL и CUDA выполнены идентичные расчёты на одинаковых GPU, которые показали более высокую реальную производительность при использовании CUDA-ядер. Значения производительности оценивались для всех реализаций процедуры умножения матриц. Сравнение полученных результатов показывает, что наи-более эффективным подходом среди реализованных является блочное умножение, при котором произво-дится разделение исходной матрицы на подматрицы (блоки), размещаемые в локальной памяти GPU, что позволяет экономить обращения к глобальной памяти и максимально повторно использовать данные в локальной памяти. Результаты измерения реальной достигнутой производительности на GPU NVidia GeForce GTX 960M показали величину 275,3 GFLOP/s, что приблизительно на 10-20% меньше аналогичных результатов, получаемых при аналогичных условиях вычислительного эксперимента для той же GPU с использованием инструментария CUDA.

Об авторах

Ю. А. Затолокин
ФГБОУ ВО «Юго-Западный государственный университет»
Россия


Э. И. Ватутин
ФГБОУ ВО «Юго-Западный государственный университет»
Россия


В. С. Титов
ФГБОУ ВО «Юго-Западный государственный университет»
Россия


Список литературы

1. Ватутин Э.И., Зотов И.В. Построение матрицы отношений в задаче оптимального разбиения параллельных уп-равляющих алгоритмов // Известия Курского государственного технического университета. 2004. № 2. С. 85-89.

2. Ватутин Э.И., Мартынов И.А., Титов В.С. Оценка реальной производительности современных видеокарт с поддержкой технологии CUDA в задаче умножения матриц // Известия Юго-За-падного государственного университета. Серия: Управление, вычислительная техника, информатика. Медицинское приборостроение. 2014. № 2. С. 8-17.

3. OpenGL. URL: https://ru.wikipedia.org/ wiki/ OpenGL (дата обращения: 01.02.2017).

4. APP SDK - A Complete Development Platform // AMD: website. URL: http: // developer.amd.com/tools-and-sdks/ OpenGL- zone/amd-accelerated-parallel-pro-cessing-app-sdk/ (дата обращения: 01.02.2017).

5. CUDA АЛЬМАНАХ / Май 2015 г. 5 мая 2015. NVIDIA: сайт. URL: http: //www.nvidia.ru/docs/IO/141194/ CUDA-альманах-may-2015.pdf (дата обращения 01.02.2017).

6. Ватутин Э.И., Мартынов И.А., Титов В.С. Оценка реальной производительности современных процессоров в задаче умножения матриц для однопоточной программной реализации // Известия Юго-Западного государственного университета. Серия: Управление, вычислительная техника, информатика. Медицинское приборостроение. 2013. № 4. С. 11-20.

7. Казеннов А.М. Основы технологии CUDA и OpenGL // НОЦ СКТ МФТИ: сайт. URL: http://hpc.mipt.ru/ wp-content/ uploads/ 2013/11/ CUDA+ OpenGL.pdf (дата обращения 01.02.2017).


Для цитирования:


Затолокин Ю.А., Ватутин Э.И., Титов В.С. АЛГОРИТМИЧЕСКАЯ ОПТИМИЗАЦИЯ ПРОГРАММНОЙ РЕАЛИЗАЦИИ АЛГОРИТМОВ УМНОЖЕНИЯ ПЛОТНЫХ ВЕЩЕСТВЕННЫХ МАТРИЦ НА ГРАФИЧЕСКИХ ПРОЦЕССОРАХ С ПОДДЕРЖКОЙ ТЕХНОЛОГИИ OPENGL. Известия Юго-Западного государственного университета. 2017;21(5):6-15. https://doi.org/10.21869/2223-1560-2017-21-5-06-15

For citation:


Zatolokin Y.A., Vatutin E.I., Titov V.S. ALGORITHMIC OPTIMIZATION OF SOFTWARE IMPLEMENTATION OF ALGORITHMS FOR MULTIPLYING DENSE REAL MATRICES ON GRAPHICS PROCESSORS WITH OPENGL TECHNOLOGY SUPPORT. Proceedings of the Southwest State University. 2017;21(5):6-15. (In Russ.) https://doi.org/10.21869/2223-1560-2017-21-5-06-15

Просмотров: 37


Creative Commons License
Контент доступен под лицензией Creative Commons Attribution 4.0 License.


ISSN 2223-1560 (Print)
ISSN 2686-6757 (Online)