Библиотека шаблонов итерационных методов подпространств Крылова для численного решения задач механики сплошных сред на гибридной вычислительной системе
Авторы
-
Д.А. Губайдуллин
-
А.И. Никифоров
-
Р.В. Садовников
Ключевые слова:
параллельные вычисления
графические процессоры
итерационные методы подпространств Крылова
метод контрольных объемов
фильтрация в пористых средах
Аннотация
Представлена библиотека шаблонов C++ итерационных методов подпространств Крылова с предобусловливанием для решения больших разреженных систем линейных алгебраических уравнений на современных графических процессорах NVIDIA. Методы могут использоваться как на отдельном, так и на нескольких графических устройствах одновременно, т.е. на так называемых гибридных вычислительных системах, в которых вычисления на центральных процессорах совмещаются с вычислениями на графических процессорах. Библиотека предназначена для пользователей, которым приходится иметь дело с большими разреженными системами линейных алгебраических уравнений. Работа выполнена в рамках программы Президиума РАН № 14 «Интеллектуальные информационные технологии, математическое моделирование, системный анализ и автоматизация».
Раздел
Раздел 1. Вычислительные методы и приложения
Библиографические ссылки
- Воеводин В.В., Воеводин Вл.В. Параллельные вычисления. СПб:БХВ-Петербург, 2002.
- http://www.netlib.org/utk/people/JackDongarra/la-sw.html.
- NVIDIA Corporation. NVIDIA CUDA Programming Guide. February, 2010. Version 3.0.
- Андреев С.С., Давыдов А.А., Дбар С.А., Карагичев А.Б., Лацис А.О., Плоткина Е.А. Макет гибридного суперкомпьютера МВС-экспресс // XVII Всероссийская конференция «Теоретические основы и конструирование численных алгоритмов для решения задач математической физики с приложением к многопроцессорным системам», посвященная памяти К.И. Бабенко. Абрау-Дюрсо, 2008.
- Buatois L., Cauman G., Levy B. Concurrent number cruncher: an efficient sparse linear solver on the GPU // High Performance Computation Conference (HPCC). Springer Lecture Notes in Computer Sciences. Berlin: Springer, 2008. 358-371.
- Bell N., Garland M. Efficient sparse matrix-vector multiplication on CUDA. NVIDIA Tech. Rep. 2008.
- Baskaran M., Bordawekar R. Optimizing sparse matrix-vector multiplication on GPUs. IBM Tech. Rep. 2009.
- Чадов С.Н. Реализация алгоритма решения несимметричных систем линейных уравнений на графических процессорах // Вычислительные методы и программирование. 2009. 10, № 2. 135-140.
- Губайдуллин Д.А., Садовников Р.В., Никифоров А.И. Использование графических процессоров для решения разреженных СЛАУ итерационными методами подпространств Крылова с предобусловливанием на примере задач теории фильтрации // Сб. трудов Международной научной конференции «Параллельные вычислительные технологии (ПаВТ-2010)’’. Уфа, 2010. 132-140.
- NVIDIA Corporation. CUBLAS Library. February, 2010. Version 3.0.
- OpenMP Architecture Review Board (http://www.openmp.org).
- MPI: A Message-Passing Interface (MPI) Standard (http://www.mcs.anl.gov/research/projects/mpi/).
- NVIDIA CUDA. Reference Manual. February, 2010. Version 3.0.
- Hendrickson B., Leland R. The Chaco user’s guide. Version 1.0. Technical Report Sand93-2339. Sandia National Laboratories. Albuquerque, 1993.
- METIS: family of multilevel partitioning algorithms (http://glaros.dtc.umn.edu/gkhome/views/metis).
- Aztec: a massively parallel iterative solver library for solving sparse linear systems // (http://www.cs.sandia.gov/CRF/aztec1.html).
- Губайдуллин Д.А., Садовников Р.В. Применение параллельных алгоритмов для решения задачи фильтрации жидкости в трещиновато-пористом пласте к скважинам со сложной траекторией // Вычислительные методы и программирование. 2007. 8, № 2. 95-102.
- Баренблатт Г.И., Желтов Ю.П., Кочина И.М. Об основных представлениях теории фильтрации однородных жидкостей в трещиноватых породах // Прикл. матем. и механ. 1960. 123, № 3. 852-864.