Интегрирование уравнения Пуассона с использованием графического процессора технологии CUDA

Авторы

  • Н.М. Евстигнеев

Ключевые слова:

уравнение Пуассона
циклический многосеточный метод
параллельные вычисления
графические процессоры
технология CUDA

Аннотация

Рассмотрена параллельная реализация циклического многосеточного метода, решающего краевую задачу для уравнения Пуассона в R3 на графических процессорах с применением платформы NVIDIA CUDA. Выполнено сопоставление результатов расчета задач на графическом процессоре с аналитическим решением краевой задачи Дирихле и с численным решением на ЦПУ смешанной краевой задачи. Сопоставление скорости расчета на видеокарте NVIDIA GeForce 8800 GTX со скалярной версией на процессоре AMD Athlon 64X2 4800+ показало ускорение до 200 раз для дискретной области в 1 000 000 элементов, а сопоставление с рабочей станцией на двух четырехъядерных процессорах Intel(R) Xeon(R) 2.33ГГц показало ускорение в 40 раз. Работа поддержана РФФИ (коды проектов 08–07–00074а и 06–07–89047а) и программой ОНИТ РАН (проект 1.12).


Загрузки

Опубликован

2020-11-10

Выпуск

Раздел

Раздел 1. Вычислительные методы и приложения

Автор

Н.М. Евстигнеев

Институт системного анализа РАН (ИСА РАН)
проспект 60-летия Октября, 9, 117312, Москва
• старший научный сотрудник


Библиографические ссылки

  1. Deuflhard P., Leinen P., Yserentant H. Concepts of an adaptive hierarchical finite element code // Impact Comput. Sci. Eng. 1989. 1. 3-35.
  2. Shaidurov V.V. Some estimates of the rate of convergence for the cascadic conjugate gradient method // Comput. Math. Appl. 1996. 31. 161-171.
  3. Shi Z., Xu X. Cascadic multigrid method for elliptic problems // East-West J. Numer. Math. 1999. 3. 199-209.
  4. Braess D., Dahmen W. A cascadic multigrid algorithm for the Stokes equation // Numer. Math. 1999. 82. 179-191.
  5. Shi Z., Xu X. Cascadic multigrid method for parabolic problems. Preprint, 1999.
  6. Bornemann F.A., Krause R. Classical and cascadic multigrid - a methodical comparison // Proc. of the Ninth International Conference on Domain Decomposition. Bergen: Domain Decomposition Press, 1998. 64-71.
  7. Боярченков А.С., Поташников С.И. Использование графических процессоров и технологии CUDA для задач молекулярной динамики // Вычислительные методы и программирование. 2009. 10, № 1. 13-27.
  8. http://developer.download.nvidia.com/compute/cuda/2_0/docs/NVIDIA_CUDA_Programming_Guide_2.0.pdf
  9. Hyman J.M. Mesh refinement and local inversion of elliptic differential equations // J. Comput. Phys. 1977. 23. 124-134.
  10. Формалев В.Ф., Ревизников Д.Л. Численные методы. М.: Физматлит, 2006.
  11. Degenhardt R., Berz M. High accuracy description of the fringe field in particle spectrographs // Nuclear Instruments and Methods. 1999. A427, 151-156.
  12. http://www.roylongbottom.org.uk/index.htm#anchorNew