Вычислительная производительность параллельного алгоритма прогонки на кластерных суперкомпьютерах с распределенной памятью

Авторы

  • В.Э. Витковский Институт вычислительных технологий СО РАН (ИВТ СО РАН)
  • М.П. Федорук Институт вычислительных технологий СО РАН (ИВТ СО РАН)

Ключевые слова:

математическое моделирование, параллельные алгоритмы, высокопроизводительные вычисления, уравнение Шредингера

Аннотация

Рассматривается алгоритм параллельной прогонки для моделирования нелинейного уравнения Шредингера с помощью неявной схемы Кранка-Николсон с переменным шагом по пространственной и временной переменной для анализа производительности на кластерных суперкомпьютерах с распределенной памятью. В вычислительных экспериментах и на основе теоретической модели (закон Амдала) показано, что исследуемый алгоритм эффективно распараллеливается и достигает максимальной вычислительной эффективности и ускорения с показателями 0.7 и 30 соответственно по сравнению с последовательным алгоритмом. Обсуждаются особенности влияния размера сетки (в диапазоне 104-106 ячеек) и сетевых задержек межпроцессорных обменов (число используемых процессоров варьировалось в диапазоне 6-128) на производительность вычислений. Ключевые слова: математическое моделирование, параллельные алгоритмы, высокопроизводительные вычисления, уравнение Шредингера

Авторы

В.Э. Витковский

Институт вычислительных технологий СО РАН (ИВТ СО РАН)
просп. Лаврентьева, 6, 630090, Новосибирск

М.П. Федорук

Институт вычислительных технологий СО РАН (ИВТ СО РАН)
просп. Лаврентьева, 6, 630090, Новосибирск

Библиографические ссылки

  1. Thomas L.H. Elliptic problems in linear difference equations over a network. Technical report. New York: Columbia University Press, 1949.
  2. Hockney R.W., Jesshope C.R. Parallel computers: architecture, programming and algorithms. Bristol: IOP Publishing Ltd., 1981.
  3. Cox C. L. Implemention of a divide and conquer cyclic reduction algorithm on the FPS T-20 hypercube // Proc. of the Third Conference on Hypercube Concurrent Computers and Applications. January 1989. Pasadena, California, United States. 1532-1538.
  4. Ortega J.M., Voigt R.G. Solution of partial differential equations on vector and parallel computers // SIAM Rev., June 1985. 149-240.
  5. Sun X.-H., Zhang H., Ni L.M. Efficient tridiagonal solvers on multicomputers // IEEE Transactions on Computers. 1992. 41, N 3. 286-296.
  6. Sun X.-H., Moitra S. A fast parallel tridiagonal algorithm for a class of CFD applications. NASA Technical Paper N 3585. 1996.
  7. Chawla M.M., Passi K., Zalik R.A. A recursive partitioning algorithm for inverting tridiagonal matrices // Int. J. Computer Math. 1990. 35. 153-158.
  8. Povitsky A. Parallel directionally split solver based on reformulation of pipelined Thomas algorithm. ICASE Technical Report N 45. 1998.
  9. Яненко Н.Н., Коновалов А.Н., Бугров А.Н., Шустов Г.В. Об организации параллельных вычислений и «распараллеливание» прогонки // Числ. методы механики сплошн. среды. 1978. 9, № 7. 139-146.
  10. Paasonen V.I. Boundary conditions of high-order accuracy at the poles of curvilinear coordinate systems // Russian Journal of Numerical Analysis and Mathematical Modelling. 1999. 14, N 4. 369-382.
  11. Паасонен В.И. Параллельный алгоритм для компактных схем в неоднородных областях // Вычислительные технологии. 2003. 8, № 3. 98-106.
  12. Паасонен В.И. Сходимость параллельного алгоритма для компактных схем в неоднородных областях // Вычислительные технологии. 2005. 10, № 5. 81-89.
  13. Воеводин А.Ф., Шугрин С.М. Методы решения одномерных эволюционных систем. Новосибирск: Наука, 1993.
  14. Кудряшова Т.А., Поляков С.В. О некоторых методах решения краевых задач на многопроцессорных вычислительных системах // Труды IV международной конференции по математическому моделированию. 27 июня - 1 июля 2000 г., Москва (под ред. Л.А. Уваровой). 2. 134-145. М.: СТАНКИН, 2001.
  15. Amdahl G. Validity of the single processor. Approach to achieving large-scale computing capabilities // Proceedings of the AFIPS Conference. 1967. 483-485.
  16. Рычков А.Д. Численные методы и параллельные вычисления // Учебное пособие. Новосибирск: СибГУТИ, 2007.
  17. Прокопьева Л.Ю., Чубаров Д.Л. Производительность параллельной прогонки // Труды IV Российско-германской школы по параллельным вычислениям и высокопроизводительным вычислительным системам. Новосибирск: ИВТ СО РАН, 2007.
  18. Витковский В.Э., Федорук М.П. Численное исследование свойств решений нелинейного уравнения Шредингера при распространении лазерных импульсов в световодах // Вычислительные технологии. 2008. 13, № 6.

Загрузки

Опубликован

02-10-2008

Как цитировать

Витковский В., Федорук М. Вычислительная производительность параллельного алгоритма прогонки на кластерных суперкомпьютерах с распределенной памятью // Вычислительные методы и программирование. 2008. 9. 305-310

Выпуск

Раздел

Раздел 1. Вычислительные методы и приложения