DOI: https://doi.org/10.26089/NumMet.v20r330

Практика проведения анализа производительности суперкомпьютерных задач

Авторы

  • И.В. Афанасьев
  • В.В. Воеводин
  • В.Ю. Рудяк
  • А.В. Емельяненко

Ключевые слова:

высокопроизводительные вычисления
суперкомпьютеры
анализ эффективности
графические ускорители
жидкие кристаллы
теория эластического континуума

Аннотация

Предложен метод проведения анализа эффективности и оптимизации суперкомпьютерных приложений, примененный на практике для изучения задач одного из пользователей суперкомпьютера Ломоносов-2. Этот метод затрагивает различные этапы исследования задач, начиная от изучения общего поведения всех запусков пользователя на суперкомпьютере и заканчивая детальным изучением и оптимизацией исходного кода выбранной программы. Приведено описание общих этапов анализа, которые были выполнены на практике, показаны метрики производительности, на которые следует обратить внимание при выполнении подобного анализа, а также продемонстрированы конкретные примеры поведения задач и эффект от оптимизации, выполненной для задачи расчета жидкокристаллических капель.


Загрузки

Опубликован

2019-10-29

Выпуск

Раздел

Раздел 1. Вычислительные методы и приложения

Авторы

И.В. Афанасьев

В.В. Воеводин

В.Ю. Рудяк

А.В. Емельяненко

Московский государственный университет имени М.В. Ломоносова,
физический факультет
Ленинские горы, 119234, Москва
• ведущий научный сотрудник


Библиографические ссылки

  1. V. Voevodin and V. Voevodin, “Efficiency of Exascale Supercomputer Centers and Supercomputing Education,” in High Performance Computer Applications (Springer, Cham, 2016), Vol. 595, pp. 14-23.
  2. J. Vetter and C. Chambreau, “MpiP: Lightweight, Scalable MPI Profiling,”
    http://mpip.sourceforge.net . Cited August 27, 2019.
  3. Intel VTune Amplifier documentation.
    https://software.intel.com/en-us/vtune . Cited August 27, 2019.
  4. N. Nethercote and J. Seward, “Valgrind: A Framework for Heavyweight Dynamic Binary Instrumentation,” SIGPLAN Not. 42 (6), 89-100 (2007).
  5. P. Shvets, Vad. Voevodin, and S. Zhumatiy, “HPC Software for Massive Analysis of the Parallel Efficiency of Applications,” in Communications in Computer and Information Science (Springer, Cham, 2019), Vol. 1063, pp. 3-18.
  6. Vl. V. Voevodin, A. S. Antonov, D. A. Nikitenko, et al., “Supercomputer Lomonosov-2: Large Scale, Deep Monitoring and Fine Analytics for the User Community,” Supercomput. Front. Innov. 6 (2), 4-11 (2019).
  7. R. D. Groot and P. B. Warren, “Dissipative Particle Dynamics: Bridging the Gap between Atomistic and Mesoscopic Simulation,” J. Chem. Phys. 107 (11), 4423-4435 (1997).
  8. S. Plimpton, “Fast Parallel Algorithms for Short-Range Molecular Dynamics,” J. Comput. Phys. 117 (1), 1-19 (1995).
  9. F. C. Frank, “I. Liquid Crystals. On the Theory of Liquid Crystals,” Discuss. Faraday Soc. 25, 19-28 (1958).
  10. V. Y. Rudyak, A. V. Emelyanenko, and V. A. Loiko, “Structure Transitions in Oblate Nematic Droplets,” Phys. Rev. E 88 (2013).
    doi 10.1103/PhysRevE.88.052501
  11. Profiler User’s Guide.
    https://docs.nvidia.com/cuda/profiler-users-guide/index.html{#}nvprof-overview . Cited August 27, 2019.
  12. C. Yang and S. Williams, “Performance Analysis of GPU-Accelerated Applications Using the Roofline Model,”
    https://developer.nvidia.com/gtc/2019/video/S9624 . Cited August 27, 2019.
  13. D. A. Nikitenko, V. V. Voevodin, and S. A. Zhumatiy, “Octoshell: Large Supercomputer Complex Administration System,” Vestn. Yuzhn. Ural. Gos. Univ. Ser. Vychisl. Mat. Inf. 5 (3), 76-95 (2016).
  14. D. Shaykhislamov and V. Voevodin, “An Approach for Dynamic Detection of Inefficient Supercomputer Applications,” Procedia Comput. Sci. 136, 35-43 (2018).