Автоматизация поиска ошибок и неэффективностей в параллельных программах

Авторы

  • А.С. Антонов
  • Вад.В. Воеводин
  • С.А. Жуматий
  • Д.А. Никитенко
  • К.С. Стефанов
  • П.А. Швец

Ключевые слова:

суперкомпьютер
производительность
исследование эффективности
параллельные вычисления
параллельные программы
динамические характеристики программ
высокопроизводительные вычисления
профилирование
мониторинг
суперкомпьютерный центр

Аннотация

Вместе с ростом масштабов решаемых на суперкомпьютерных системах задач существенно более значимой становится проблема эффективного использования доступных ресурсов. Избыточные вычисления, вызванные неэффективной реализацией алгоритмов, неоправданное множество тестовых запусков, неучтенные особенности архитектуры вычислительной системы или используемого программного обеспечения – это и многое другое в совокупности приводит к неоправданным расходам вычислительных ресурсов, увеличению времени разработки, удорожанию получения результата. Существуют разные подходы для автоматизированной оценки эффективности и поиска ошибок в параллельных приложениях. В настоящей статье предложен комплексный подход к исследованию эффективности программ в ходе их выполнения. Работа выполнена при финансовой поддержке Министерства образования и науки РФ, государственный контракт № 14.514.11.4062.


Загрузки

Опубликован

2013-11-18

Выпуск

Раздел

Раздел 2. Программирование

Авторы

А.С. Антонов

Вад.В. Воеводин

С.А. Жуматий

Д.А. Никитенко

К.С. Стефанов

П.А. Швец


Библиографические ссылки

  1. Воеводин Вл.В., Жуматий С.А., Соболев С.И., Антонов А.С., Брызгалов П.А., Никитенко Д.А., Стефанов К.С., Воеводин Вад.В. Практика суперкомпьютера «Ломоносов» // Открытые системы. 2012. № 7. 36-39.
  2. Адинец А.В., Брызгалов П.А., Воеводин Вад.В., Жуматий С.А., Никитенко Д.А., Стефанов К.С. Job digest - подход к исследованию динамических свойств задач на суперкомпьютерных системах // Вычислительные методы и программирование. 2012. 13. 160-166.
  3. Брызгалов П.А., Жуматий С.А., Никитенко Д.А., Адинец А.В. Система визуализации параметров работы больших вычислительных систем // Сб. трудов Международной научной конференции «Параллельные вычислительные технологии 2012» (ПаВТ-2012). 2012. 714.
  4. Адинец А.В., Брызгалов П.А., Воеводин В.В., Жуматий С.А., Никитенко Д.А. Мониторинг, анализ и визуализация потока заданий на кластерной системе // Материалы XI Всероссийской конференции «Высокопроизводительные параллельные вычисления на кластерных системах». Нижний Новгород: Изд-во Нижегородского госуниверситета, 2011. 10-14.
  5. Адинец А.В., Брызгалов П.А., Воеводин Вад.В., Жуматий С.А., Никитенко Д.А. Об одном подходе к мониторингу, анализу и визуализации потока заданий на кластерной системе // Вычислительные методы и программирование. 2011. 12. 90-93.
  6. Никитенко Д.А., Стефанов К.С. Исследование эффективности параллельных программ по данным мониторинга // Вычислительные методы и программирование. 2012. 13. 97-102.
  7. Воеводин В.В., Воеводин Вл.В. Параллельные вычисления. СПб.: БХВ-Петербург, 2002.
  8. Афанасьев К.Е., Власенко А.Ю. Семантические ошибки в параллельных программах для систем с распределенной памятью и методы их обнаружения современными средствами отладки // Вестник КемГУ. Вып. 2. Кемерово: Изд-во КемГУ, 2009. 13-20.
  9. Антонов А.С. Технологии параллельного программирования MPI и OpenMP. М.: Изд-во Моск. ун-та, 2012.