Параллельный алгоритм разреженного QR-разложения для прямоугольных верхних квазитреугольных матриц со структурой типа вложенных сечений
Ключевые слова:
разреженная прямоугольная матрица
верхняя квазитреугольная матрица
объемное разбиение
вложенные сечения
QR-разложение
преобразование Хаусхолдера
параллельный алгоритм
Аннотация
Рассматривается параллельный алгоритм вычисления разреженного QR-разложения специальным образом упорядоченной прямоугольной матрицы на основе разреженных блочных преобразований Хаусхолдера. Для построения необходимого упорядочивания можно использовать столбцевое упорядочивание типа вложенных сечений, построенное по структуре матрицы ATA, где A – исходная прямоугольная матрица. Для сеточных задач упорядочивание может быть построено на основе известного объемного разбиения расчетной сетки. В качестве базового алгоритма для организации параллельных вычислений используется QR-разложение для наборов строк матрицы с дополнением в виде нулевого начального блока.
Раздел
Раздел 1. Вычислительные методы и приложения
Автор
С.А. Харченко
ООО «ТЕСИС»
ул. Юннатов, 18, 127083, Москва
• ведущий программист
Библиографические ссылки
- E. E. Tyrtyshnikov, Methods of Numerical Analysis (Akademiya, Moscow, 2007) [in Russian].
- A. George and J. W.-H. Liu, Computer Solution of Large Sparse Positive Definite Systems (Prentice-Hall, Englewood Cliffs, 1981; Mir, Moscow, 1984).
- I. E. Kaporin, “High Quality Preconditioning of a General Symmetric Positive Definite Matrix Based on its U^T U+U^T R+R^T U-Decomposition,” Numer. Linear Algebra Appl. 5 (6), 483-509 (1998).
- T. A. Davis, “Algorithm 915: SuiteSparseQR, a Multifrontal Multithreaded Sparse QR Factorization Package,” ACM Trans. Math. Softw. 38 (1), 8: 1-8: 22 (2011).
- S. N. Yeralan, T. A. Davis, and S. Ranka, “Algorithm 9xx: Sparse QR Factorization on the GPU,” ACM Trans. Math. Softw. 1 (1) (2015).
doi 10.1145/0000000.0000000
- N. Li and Y. Saad, “MIQR: A Multilevel Incomplete QR Preconditioner for Large Sparse Least-Squares Problems,” SIAM J. Matrix Anal. Appl. 28 (2), 524-550 (2006).
- S. A. Kharchenko and A. A. Yushchenko, “Parallel Implementation of Sparse QR Decomposition of a Rectangular Upper Quasitriangular Matrix with ND-Type Sparsity,” Vestn. South Ural State Univ. Ser. Vychisl. Mat. Inf., 2015 (in press).
- F. Rotella and I. Zambettakis, “Block Householder Transformation for Parallel QR Factorization,” Appl. Math. Lett. 12 (4), 29-34 (1999).
- A. Haidar, T. T. Dong, S. Tomov, et al., “A Framework for Batched and GPU-Resident Factorization Algorithms Applied to Block Householder Transformations,” in Lecture Notes in Computer Science (Springer, Heidelberg, 2015), Vol. 9137, pp. 31-47.