HPL是大规模集群系统广泛采用的linpack 测试软件包,本文在深入分析线性代数方程组分块并行求解算法和HPL
实现技巧的基础上,探讨了HPL 峰值性能的制约因素。重点讨论了LU 分解过程中主要参数P×Q 和NB 对计算性能的影响。
理论分析与实验结果表明,定义为矩阵运算时间与其运算量之比的效率因子很大程度上相关于矩阵的分块大小,而与矩阵
规模本身关系微乎其微。根据这一规律,本文作者提出通过扫描小规模矩阵运算效率来确定大规模并行测试中分块大小NB,
改善长期以来只是通过反复实验试探获取NB 的现状,大大缩短了NB 的确定过程,为其最终定位提供了相对精确的理论化
依据。目前实际测试结果基本验证了本文作者的想法,这一方法同样适用于其他过程中的矩阵并行运算。
关键词:HPL(high performance linpack), 线性代数方程组,LU 分解,MPI
Linpack 是当前国际上流行的性能测试基准,通过对高性能计算机求解稠密线性代数方程组能力的测
试,评价高性能计算机系统的浮点性能,由Jack Dongarra 在1979 年首次提出,多为Fortran 版本。它
提供多种程序并在其它函数库的支持下解决线性方程问题,包括求解稠密矩阵运算,带状的线性方程,
求解最小平方问题以及其它各种矩阵运算,但它们都是基于高斯消去法的原理。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉