新型的分布式并行稠密矩阵乘算法-电子发烧友网

　　并行矩阵乘法是线性代数中最重要的基本运算之一，同时也是许多科学应用的基石。随着高性能计算（HPC）向E级计算发展，并行矩阵乘法的通信开销所占比重越来越大。如何降低并行矩阵乘法的通信开销，提高并行矩阵乘的可扩展性是当前研究的热点之一。本文提出一种新型的分布式并行稠密矩阵乘算法，即2.5D版本的PUMMA（ Parallel Universal matrix Multiplication Algorithm）算法，该算法是通过将初始的进程分成c组，利用计算节点的额外内存，在每个进程组上同时存储矩阵A、B和执行1/c的 PUMMA算法，最后通过规约操作来得到矩阵乘的最终结果。本文基于 BLACS（ Basic Linear Algebra Communication Subprograms）通信库实现了一种从2D到2.5D的新型数据重分配算法，与 PUMMA算法相结合，最终得到2.5 D PUMMA算法，可直接替换 PDGEM（ Parallel double- precision General Matrix-matrix Multiplication），具有良好的可移植性。与国际标准算法库 ScalaPACK（ Scalable Linear algebra Package）中的 PDGEMM等经典D算法相比，本文算法缩减了通信次数，提高了数据局部性，具有更好的可扩展性。在进程数较多时，例如4096进程时，系统测试表明相对 PDGEMM的加速比可达到2.20~2.93.进一步地，本文将2.5 D PUMMA算法应用于加速计算对称三对角矩阵的特征值分解，其加速比可达到1.2以上本文通过大量数值算例分析了2.5DMMA算法的性能，并给出了实用性建议和总结了未来的工作。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

新型的分布式并行稠密矩阵乘算法

AI框架的分布式并行能力的分析和MindSpore的实践一混合并行和自动并行

AI框架的分布式并行能力的分析和MindSpore的实践一混合并行和自动并行

【优化选址】基于模拟退火结合粒子群算法求解分布式电源定容选址问题matlab源码

分布式电源对配电网影响

分布式电源对配电系统的影响分析

基于Simulink的电子对抗分布式仿真系统

高效快速的分布式水军群检测算法

基于分布式仿真系统的实时通讯架构

基于KingSCADA的分布式运动控制监测系统

Spark分布式平台的ALS加速算法设计方案

MapReduce框架下分布式编码计算容错算法

脉冲噪声环境下的分布式估计算法

基于DSP的航空发动机分布式总线设计方案

新型的无线传感器网络异常节点定位算法

深层转导式非负矩阵分解并行算法

一种分布式聚类蚁群算法求解LTCPP

分布式K-自同构社会网络隐私保护算法

轻量级分布式机器学习系统及算法

基于分布式编码的同步随机梯度下降算法

一种优化的分布式二维卷积算法

基于分布式数据Cache的实时动态迁移机制

一种更安全的分布式一致性算法选举机制

一种可行的分布式存储系统安全构造方法

结合网络推演和失效检测算法的航电分布式显控

云存储中的Ceph分布式文件系统及节点选择

增量式约简最小二乘孪生攴持向量回归机算法

基于自触发一致性算法的分布式分层控制策略

一种分布式网络扫描架构和任务调度算法

如何使用FPGA和分布式算法实现FIR低通滤波器的设计

快速在线分布式对偶平均优化算法

【节能学院】Acrel-1000DP分布式光伏监控系统在奉贤平高食品 4.4MW 分布式光伏中应用

分布式云化数据库有哪些类型

一种完全分布式的点线协同视觉惯性导航系统

什么是分布式架构?

redis分布式锁三个方法

zookeeper分布式原理

分布式通信是什么 分布式网络搭建

Java手写分布式锁的实现

什么是分布式直流电源？分布式直流电源的范围 分布式直流电的特性

springcloud如何实现分布式

springclould分布式教程

为什么需要分布式共识算法

基于PyTorch的模型并行分布式训练Megatron解析

分布式无纸化交互系统的实现原理

8K无损压缩分布式系统，开创分布式新时代！

分布式智能电网的形态与结构

分布式光伏发电前景

鸿蒙分布式相机“踩坑”分享

DASK适用于Python中的并行和分布式计算

OpenHarmony技术论坛：分布式相机和分布式图库功能

什么是分布式系统 分布式架构有哪些

关于分布式系统的几个问题

分布式高清矩阵KVM座席管理系统的安装步骤

关于分布式矩阵座席KVM功能操作的简单介绍

Java：Redis分布式锁的原理和案例

什么是分布式系统_分布式系统的类型

集中式矩阵，分布式矩阵具有那些特点？

分布式光纤传感器原理_分布式光纤传感器的应用

区块链的真正价值是实现高效有序的大规模分布式协作

基于时共享总线和分布式结构实现高性能通用并行弹载计算机的设计

下载排行榜

爱华AIWA HS-J202维修手册

PC5502负载均流控制电路数据手册

飞利浦D8714收录机说明书

H110主板CPU PWM芯片ISL95858HRZ-T核心供电电路图资料

UWB653Pro USB口测距通信定位模块规格书

技嘉H110主板IT8628E_BX IO电路图资料

分布式通信是什么分布式网络搭建

什么是分布式直流电源？分布式直流电源的范围分布式直流电的特性

什么是分布式系统分布式架构有哪些