声子BTE方程迭代求解在GPU上的并行加速方案

消耗积分:0 | 格式:pdf | 大小:1.20 MB | 2021-04-12

分享资料个

　　声子玻尔兹曼输运方程（BTE）可以有效地模拟介观尺度下的导热问题，相比于随机性方法，以有限体积法为代表的确定性方法求解声子BTE方程被认为更有希望解决工程实际问题。但是有限体积法求解BTE具有迭代步数多，迭代时间长的问题。为此提出了声子BTE方程迭代求解部分在GPU上的并行加速方案，并适当的线程分配方式及数据存储格式，采用循环展开和内核融合等优化手段对迭代过程进行并行加速此外，采用基于角方向的并行策略，使用 MPI+CUDA、CUDA- Aware MPI和NCCL函数的方式实现了声子BTE求解多GPU并行版本。实验结果表明，相较于 Intel Xeon gold6248上的串行版本，在单块Ⅴ100GPU上获得了最大31.5倍的加速。同时使用NCCL函数的GPU并行版本在8台DGX-2节点共计128块V100GPU上最高达到了83%的并行效率，比 MPI+CUDA版本提升57%。

下载并关注上传者 低至0.43元/天 开通VIP 免费下载

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

发评论

相关下载
相关文章

下载排行榜

人形机器人执行、感知系统技术及市场解析
2026-05-20 145次下载

下载
瑞芯微RK3588系列开发板-产品资料更新-2026.06
2026-06-08 5次下载

下载
OK3506-S12 Mini开发板产品资料-2025.10
2026-06-08 3次下载

下载
ZS73XGaN 高性能 PWM+D-GaN 芯片数据手册
2026-06-10 3次下载

下载
FS4054H 输入电压范围3.8V~6.8V 输入最大耐压28V 输入过压关闭充电阈值6.8V
2026-05-22 2次下载

下载
LZC9300A 高性能恒压恒流碳化硅驱动控制芯片
2026-06-06 2次下载

下载

全部0条评论

快来发表一下你的评论吧 !

声子BTE方程迭代求解在GPU上的并行加速方案

适应边缘AI全新时代的GPU架构

节点电压方程的列写及求解方法

MATLAB数学实验第六章matlab求解常微分方程.pdf

支持并行加速的多比特同态比较运算器

船舶三维声弹性应用软件的多级并行优化

基于FPGA的并行RICE解码结构设计方案

基于并行约束规划的大数据平台最大团识别算法

基于数据驱动的任务并行多重网格应用

申威众核处理器的三对角方程求解器综述

基于光华逼近函数的求解凸二次规划方法

飞行器部件强度校核快速计算方法及应用综述

什么程序适合在GPU上运行？什么时候用CPU资料下载

数理方程构件化的软件设计模式综述

基于深度迭代卷积CNN的脑部MRI重建算法

一种基于属性平均距离的子空间求解策略

HPEC应用子程序线程推测并行性实验分析

二维Logistic分数阶微分方程的离散化过程

数列极限的求解方法及案例分析

在ARM GPU架构上实现基于OpenCL并行优化策略

4种解决旅行商问题的强化学习求解算法

一种利用GPU并行计算提升杂波生成实时性的方法

通过神威太湖之光加速AMBER软件的运动过程

基于匹配理论的用户-子信道双边匹配算法

基于迭代膨胀卷积神经网络与ATT的实体名识别方法

并行子空间优化在无人机总体设计中的应用详细资料说明

HFSS的IE和FEBI求解器的详细资料概述

Jacobi迭代求解特征值和特征向量的C语言代码免费下载

如何使用离散化方法实现二维Logistic分数阶微分方程的详细资料说明

进行线性代数方程组的数值实验资料说明

使用MATLAB编程实现里查森迭代法线性方程组求解的资料和程序免费下载

达摩院发布敏迭GPU版求解器

CST求解器选择指南：瞬态(T)、频域(F)还是积分方程(I)

GPU加速计算平台的优势

突破晶体管功耗难题新希望之光学声子软化

PyTorch GPU 加速训练模型方法

GPU深度学习应用案例

GPU加速计算平台是什么

深度学习GPU加速效果如何

恒讯科技的GPU云解决方案有什么特点和优势？

在AMD GPU上如何安装和配置triton？

利用GPU加速在Orange Pi 5上跑LLMs：人工智能爱好者High翻了！

GPU在深度学习中的应用与优势

如何加速HBM仿真迭代优化？

python牛顿迭代法

自旋涨落增强的声子磁矩

177倍加速！NVIDIA最新开源 | GPU加速各种SDF建图！

亥姆霍兹方程物理意义

GPU图像处理的工作原理

什么是声子激光器？如何用两个离子来制造一个声子激光器？

什么是微分代数方程？Matlab求解微分代数方程

Matlab/Simulink建模详解：一阶时变偏微分方程的求解

MATLAB矩阵运算、线性方程组求解、特征值与特征向量

GPU图像处理的基本流程

多个GPU标准C++并行编程加速计算的优点

如何在Azure Synapse上构建NVIDIA GPU

具有RAPIDS cuML的GPU加速分层DBSCAN

如何使用GPU编程优化模型/代码

5W灰色导热硅胶片在服务器GPU加速运算卡散热上的应用

无处不在的拓扑声子材料

关于MATLAB连续模型求解方法介绍和分析

下载排行榜

人形机器人执行、感知系统技术及市场解析

瑞芯微RK3588系列开发板-产品资料更新-2026.06

OK3506-S12 Mini开发板产品资料-2025.10

ZS73XGaN 高性能 PWM+D-GaN 芯片数据手册

FS4054H 输入电压范围3.8V~6.8V 输入最大耐压28V 输入过压关闭充电阈值6.8V

LZC9300A 高性能恒压恒流碳化硅驱动控制芯片