×

声子BTE方程迭代求解在GPU上的并行加速方案

消耗积分:0 | 格式:pdf | 大小:1.20 MB | 2021-04-12

分享资料个

  声子玻尔兹曼输运方程(BTE)可以有效地模拟介观尺度下的导热问题,相比于随机性方法,以有限体积法为代表的确定性方法求解声子BTE方程被认为更有希望解决工程实际问题。但是有限体积法求解BTE具有迭代步数多,迭代时间长的问题。为此提出了声子BTE方程迭代求解部分在GPU上的并行加速方案,并适当的线程分配方式及数据存储格式,采用循环展开和内核融合等优化手段对迭代过程进行并行加速此外,采用基于角方向的并行策略,使用 MPI+CUDA、CUDA- Aware MPI和NCCL函数的方式实现了声子BTE求解多GPU并行版本。实验结果表明,相较于 Intel Xeon gold6248上的串行版本,在单块Ⅴ100GPU上获得了最大31.5倍的加速。同时使用NCCL函数的GPU并行版本在8台DGX-2节点共计128块V100GPU上最高达到了83%的并行效率,比 MPI+CUDA版本提升57%。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

评论(0)
发评论

下载排行榜

全部0条评论

快来发表一下你的评论吧 !