使用VTune放大器XE的3个更好的OpenMP性能调整秘诀

描述

并行性提供了高性能计算(HPC)的能力。并行性跨几个层运行:超标量、向量指令、线程以及具有消息传递的分布式内存。OpenMP是一种常用的线程抽象,特别是在HPC中。许多HPC应用正在移动到一个混合共享内存/分布式编程模型,其中使用OpenMP和MPI。该网络研讨会着重于OpenMP并行模型,特别是分析基于OpenMP的应用程序的性能。Intel提供了一个强大的性能分析工具,Intel VTune™Ampli.XE,这对于发现OpenMP代码中的性能瓶颈非常方便。在本次网络研讨会上,我们将介绍剖析OpenMP应用程序所需的步骤,并描述如何使用Intel VTune放大器XE快速识别具有任务粒度、工作负载不平衡和同步的性能问题。

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分