并行性提供了高性能计算(HPC)的能力。并行性跨几个层运行:超标量、向量指令、线程以及具有消息传递的分布式内存。OpenMP是一种常用的线程抽象,特别是在HPC中。许多HPC应用正在移动到一个混合共享内存/分布式编程模型,其中使用OpenMP和MPI。该网络研讨会着重于OpenMP并行模型,特别是分析基于OpenMP的应用程序的性能。Intel提供了一个强大的性能分析工具,Intel VTune™Ampli.XE,这对于发现OpenMP代码中的性能瓶颈非常方便。在本次网络研讨会上,我们将介绍剖析OpenMP应用程序所需的步骤,并描述如何使用Intel VTune放大器XE快速识别具有任务粒度、工作负载不平衡和同步的性能问题。
全部0条评论
快来发表一下你的评论吧 !