提高矢量化效率

描述

应用程序开发人员喜欢通过将应用程序的逻辑设计为不同对象实体之间的交互来坚持面向对象的编程风格。在这个过程中,每个实体都被建模为C++类或结构。结构数组(AOS)维护这些实体的集合,这使得代码更可读,更易于维护。但是,这种用户友好的代码可能会面临一个挑战时,涉及到矢量化效率。通常,由于在主存储器中以非单位步长的方式布置数据,所以收集用于填充向量寄存器所需的数据。为了使数据布局更加矢量友好,开发人员经常需要手动将数据结构从AoS更改为数组结构(SoA)。Intel的单指令多数据(SIMD)布局模板帮助开发人员在编程时保留AoS接口,但是在幕后,数据结构以SoA格式布局。这是一个双赢的解决方案,面向对象和矢量友好的编程。

本演示文稿演示了如何分析性能敏感循环中的内存访问模式,以及如何使布局模板能够尽可能地从常量和变量跨行内存访问更改为单元跨行内存访问。

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分