应用程序开发人员喜欢通过将应用程序的逻辑设计为不同对象实体之间的交互来坚持面向对象的编程风格。在这个过程中,每个实体都被建模为C++类或结构。结构数组(AOS)维护这些实体的集合,这使得代码更可读,更易于维护。但是,这种用户友好的代码可能会面临一个挑战时,涉及到矢量化效率。通常,由于在主存储器中以非单位步长的方式布置数据,所以收集用于填充向量寄存器所需的数据。为了使数据布局更加矢量友好,开发人员经常需要手动将数据结构从AoS更改为数组结构(SoA)。Intel的单指令多数据(SIMD)布局模板帮助开发人员在编程时保留AoS接口,但是在幕后,数据结构以SoA格式布局。这是一个双赢的解决方案,面向对象和矢量友好的编程。
本演示文稿演示了如何分析性能敏感循环中的内存访问模式,以及如何使布局模板能够尽可能地从常量和变量跨行内存访问更改为单元跨行内存访问。
全部0条评论
快来发表一下你的评论吧 !