×

C870流处理器上的大型矩阵计算方法

消耗积分:2 | 格式:rar | 大小:187 | 2009-09-01

吴湛

分享资料个

C870 流处理器采用三级存储层次、三级访问模式,其流处理结构特别适合于数据并
行性好、全局数据重用较少的计算密集型应用。根据C870 流处理器的软硬件结构,针对高度的浮点密集运算、海量数据元素并行计算的问题,本文提出使用计算来隐藏内存访问的延迟,从而提高存储系统的带宽。并首次提出了在C870 流处理器上的使用芯片上共享内存(On-chip Shared Memory)的大型矩阵的计算方法,并用5000*5000 和2000*2000 的方形矩阵进行优化实验,实验结果证明了使用芯片上共享内存优化计算,可以使浮点性能提高7倍多。
关键词: C870 流处理器;矩阵计算;芯片上共享内存

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

评论(0)
发评论

下载排行榜

全部0条评论

快来发表一下你的评论吧 !