RISC-V公测平台发布 · Stream带宽完整测试

描述

RISC-V公测平台Stream程序路径:/public/benchmark/stream/5.10

前言

"Stream" 是一种基准测试工具,用于评估计算机系统的内存带宽性能。它通过模拟内存访问模式,测试系统在读取和写入连续内存块时的速度,衡量系统的内存性能和数据传输效率。

平台环境

[硬件参数]
处理器: 算能SG2042  X1
DDR 128G,3200HZ
[芯片参数]
主频 2.0GHz
核心数: 64核
L1 Cache: I:64KB and D:64KB(Per Core)
L2 Cache: 1MB/Cluster(Per Cluster,X16 Cluster)
L3 Cache: 64MB System Cache
[软件环境]  
linux版本: Ubuntu 22.10
gcc版本: 12.2.0(GNU)
计算机cpu 信息计算机64核示意

参数含义

我们先来了解下测试参数的具体用法。

1. ARRAY_SIZE:

用于指定测试期间使用的数组大小。该参数定义了测试中要操作的内存块的大小,通常以字节为单位。通过更改 array_size 的值,可以评估系统在不同内存工作负载下的性能表现,关于设置的大小,我们可以从官网上查看到说明:

The general rule for STREAM is that each array must be at least 4x the size of the sum of all the last-level caches used in the run.

Useful links:

https://www.cs.virginia.edu/stream/ref.html#runrules

也就是我们需要设置为最后一级缓存总和的 4 倍。

2. OpenMP :

-gcc编译器添加“-fopenmp” 选项多线程支持。

单线程Stream测试

我们的L3 Cache大小是64M,参考官方文档的建议,为了测试的准确性,选取了4倍大小的数据,也就是数组大小33554432作为基准,以2621440为梯度,依次增加数组大小,考察数组大小对测试结果的影响。选用的是gcc编译器。

单线程测试命令:

ubuntu@perfxlab:~/STREAM$ gcc -O3 -DSTREAM_ARRAY_SIZE=【ARRAY_SIZE】 stream.c

测试结果如下表:

计算机单线程 gcc -o3计算机


多线程Stream测试

和单线程Stream测试一样,同样可以做不同数组大小的多线程Stream 测试,选取的数组大小和单线程一样。

ubuntu@perfxlab:~/STREAM$ gcc -O3 -fopenmp -DSTREAM_ARRAY_SIZE=【ARRAY_SIZE】 stream.c

测试结果如下表:

计算机多线程 gcc -o3计算机

结论

计算机单核vs多核 gcc -o3

从结果可以看出,多核测试的结果明显高于单核测试的结果。多核测试利用了多个处理核心并行执行任务,从而表现出更大的数据带宽。在多核测试中,Copy操作的性能是单核测试的大约5倍,Scale操作的性能约为单核测试的6倍。

综上所述,多核测试在Copy和Scale操作中显示出了明显的性能优势,而在Add和Triad操作中的性能提升较小。这与多核处理器的并行处理能力和数据依赖性有关。多核测试结果显示出了多核处理器在并行计算和数据处理方面的优势。
 

  审核编辑:汤梓红
 
打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分