CacheQ的编译器支持多线程CPU加速

描述

  在 CacheQ 编译器集合中,编译器消除了手动代码重写和使用线程库或复杂的并行执行 API,如 OpenMP 或 MPI。它采用单线程 C 代码并生成可在 CPU 上运行的可执行文件,利用带或不带超线程的物理 x86 内核以及 Arm 和 RISC-V 内核。

  使用 CacheQ 灵活的编译器,用户可以为相同或不同架构上的多核处理器生成代码,并使用运行时变量对使用情况进行基准测试。它们可以添加到硬件以提高性能和功耗,或减少内核数量并分配其他进程以实现每瓦功耗的更优化性能。

  根据该公司的说法,基于模拟股票交易中人类行为的 Black Scholes 金融算法的基准,结果是在具有 12 个逻辑内核的 X86 处理器上的单线程执行速度提高了 486% 以上。具有八个 Arm 内核的 Apple M1 处理器比单线程 GNU 编译器集合 (GCC) 快 400%。

  CacheQ 使软件开发人员能够为包括 FPGA、CPU 和 GPU 在内的异构计算系统开发和部署定制硬件加速器。它的 CacheQ Compiler Collection 以 gcc 工具套件为模型,包括类似于常见开源编译器的用户界面。因为它需要有限的代码修改,所以可以缩短开发时间并提高系统质量。

  该工具套件支持对生成的虚拟引擎进行编译、检查和错误检测、性能预测、分析、调试和可视化。它支持目标硬件,包括单核和多核处理器,以及具有连接到 x86 和 Arm 处理器的 FPGA 加速器的异构计算系统。

  CacheQ 编译器集合通过导出函数调用的“混合”访问来支持 C 代码和 C++。

  CacheQ Compiler Collection 的其他基准测试突出了其跨越高端服务器和消费电子设备的能力。具有两个内核的 M1 处理器的执行性能优于具有 11 个内核的 x86 芯片,显示出每瓦成本的优势。据该公司称,四核 Apple M1 处理器的性能比 12 核 x86 快 210%。总体而言,它的执行速度比使用 CacheQ 编译器集合在 x86 上运行的单线程 GCC 快约 1,476%。

  所有模拟都是在为不同目标编译的相同代码上执行的。基准测试是在运行频率为 3.7GHz 的 Intel i7-8700k x86 CPU 上执行的,该 CPU 具有六个物理内核和超线程,可用于运行 Ubuntu 18.04 的 12 个逻辑内核。Apple M1 基准测试是使用运行本机 Arm Ubuntu 20.04 映像的 Parallels VM 捕获的。

  审核编辑:郭婷

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分