RISC-V高性能计算需要要解决的三个问题

处理器/DSP

891人已加入

描述

近日,OSCHINA 和 Gitee 联合发布了《2022 中国开源开发者报告》。

其中 “前沿开源技术领域解读” 部分,多位在其领域有所建树的一线开发者和开源商业化公司创始人,对目前国内外流行的前沿开源技术领域过去的发展和未来的趋势进行了深入的洞察,覆盖开源云原生、开源 AI、开源大前端、开源大数据、开源 DevOps、RISC-V、开源操作系统、开源数据库、编程语言九大领域。

本篇为 RISC-V 领域的解读。

凭借指令精简、模块化、可扩展、开源的优势,RISC-V 架构在近几年备受追捧。尤其是在 2022 年,RISC-V 的发展势头极为强劲,RISC-V 处理器核出货量突破 100 亿颗。随着国内外企业面向高性能 RISC-V 市场持续开拓,把 RISC-V 从嵌入式场景拓展到工业控制、自动驾驶、人工智能、通信、数据中心等对算力要求更高的场景,RISC-V 有望在不久的将来与 X86、ARM 形成三足鼎立之势。

RISC-V 处理器核出货量突破 100 亿颗

2022 年 7 月,RISC-V 国际基金会首席执行官 Calista Redmond 在嵌入式世界大会上宣布 RISC-V 架构处理器核的出货数量已突破 100 亿颗。根据 Semico Research 预测,到 2025 年 RISC-V 架构处理器核的出货数量将达到 800 亿颗。为了实现以开源、开放、共建、共治模式发展 RISC-V 全球生态,RISC-V 国际基金会于 2020 年重组为由理事会、技术指导委员会与技术工作组等组成的开放治理架构,并将总部设于瑞士日内瓦,目前已吸引 70 多个国家的 3100 多个会员。 RISC-V 处理器核出货量突破 100 亿颗,这是 RISC-V 生态发展的重要里程碑事件,这标志着 RISC-V 生态发展呈现明显加速态势。除了出货量超 100 亿颗,还有三个趋势彰显了 RISC-V 有望在不久的将来与 X86、ARM 形成三足鼎立之势。 (1)已经出现一批瞄准高性能 RISC-V 的国内外企业,性能对标 ARM Cortex-A76/A78,甚至 Neoverse-N1/N2,这些企业将把 RISC-V 从嵌入式场景拓展到工业控制、自动驾驶、人工智能、通信、数据中心等对算力要求更高的场景。 (2)RISC-V 软件生态正在加速,各个开源软件社区主动适配 RISC-V 架构。以 Linux 发行版 Debian 为例,2019 年开始支持 RISC-V,在全世界开源社区努力下不到 3 年时间就已经完成 2 万多个软件包中 95% 的移植,使 RISC-V 成为 Debian 支持的 Tier-1 架构。 (3)RISC-V 得到不同级别企业的青睐。根据市场披露数据统计,全球 RISC-V 初创企业融资总金额已超过 20 亿美元。英特尔、高通、华为、中兴、阿里等头部企业均以高级会员的身份加入了国际基金会,其中英特尔设立 10 亿美元 IFS 基金,主要用于 RISC-V 流片服务。 中国 RISC-V 生态发展迅猛,全球 100 亿颗 RISC-V 核出货量中,预计中国将占 1/3 到 1/2。中国社区作为 RISC-V 国际基金会的工作小组和研发伙伴,一直是 RISC-V 最强有力的贡献者之一,在 RISC-V 全球生态建设中正起到关键核心作用。

包云岗

现任中国科学院计算技术研究所副所长,北京开源芯片研究院首席科学家,RISC-V 国际基金会理事,中国开放指令生态(RISC-V)联盟秘书长。带领团队在国内率先开展了一系列开源芯片实践,包括开源高性能 RISC-V 处理器核“香山”、“一生一芯”计划等,发表 70 余篇学术论文。入选国家高层次科技创新领军人才计划,获 “CCF-IEEE CS” 青年科学家奖、共青团中央“全国向上向善好青年”等荣誉称号。

RISC-V 高性能计算要解决的三个问题

RISC-V 芯片出货超 100 亿颗,这对 RISC-V 新架构而言,是一个不错的里程碑。不过,成果主要集中在嵌入式 SoC 领域。我们观察到,在 RISC-V 高性能计算领域,已有多家创新企业计划在 2023 年发布类似 64 核@2.0GHz 规格的服务器级处理器,这必将成为 RISC-V 下一个令人激动的里程碑。当然,关于 RISC-V 高性能计算,还有三大问题需要解决: (1)需要为 RISC-V 体系构建一套数学计算库,类似 Intel 处理器的 MKL(Math Kernel Libarary),以支持 RISC-V 在高性能计算的应用,保证计算精度、计算效率以及源代码级安全可控。 目前业内常用的数学计算库主要为 Intel 的 MKL 和 AMD 的 ACML,二者都是免费的,但不开源,因为这是软件类核心知识产权。也许您认为免费不就可以了吗?但当您遇到针对场景需要优化时,将无能为力。这些代码谁担保它的安全性、可靠性呢? 虽然有 OpenBLAS、FFTW、Libm 等部分开源项目可以使用,但这远远不够。而且,开源的版本无法保证计算效率和计算精度。偏偏这在高性能计算应用领域(AI 计算、科学计算)是至关重要的。 数学计算库作为计算中间件,函数规模上以千计,与计算性能、安全性、可靠性深度绑定。也就是说,它将最终决定处理器是否能进入高性能计算领域。 (2)如何让 RISC-V 回归到计算机技术的垂直整合,而不是横向分解的时代?在算力驱动的数字经济时代,计算硬件将呈现出多样性。RISC-V 因其开放性,将比 x86 和 arm 生态更加丰富和多样,换一种说法就是严重碎片化。如果单纯追求硬件计算性能的 spec 数据,很容易滑入横向分解的逻辑,出现类似 VLIW(Very Long Instruction Word)超长指令这种怪物,数十亿美金化为教训。 RISC-V 应该回归到垂直整合的思路上来,要去思考,如何前瞻性地理解应用,从计算语言到编译器,再到底层数学计算库,再到计算机体系结构,实现多个方面垂直整合。存量市场只有赤裸裸的性价比竞争,瞄准增量市场才有跨越式发展的可能。 (3)在异构计算时代,如何构建 “RISC-V CPU + 加速卡(GPU、NPU、DSA、FPGA)” 的高性能异构计算软件栈?面向异构计算黄金时代,国际三巨头以其雄厚的资本实力各自为战,都在整合异构计算硬件平台(CPU、GPU、FPGA等)和布局异构计算软件栈(CUDA、OneAPI、ROCm),试图形成自己的软硬融合的生态体系,同时展开封闭和开放生态之争。 这也意味着 RISC-V 领域也必须面临如何解决异构生态的问题,即,如何解决“n 家公司的 RISC-V CPU + m 家公司的加速卡”的硬件组合,这种组合数量将高达到 n x m;如何实现软硬融合,遵循什么样的 API 标准(开源/自研);异构计算软件栈的应投入多少预算等问题。

王军辉

澎峰科技联合创始人兼首席运营官,毕业于中南大学。曾在科广电子、Thomson、Vimicro、中科院计算所西研院任职,集成电路设计行业从业二十多年。

编辑:黄飞

 

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分