电子说
最近痛陈国产“芯”悲惨历史的各种文章充斥网络,各种民族主义泛滥,今天本号斗胆也评论下国产CPU为何尚未足够成功,原因很简单,那就是手气差——选错了指令集架构。
本文节选于出版书籍《手把手教你设计CPU——RISC-V处理器篇》第一章。
ISA请扛起这口锅——为什么国产CPU尚未足够成功
众所周知,芯片是我国信息产业发展的核心领域,而CPU则代表了芯片中的核心技术。在此方面,我国与发达国家相比有着明显的差距。虽然经过多年的努力,技术差距已经有了显著的缩小,但是在民用商业领域内,仍然没有看到太多国产CPU的身影。是什么原因造成国产商业CPU尚未足够成功这一现状呢?接下来,我们便细数一下国内自主开发CPU的公司与现状,以及它们选择的指令集流派。通过逐一分析其过去与现状,相信能够让读者得到答案。
MIPS系——龙芯和君正
1.龙芯
龙芯CPU由中国科学院计算技术所龙芯课题组研制,由中国科学院计算技术所授权的北京神州龙芯集成电路设计公司研发。以下是龙芯CPU芯片的相关简介。
·龙芯1号的频率为266MHz,最早在2002年开始使用,如图1-3所示。
·龙芯2号的频率最高为1GHz。
·龙芯3A系列是国产商用4核处理器。最新龙芯3A3000基于中芯28nm FDSOI工艺,设计为4核64位,主频为1.5GHz,功耗仅为30W,非常适合笔记本平台。
·龙芯3B系列是国产商用8核处理器,主频超过1GHz,支持向量运算加速,峰值计算能力达到128GFLOPS,具有很高的性能功耗比。龙芯3B系列主要用于高性能计算机、高性能服务器、数字信号处理等领域。
2.君正
国内的MIPS系还有另外一家公司——北京君正。君正和龙芯同属于MIPS阵营,与龙芯着力于桌面PC处理器不同,北京君正是国内较早专注于可穿戴、物联网领域的本土IC设计公司之一。由于嵌入式芯片的软件一般按需求定制。这导致在智能可穿戴市场,相当一部分可穿戴产品和应用软件具有专用性,软件生态链相对较短,加上应用需求的多样化,因此不能用一套通用方案来满足所有人的要求,所以在这个领域没有某个厂商可以实现垄断。因此,在智能穿戴市场不容易出现PC和移动手机市场那样被x86与ARM架构垄断的情况。
智能穿戴芯片和物联网芯片对性能要求不高,大部分应用场景更关注低功耗、廉价和尺寸等因素,君正的产品完全满足性能要求,x86处理器不可能应用于该领域,ARM阵营IC设计公司受制于相对较高的授权费,在芯片产量较小的情况下,并不具备价格上的竞争力。君正拥有十多年的芯片设计经验和技术积累,其最大的特点就是具有较高的性能功耗比。国内第一批上市的智能手表包括果壳的第一代智能手表、土曼一代、土曼二代智能手表等都采用了君正的方案。
x86系——北大众志、兆芯和海光
1.北大众志
北京北大众志微系统科技有限责任公司成立于2002年11月,是国家集成电路设计行业的重要骨干企业。2005年,AMD与中国政府达成了协议,科技部指定北大微电子中心接收AMD Geode-2处理器的技术授权,AMD的处理器无疑是x86架构,中国因此获得了x86技术。不过Geode处理器属于AMD嵌入式处理器,因此AMD授权给北大的x86技术属于嵌入式架构。
2.兆芯
另外一家使用x86架构的国内企业——兆芯,也许被更多的人所熟知。众所周知,核心的x86架构是 Intel和AMD公司的核心技术,美国政府也会严格控制其技术的授权。不过,除了Intel和AMD,另外一家中国***公司威盛(VIA)也曾经拥有x86架构授权。据称,如图1-8所示,兆芯自主研发的ZX-C处理器于2015年4月量产,28nm工艺,4核处理器,主频可达2.0GHz,并且支持国密算法加密。2017年兆芯宣布其最新一代ZX-D系列4核和8核通用处理器已经成功流片,并透露将在2018年推出16nm的ZX-E 8核CPU。
3.海光
除了上海兆芯,还有一家诞生不久的新锐公司——天津海光。2016年,AMD宣布与中国天津海光投资公司达成了协议,将x86技术授权给海光公司,获得授权费,并且双方还会成立合资公司,授权其生产服务器处理器。据称,为了打开中国高性能服务器市场,AMD这次授权给中国公司的x86很可能是最尖端的x86技术。对于海光的表现,也值得我们拭目以待。
Power系——中晟宏芯
蓝色巨人IBM的Power架构一直是高性能的代言。IBM于2013年联合NVIDIA等公司成立OpenPower开放联盟,其他公司也可以获得Power架构授权。此后还推动成立了中国POWER技术产业生态联盟,与多家中国公司签署了授权协议,中晟宏芯就是其中的一家。中晟宏芯成立于2013年,相信宏芯能用若干年的时间实现技术的消化吸收和推陈出新。
Alpha系——申威
申威处理器或申威CPU,简称“SW处理器”。
申威对自主的Alpha架构在不断深化升级,在双核Alpha基础上拓展了多核架构和SIMD等特色扩展指令集,主要面向高性能计算、服务器领域,在2016年国际超算大会评比中,基于申威26010处理器的“神威太湖之光”超级计算机系统(如图1-9所示)首次亮相并夺冠,其峰值性能达每秒12.5×108亿次浮点运算,成为世界首台运行速度超109亿次的超级计算机。
ARM系——飞腾、华为海思、展讯和华芯通
为了更好地理解本节的内容,有必要先对ARM的授权模式进行介绍。简而言之,ARM公司的主要授权模式可以分为两种。
·授权“ARM处理器IP”给其他的芯片生产商(合作伙伴),后者直接使用ARM处理器IP设计SoC芯片。
·授权“ARM架构”给其他的芯片生产商(合作伙伴),后者基于ARM架构自研其处理器核,然后使用自研处理器核设计SoC芯片。
1.飞腾
飞腾公司是中国国防科技大学高性能处理器研究团队建立的企业,国防科大多年来在CPU领域的耕耘积累了雄厚的技术实力。2016年天津飞腾公布了最新产品FT2000,它最早亮相于2015年的HotChips大会,代号“火星”,定位于高性能服务器、行业业务主机等。FT2000采用ARMv8指令集,但是使用自研内核,不同于市面上ARMv8的Cortex-A53A57A72(直接购买于ARM公司的内核)。
FT2000之所以引人注目还因为它在性能方面,包括高达64个FTC661处理器核,其公布的Spec 2006测试中,成绩为整数672、浮点585,足以和Xeon E5-2699v3相媲美。这也是国产服务器芯片第一次在性能上追平Intel,存储器控制芯片总聚合带宽为204.8GB/s,超过目前的E5V3和E7V3,接近IBM POWER8(230GB/s)。跑分与Intel的Xeon E5-2699v3相媲美意味着飞腾2000对于很多商业应用来说已经完全够用了,只要软件生态跟得上,完全可以在商业市场上取代Intel的某些产品。
2.华为海思
华为海思目前是我国技术最强大的芯片开发商之一。华为的麒麟芯片在性能上与高通、三星这些领先的芯片企业处于一个水平。同时华为目前也是国内四大服务器提供商之一,华为、联想、浪潮等国产服务器企业占有中国服务器市场的份额已经超过65%。华为在几年前便已经购买了ARM指令集架构授权,开始研发自有的处理器核,主攻服务器市场。
在“十二五”科技创新成就展上,华为展出了其第一台ARM平台服务器“泰山”,配备自主研发ARM架构64位处理器“Hi1612”,采用台积电16nm工艺,拥有多达16个核心,兼容ARMv8-A指令集。凭借华为强大的研发实力与市场运作能力,相信一定会有不俗的表现。
3.展讯
除华为之外,展讯是另一家国内手机芯片的翘楚。2016年展讯的芯片出货达到67000万套,2017年6月宣布成功研发其自主的ARM架构处理器,展讯宣称在SC9850 4核(Cortex-A7)芯片同样大的面积上实现了6核的设计,功耗和性能都可以按照自己的需求调配,标志着展讯成为了除苹果、三星两家智能手机厂商之外(三星和苹果的自主芯片主要都是自用),继高通之后,第二家拥有自主ARM CPU关键技术的手机芯片厂商。
4.华芯通
2016年,高通与中国贵州政府合资在华成立了一家芯片公司——华芯通半导体,旨在专门为中国市场设计与开发服务器专用芯片的公司。华芯通已获ARM v8-A架构授权,并表示中国成为全球第二大数据中心市场,该授权将帮助华芯通半导体在快速扩张的中国服务器市场推出先进服务器芯片组技术,帮助中国企业在本土市场提供基于ARM的服务器技术,从而推动高效服务器解决方案的大规模部署。
背锅侠ISA
从上述几个章节中,我们已经了解了国内CPU设计的英雄榜。但是如前文所述,目前在民用商业领域内,仍然没有看到太多国产CPU的身影。可以说,国产处理器在民用商业领域至今尚未足够成功的主要原因在于ISA,这口锅ISA必背无疑。
论述了指令集架构(ISA)对于CPU的重要性,那么对于一款CPU而言,绝对的硬件技术水平不是最重要的。
目前商业主流的指令集架构在不同的领域已经各自出现了明显的霸主格局。
· x86架构统治着桌面PC与服务器领域。
·ARM架构统治着移动手持领域,同时对桌面PC和服务器领域全面进军。
·ARM在嵌入式领域占据绝对优势。
因此作者之前一直认为,只有依附于x86与ARM阵营的商业公司,才能够真正地实现全面的商用化。相信这也是为什么在近几年来国内CPU设计的英雄榜上涌现出来的大多为x86或者ARM系的原因。
但是,国产自主对我国的国计民生又至关重要,追求国产自主安全可控是我国在战略上必须坚持的方向。从这个角度上来看,选择x86或者ARM架构终究也有其局限性,分别论述如下。
1.x86架构
·由于Intel与AMD本身是芯片公司而不是知识产权(IP)公司,因此x86架构是其生命线,假设其他得到授权的芯片公司使用x86架构生产的芯片对Intel和AMD造成了实质威胁时,Intel与AMD完全可以拿起专利的大棒停止授权。
·x86架构的授权费用极为高昂,远非普通公司或者组织能够染指。
2.ARM架构
·ARM架构的局面会乐观很多,因为ARM架构虽然也是属于ARM公司且受专利保护的架构,但是ARM公司的商业模式是以开放共赢为基本原则。ARM公司是ARM生态的主导者和核心规则的制定者,通过基础架构授权、IP核授权等方式获得经济收益。而生态系统中大量的上下游软硬件企业则遵循ARM统一制定的标准规范,对接众多客户需求而实现经济利益的获取。
·国内基于ARM生态的CPU产业已有较好基础,华为海思、展讯、联芯和飞腾等众多企业均已累积多年的ARM芯片研发经验,在移动终端领域我国芯片设计技术已与国际主流水平同步,国外的巨头高通、三星和谷歌等也属于ARM生态系统阵营的成员。因此,从全球范围来看,国内外的芯片公司能够在开放共赢的生态下进行公平的竞争。基于上述原因,国内CPU英雄榜上使用ARM架构的CPU公司,其成就更加令人可期。
·尽管如此,ARM架构毕竟属于ARM公司,一方面需要为ARM公司支付极其高昂的授权费(一次数千万美金),另一方面被软银收购后ARM现在属于一家日本公司。因此,从绝对的自主可控的角度来看,受制于人那是在所难免的。
所谓“成也萧何,败也萧何”,读到此处,读者可能要问,难道就没有一种ISA具备如下几个特点吗?
(1)它开源共享,不属于某一家商业公司私有,因此也就不会有受制于人与自主可控的隐忧,更加不需要向商业公司支付高昂的授权费。
(2)它以开放共赢为基本原则,有一个统一的非盈利组织作为主导者和核心规则的制定者,任何公司和个人都可以永久免费地使用其架构。
·生态系统中大量的上下游软硬件企业应遵循该组织统一制定的标准规范,对接众多客户需求而实现经济利益的获取。
·同样从全球范围来看,国内国外的芯片公司能够在此开放共赢的生态下进行公平的竞争。
相信很多人都与作者一样,在很长的一段时间内,非常期待有这样一种ISA的出现,业界甚至出现过希望由国家主导指定一种国家标准ISA,从而统一国内CPU各ISA派系的声音。然而,国家标准ISA这种被局限在一国范围内的技术在当今全球化的趋势下,必然是格格不入且不可能成功的。于是所有人都认为不可能出现这样一种ISA了,作者作为一名CPU设计的老兵,也不得不用一首诗来表达一下彼时的心情:“死去元知万事空,但悲不见九州同。王师北定中原日,家祭无忘告乃翁”。
然而在2016年,有一位叫做RISC-V的新生突然自带光环登场。它完全符合上述提到的两个条件,属于全人类的免费开放架构,无任何专利的桎梏,众多国际知名大公司均加入其中,将以开放共赢的生态下进行公平的竞争。作者隐隐感到,如果这个ISA真能够发展起来,这似乎可能是国产CPU崛起的真正机会。
刚才我们提到曾有人建议制定一种国家标准的指令集架构,而当RISC-V诞生不久,我们的邻国印度迅速地采用了RISC-V作为其国家标准的指令集,推荐其国内的大学和研究机构均采用RISC-V架构,并且已经制定规划且投入专项资金用于开发几个不同系列的RISC-V处理器。我们国家的相关处理器公司,,,,好像一致出离的沉默起来。。
人生已是如此艰难,你又何必拆穿——CPU从业者的无奈
对于每一个行业的普通从业者而言,都希望所在行业能够蓬勃发展、欣欣向荣,能够有大量的商业公司参与并产生大量工作岗位的需求。倘使所在的行业或是日暮西山,或是走向寡头化成为一潭死水,自然也就无法诞生大量的工作需求,那普通的从业者们可能就只有“寻寻觅觅,冷冷清清,凄凄惨惨戚戚”,或者“门前冷落鞍马稀,老大嫁作商人妇”了。
处理器设计便是一个典型的例子。虽然处理器设计是一门开放的学科,其所需的技术均已成熟,很多的工程师与从业人员都已经掌握,也具备开发的处理器的能力。但是:
·由于处理器架构长期以来主要由以Intel(x86架构)与ARM(ARM架构)为代表的商业巨头公司所掌控,及其软件生态环境衍生出的寡头排他效应,成为了普通公司与个人无法逾越的天堑。
·由于寡头的排他效应,众多的处理器体系结构走向消亡,国产的商用CPU也无法足够成功,从而造成了CPU设计这项工作变成了极少数商业公司的“堂前燕”,普通平民“只可远观,而不可亵玩焉”,国内长期没有形成有足够影响力的相关产业与商业公司。
综上,作者作为曾经在国际一流公司任职的CPU高级设计工程师,竟一度在换工作时面临择业无门的窘境,更扼腕叹息众多同仁被迫转行的情形。正可谓“曲高者和寡,大音者稀声”,CPU设计从业者,颇无奈也。读至此,被迫转行的同仁们可能已经老泪纵横:“人生已是如此的艰难,你又何必拆穿啊”。
好消息是最近几年来国内CPU产业的情形终于发生了的改观,由于中国的巨大市场与产业支持,国内涌现出了如上节中我们提到的兆芯、飞腾、华为、展讯、海光和华芯通等从事CPU设计的公司,且随着RISC-V架构之诞生,都将催生更多的市场需求。
结语:悟已往之不谏,知来者之可追
最近讨论国产“芯”悲惨历史的各种文章充斥网络,各种民族主义泛滥,本硅斗胆认为国产CPU为何尚未足够成功,原因很简单,那就是手气差——选错了指令集架构。面向未来,我们该如何选择?。。。听说隔壁楼盘新开了一期,不知道这一批价格涨的咋样。。。对了,查一查本期的房贷几号到期。。卡里的钱好像不够了。。
全部0条评论
快来发表一下你的评论吧 !