专门起底国产CPU研发团队的“三驾马车”之一,飞腾

电子说

1.2w人已加入

描述

前言:就在昨天,飞腾CPU服务器、龙芯CPU服务器以及申威CPU服务器进入政府采购名录的消息突然刷爆全网。这是国产CPU服务器第一次进入政府采购名录,业内人士普遍认为,该次进入名录对于国内CPU企业发展具有里程碑的意义。本文专门起底国产CPU研发团队的“三驾马车”之一,飞腾。

天津飞腾信息技术有限公司

中国对国产CPU和OS的研发支持始于上世纪90年代的“泰山计划”,由于种种原因,该计划不幸夭折,今天,在各种搜索引擎中已经找不到关于这个计划的任何只言片语。然而,不了了之的计划却为中国未来的CPU研发留下了火种,这小小的火种后来演变成三支国字号的队伍:飞腾、龙芯、申威。近年来,随着上述三个团队的持续发力,以及宏芯、兆芯等民营或合资的CPU研发企业的成立,中国芯的水平正在慢慢接近国际水准。其中,尤以“飞腾”的表现最为抢眼,他不仅研发了世界上首款基于ARM架构的64核CPU“火星”,也是国产CPU企业中,唯一一个从高性能计算芯片(大)到桌面、嵌入式芯片(小)均能提供产品的企业。关于飞腾的故事,要从让他名声大噪的“火星”讲起。

01战神“火星”

张承义没有想到,他在读硕士时随手起的英文名Charles Zhang ,十五年后会在芯片圈内一夜爆红。

2015年8月,知乎、雷锋网、至顶网、EETimes……等国内外网络平台上,纷至沓来的业内人士都在讨论Charles Zhang在刚刚结束的HotChips 2015 大会上做的那个主题发言《Mars: A 64-core ARMv8 Processor》(“火星”:一款64核ARMV8兼容微处理器)。

引起热议的第一个原因是,由Charles Zhang所在的“飞腾团队”,设计出的代号为“火星”(Mars)的CUP芯片是世界上第一款基于ARM架构的64核CPU,这款ARM阵营最强大的CPU居然是由一个低调的中国团队设计出来的,无论如何在业界都是爆炸性新闻;第二个原因是,作为第二家受邀站上HotChips舞台的中国CPU团队——第一家是2008年的龙芯,飞腾代表的是这七年里整个中国通用CPU芯片的进展,可是Charles Zhang汇报用的PPT,做的实在是,太烂了。

HotChips大会堪称国际CPU领域的“华山论剑”。大会自1989年第一届始,年年都在硅谷的同一个地方举办(早些年是斯坦福大学,近些年是弗林特中心),从不挪窝。每年,CPU 巨头们和新兴企业们通过它向世人展示企业对芯片架构的最新想法。虽然不是第一个站上HotChips舞台的中国团队,“飞腾”还是创造了一项大会记录——HotChips史上第一个嘉宾没有到现场的远程主题报告。

因为,倒霉的Charles Zhang没有拿到赴美签证。

事后总结,张承义认为这是PPT做的烂的首要因素。拿不到签证,团队早早放弃了参加大会的想法,并向大会申请撤下报告。在HotChips的盛情邀请下,直到会前几天才确定用远程报告的形式参会,张承义那时才开始赶工修改PPT,而且大会要求提前几天定稿,留给他修饰PPT的时间并不多。第二个原因是缺乏经验,PPT的内容分三部分,第一部分着重讲飞腾自主处理器核的设计,第二部分讲整个芯片的片上存储和互连设计,最后讲芯片的物理指标和性能指标,结果第一部分讲得时间太长,导致后面时间不足,匆匆结了尾。第三个原因是,原本调试好的视频会议(Google Hangouts),临到会前半小时,突然视频信号无法显示,仓促改成了语音汇报,于是全球的同行干巴巴地看着一个至简至丑的PPT,听着一个差强人意的中式英语虎头蛇尾的介绍完世界上第一款64核ARM架构的CPU芯片。种种阴差阳错导致现场反应相当冷淡,这也是被国内同行深深诟病的一点。

cpu

Charles Zhang当年的PPT现在在网上还能找到

对张承义而言,这个重要的历史时刻更是书写得有些哭笑不得。2015年8月25号北京时间早晨6点,他一个人在自家书房里完成了这款集飞腾团队大成的,也是当时中国最强通用CPU芯片的发布会。隔壁房间里,上小学的儿子正微微的打着小呼噜。

Hotchips上糟糕的亮相,让飞腾团队在后来相当长的一段时间里,饱受国内业界质疑。由于当时“火星”确未流片,一些人认为这又是国内研究机构在放卫星、骗经费。重压之下,飞腾团队的反应异常冷静:不做任何辩解,继续埋头工作。与国内某些CPU团队频频在媒体上放话的高调不同,飞腾团队速来的风格都是内敛低调——“你说你的,我做我的,到时候,我们拿真家伙出来见”。

一年后的夏天,在Hotchips 2016大会上,飞腾团队展出了“火星”的样片及服务器样机,并演示了基于“火星”的企业级应用解决方案。“火星”在飞腾芯片体系中被命名为FT-2000,其性能持平Intel的E5服务器芯片,这是国产服务器芯片第一次在性能上追平Intel。换言之,2016年的“火星”样片的水平大约相当于2014年Intel服务器芯片的水平。至此,一年前刻薄的质疑声烟消云散。

cpu

“火星”主要性能指标

飞腾团队参加Hotchips 2016大会

“火星”采用的微内核结构也有一个昵称,“xiaomi”,中文“小米”的拼音,业界一度疑心此处的“xiaomi”和雷军的小米有什么关系。真相却是一丁点关系都没有。飞腾研发团队的主体人员都是理工男,起名这种事完全不擅长。有一天,领导突然指着团队一个设计师说,“你家姑娘小名是叫小米吧?我们这一代微结构就叫xiaomi,下一代换他家的,chengcheng,还有那个谁家的,是不是叫ViVi?就这样定了。”结果下一代微结构并没叫chengcheng,现在叫dami(大米)。大家时常开玩笑:再下一代会不会叫yumi(玉米)?

至于FT-2000起名叫“火星”,则是一种精心设计。飞腾系列芯片上一代采用的SPARC架构,源自美国SUN公司。“SUN”翻译过来是“太阳”,为了表明自己的设计离SUN公司越来越远,飞腾系列芯片的架构代号都以太阳系行星来命名,最早的架构代号叫“水星”(Mecury),第二代架构叫“金星”(Venus),转换到ARM兼容时来到第三代架构叫“地球”(Earth),也就是FT-1500A,FT-2000则叫“火星”(Mars),属于第四代架构。照道理,接下来新型架构应该叫“木星”(Jupiter),可是团队内部很喜欢“火星”这个名字,直接火星1代,火星2代……这样命名下去了。

“火星”的英文名“Mars”在罗马神话里,是“战神”的意思,这大概也暗含了飞腾人最深的愿景:在通用CPU领域成为战无不胜攻无不克的战神。

02二十年求索,不变中国芯

所有看似偶然的“横空出世”背后,都有不为人知的艰辛求索。“火星”亦然。为了这颗实至名归的中国芯,飞腾团队用了二十年。

上世纪90年代末,怀揣着“为国造芯”的梦想,飞腾组建团队开启了“中国芯”研发的征程。到2006年,飞腾团队研制成功了两代国产CPU,在关键领域实现了规模化应用。“十一五”期间,在国家 “核高基”科技重大专项的支持下,以 FT-1000/FT-1000A和FT1500为代表的第三代飞腾CPU走向商业应用。第三代飞腾CPU使用的是SPARC指令集架构,但SPARC孱弱的生态系统无法支撑飞腾CPU的大规模商用,飞腾真正进入跨越式的腾飞,是开始于第四代飞腾CPU的问世,即兼容ARM指令集研发的FT-1500A和FT-2000系列CPU。

2011年秋天,飞腾项目组在长沙旁边的宁乡县召开的研讨会被视作飞腾发展史上的“遵义会议”。

那次会议,只做了一件事:讨论飞腾是继续沿着SPARC架构向前走,还是转向ARM架构。

当时,项目组的人力正兵分两路,一路沿着SPARC架构继续对FT-1500微架构做单核性能升级,一路已经开始研究ARM指令集。会上,两派展开了激烈的争论。SPARC路线派认为目前FT-1000和FT-1500在超算领域已经能够规模化应用,即将量产的FT-1500的性能和工艺在当时国内已经领先,整体性能也在向国际最先进的CPU逼近。虽然单核性能较低,但团队已经开始了超标量乱序处理器核的设计,初步评测能够大幅提升单核性能。此时换架构,意味着一部分设计工作需要推倒重来,代价太大。ARM路线派更多的是从产业生态上考虑,FT-1500虽然性能优秀,但在推广的时候,将会困难重重,不管是国际还是国内,基于SPARC架构的软硬件生态几乎为零,芯片性能再好,没有可以用的软件,跟废铁无异。飞腾除了要做出用于超算的高性能CPU外,还有一项重要的使命是为关键行业和领域的自主可控信息系统提供核心芯片,助推国产集成电路产业发展。ARM的生态是当前唯一能够与x86抗衡的指令集,软硬件和人才基础都是SPARC所无法企及的。而经过设计评估,相比原定的SPARC芯片升级计划,只需要多花额外一年的时间,就可以推出ARM平台CPU样片,但产业化推广却可以节约宝贵的时间。

参会的大领导们几乎黑着脸听两派吵完,最后的闭门会议上,领导和总师组反复比较后,决定放弃SPARC架构,采用ARM架构。

2014年10月,飞腾第一款兼容ARM指令集的CPU,FT-1500A面世,指标相当漂亮,再一次站在了国产CPU的巅峰。转换架构,只用大约三年时间就研发出国内领先的通用CPU芯片,引起业界一片震惊,很多同行怀疑FT-1500A根本不是全自主研发的,而是购买了ARM的IP核授权——唯有这样,才能大幅压缩研发时间。

目前国内所有的通用CPU生产厂商采用的产品架构,都是由西方人发明,架构的同名词是“指令集”。采用哪种指令集,本身与CPU的“自主可控”没有直接关系,那只是一种设计规则,根据这种规则,厂商设计自己的芯片(选择不同的指令集来设计CPU,大致等同于你是用英语写文章还是用中文写文章,不同的语言在使用过程中语法规则是怎样)。而IP核授权,意味着别人把一部分甚至全部芯片设计代码写好再卖给厂商,如果这中间暗藏了后门,厂商是无法知道的。

面对质疑,飞腾团队依旧没有吭声。“打口水仗,是要投入人力和时间的啊!那时候飞腾公司才成立,工作还没理顺,哪里有精力去辩解?飞腾对外宣布是2012底拿到的ARM指令集授权,但是相关工作在2011年就启动了,我们怎么可能一点准备都没有,贸然去跟ARM谈呢?FT-1500A前后研发时间三年,而不是外界看到的二年不到。天津飞腾每一款芯片的处理器核都是自己设计的!!”三年半后,天津飞腾信息技术有限公司(以下简称“天津飞腾”)副总经理郭御风终于把当年憋着的那口恶气吐了出来。

2015年年底,也就是“火星”(FT-2000)只做完了仿真测试,尚未流片之前,惠普全球的首席科学家、全球战略合作副总裁格雷格即带队前往天津飞腾洽谈合作,希望未来将“火星”用到他们的服务器上。目前,百度、阿里等互联网公司均与天津飞腾有接触,希望能够评测飞腾的CPU,为将其应用到他们的云和数据中心做准备。

飞腾转投ARM的初衷之一,是希望可以助推国产集成电路产业的发展,最终打破Intel在高端服务器芯片领域的垄断地位。“火星”的诞生,让挑战Intel的曙光初现。

“火星”虽然达到了能够媲美国际主流CPU的性能,但一个CPU加八块存储扩展卡的整机构建成本非常高,导致“火星”的产业化之路并不顺畅。为了进一步地降低成本,2017年,飞腾流片了优化升级的FT-2000+。该款芯片是飞腾目前最顶尖、也是性价比最高的产品,它集成了64个自主设计的最新通用微处理器核,保留了大容量的片上二级cache,将存储控制器升级为8个DDR4,并从片外集成到了片内。考虑到芯片面积,舍弃了三级cache,虽然对性能造成了一定影响,但单片的解决方案大幅降低了整机成本,提高了整机可靠性,更加符合市场需求。该款芯片的诞生,标志着飞腾完成了科研思维到市场思维的蜕变。FT-2000+工作频率2.3GHz,双精度浮点峰值性能588.8GFlops,功耗96W,spec2006实测性能达到了2014年Intel至强E5主流服务器CPU的水平,依然是国内最高性能的服务器CPU,同时,使用FT-2000+的整机构建成本比使用FT-2000低50%。

03 CPU自主可控之争

“中兴事件”之后,国人建立在消费级互联网上的大国信心瞬间被“缺芯少魂”的现实击碎,“信息系统的自主可控”成为全民关注的焦点。而CPU作为信息系统的核心,是否“自主可控”对于国家信息系统安全和产业系统安全至关重要。

在排除掉CPU的生产研发单位是否符合安全保密要求和研发团队是否本土化这两个外部条件后,业界对CPU自主可控的标准集中在两条:CPU指令集是否可持续自主发展;CPU核源代码是否自主编写。目前,第二条已形成了统一认识,如果不能自主编写核源代码意味着别人如果在设计中安插了后门,CPU生产厂商也无法判断,这完全不符合自主可控的要求。

于是,争论的焦点只集中在“CPU指令集是否可持续自主发展”这一条上。

指令集是一套软硬件之间的语言规范,国际上曾经有不下十种指令集,经过残酷的市场竞争,目前通用领域得到广泛使用的指令集只有Intel的X86和英国Acorn公司的ARM。由于知识产权的限制,早期国产CPU在公开领域一直没有途径使用这两种指令集,早期国产CPU的三驾马车,飞腾、龙芯、申威,不得已分别选择了SPARC指令集、MIPS指令集、ALPHA指令集。这三种指令集之所以可以以极其低廉的价格(比如SPARC给飞腾的授权价只有99美元,ALPHA不要钱)授权,是因为它们的生态环境很弱,需要吸引合作伙伴来共同打造生态才能生存。然而,十余年过去,受到Intel和ARM的双重碾压,SPARC、MIPS、ALPHA的生态系统越来越凋零,导致使用上述指令集的国产CPU的生态环境建设十分艰难。

2011年,飞腾坚定地转向ARM,正是看准了两个道理:纯粹依靠政府输血无法在CPU大战中生存。信息系统领域,是商业竞争高度发达的领域,Intel在50年的发展道路上,曾血战摩托罗拉、与微软联手踏平SUN、SGI、IBM、DEC、惠普等CPU技术流派,期间还顺带把自己的IA-64也灭了,才有了今天在桌面CPU和高端服务器CPU领域的霸主地位。而CPU研发,又是资本和技术高度密集的领域。中国2017年用于集成电路研发总投入约45亿美元,这一数额甚至不足Intel一家公司年研发投入的50%(数据来源:清华大学微电子所所长魏少军教授在SEMICON2017上的演讲)。ARM作为一家只对芯片进行设计却并不生产的企业,2017年的研发总投入也超过了5亿美元。过分强调指令集的自主发展,结果可能会是,让一家在技术上离Intel和ARM相距甚远的企业,依靠一套行将就木的指令集重新搭建一个新的生态系统来挑战Wintel和AA(Android+ARM),赢的难度可想而知。自主可控并不意味着封闭。历史已无数次证明,封闭就会落后,落后就要挨打,挨打就要被消灭,只有以开放的姿态融入世界主流技术体系,由跟跑开始,找准机会,逐步占据产业链上的一个或几个关键节点,做到你中有我、我中有你,让竞争者难以替代,才是中国CPU相关企业的生存之道。

cpu

魏少军教授在SEMICON2017上的演讲ppt

飞腾转向ARM体系后,研发团队迅速扩大,研发速度、芯片性能及生态建设得到明显提升,7年不到的时间里,先后推出了FT-1500A、FT-2000、FT-2000+等一系列高性能CPU产品,联合了400多家企业构建了以飞腾CPU为核心的全自主生态系统,覆盖了从高性能计算、服务器、桌面、嵌入式等多个应用领域,为党政办公系统、基础设施关键行业信息系统、云计算与大数据平台、工业控制系统等多个领域的国产化替代提供全面的解决方案。飞腾也成为国产CPU企业中,唯一一个从高性能计算芯片(大)到桌面、嵌入式芯片(小)均能提供产品的企业。飞腾公司凭借在国际IC设计领域的亮眼表现,入选美国EE Times 2017 “Silicon60”全球60家最值得关注的半导体与电子类创新科技公司,以及首届中国IC独角兽二十强企业。

应用了飞腾CPU的国产自主可控交换机

cpu

飞腾CPU+麒麟OS+400家联盟生态

纵然跨越式的进步让飞腾从“核高基”专项设立之初的参与者成长为领头羊,但实事求是地讲,飞腾公司的发展之路依旧充满艰辛:首先,市场化之路依旧艰辛,在西方巨头们已经纵横捭阖了几十年的通用CPU领域杀出一条血路的难度可想而知,销量上不去就没法实现自我造血,在烧钱的IC领域就没法可持续发展;其次,追赶之路依旧艰辛,虽然取得了点上的进步,但面上距离国际水平还有巨大差距;再次,开拓之路依旧艰辛,国产化替代可以作为厉兵秣马的根据地,但飞腾的志向应更加高远——“飞腾”这个名字由第一代飞腾人李国宽教授所取,其本意是希望这只团队能够以国产芯片的飞腾助力中国信息产业的腾飞,唯有将企业放在开放的市场中磨练,在新兴市场开拓和建立自己的体系才能实现能力的快速增长,从而助推中国信息产业的腾飞梦。

还有一个困难让飞腾团队有苦难言。在面对强大的国际CPU巨头时,弱小的国内企业本该抱团取暖,事实却是某些企业一有机会就抹黑和攻击同行。飞腾每推出一款新产品,网上总有人恶意指摘,而在面对终端客户和管理机关时,飞腾团队常常要花费很大的力气去解释被竞争对手歪曲的事实。这种掉价的招数,飞腾从来不用,他的大度甚至赢得了竞争对手的尊敬。2018年4月,郭御风在北京上下亭面向大学校友做了一场飞腾CPU的内部分享会,某竞争对手家的产品经理闻风也去了现场,听完,他给了三点评价:一、飞腾团队有很深的技术积淀;二、飞腾的商业模式和市场化仍待加强;三、飞腾是个有胸怀的企业,任何场合都不会诋毁对手。

郭御风在上下亭里的分享会

尾声:一辈子一件事

张承义和郭御风是大学同学,都读到了博士,一个专攻CPU核设计和低功耗设计,一个专攻I/O系统设计和全芯片SOC部分。进入天津飞腾后,郭御风任分管研发的副总经理,张承义担任战略规划部的总经理。这两个站在四十岁门槛上的“油腻中年男”还有一个共同的特点——都号称自己有颗文艺范儿的心。张承义称呼郭御风为“湿人”,因为小郭逢年过节逢花开雨落逢云卷云舒,就会在朋友圈发一首浓浓“老干部体”的原创律诗,平仄从来没写对过。而张承义本人的动作更大,他在大学对门的商住楼里买下一套小户型,和隔壁同事的房子打通,开了一家小清新的独立书店,幸好没有房租,每月的收入勉强支付唯一一个雇员的工资。

虽说都是博士头衔,二人觉得自己更像工程师,不像学者。吴军博士所著的畅销书《浪潮之巅》里提到一个观点,“一流的工程师能顶得上10个二流的工程师,一流的工程师天生充满了责任感和好奇心,他们大都满怀信心但虚怀若谷,他们直接但不粗鲁,他们不推诿,他们不在乎工作边界,以团队而不是自己的工作任务为目标。”郭御风认为,飞腾团队的研发骨干大都具备这个特质,这也是飞腾团队早期可以以二三十人的小团队,撬动“大”芯片研发的关键。

这几年,“大国重器”这个词特别流行,郭御风却不知道,自己做的这件事儿,算不算“大国重器”。说不算吧,CPU是信息系统的核心,CPU做不到安全可控整个信息系统建设便如同砂砾上的大厦,随时有倾覆的危险;说算吧,这块让他耗费了二十年青春的晶圆只有1/4个巴掌大小,既不“大”也不“重”。“别看国内这几个主要研发团队相互不服气,其实大家都不容易,几代人的心愿都集中在这个小片片上。前段时间,梁宁那篇讲国产CPU发展历程的万字长文看得人荡气回肠,其中很多故事,我这个资深的CPU从业人员都不知道。跟文中的前辈比,我们只能算第二代。但我们幸运的是赶上了个好时候,踩上了国家自主可控的浪潮。技术革命有它发展的浪潮,一辈子能有幸赶上这样的浪潮,做出点对国家有意义的事,是我们这些科研人员可遇而不可求的幸福。”

就在昨天,全网突然开刷一个消息:龙芯CPU服务器、飞腾CPU服务器以及申威CPU服务器进入政府采购名录。这是国产CPU服务器第一次进入政府采购名录,具有里程碑的意义。

cpu

政府采购发力国产芯片的相关报道

或许,正如郭御风所言,自主可控CPU的升腾之浪,即将掀起。

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分