Ampere 也开始造ARM芯片,冲击老东家Intel

杨鑫 发表于 2018-03-06 16:46:27 收藏 已收藏
赞(0) •  评论(0

Ampere 也开始造ARM芯片,冲击老东家Intel

杨鑫 发表于 2018-03-06 16:46:27

日前,一则英特尔前总裁投身ARM服务器芯片领域,叫板老东家的新闻在业内掀起了轩然大波。报道中表示,前英特尔总裁雷尼·詹姆斯(Renee James)在凯雷集团(The Carlyle Group)的支持下,运营了一家叫做Ampere的公司,新公司已经推出了首款ARM服务器芯片。据了解,凯雷集团是一家上市的投资公司,投资过近300家净资产1700亿美元的公司,2017年通过投资获得约40亿美元的管理费用和收入。

其实两年前,在MACOM收购ARM服务型芯片供应商Applied Micro开发多年的X Gene伺服器处理器(X Gene server processor)没多久后,凯雷资本又涉足拿下相关业务。这一举动意味着凯雷资本认为ARM服务器可以很好地用于数据中心(datacenter)领域,由于该公司不会轻易投资任何技术,因此业界认为ARM服务器芯片的胜率大增。 

之前我们说过,凯雷资本旗下的Project Denver LLC公司收购了Applied Micro的服务器芯片设计,尽管此公司与英伟达长期搁置的「Project Denver」项目(这个项目旨在将ARM处理器用于GPU)的名称相同,但它从来没有收购过此项目。

英伟达的Project Denver是该公司七年前以未来特斯拉(Tesla)产品的形式推出的产品(意在实现游戏和其它嵌入系统Tegra系列的混合CPU-GPU),但却在几年后悄悄地被搁置了。我们曾就此公司名字「Project Denver」的由来问过曾任Applied Micro计算业务的软件和平台工程的副总裁Kumar Sankaran(如今他在Ampere从事同样的工作,但他告诉我们这只是一个巧合。

如果这不是巧合,英伟达的技术也在其中的话就非常有趣了。但现在也很有趣,现在Applied Micro技术有了凯雷资本的支持,并会用于未来Ampere的芯片中,这对高通(Qualcomm)和Cavium的ARM芯片造成了一定的威胁,也会让英特尔和AMD在数据中心领域的业务损失一部分市场。但奇怪的是,Applied Micro还拥有大量的网络技术,但却没有被凯雷资本收购。这是一个严格的合作协议,据Sankaran说,尽管Ampere可以创建自己的以25 Gb /秒、50 Gb /秒或100 Gb /秒速度运行的网络接口卡,将其嵌入未来的芯片单元系统中,但它并不想开发自己的交换ASIC(Sankaran并没有透露Ampere的计划)。

Ampere有超强的团队阵容:

首先,创始人是之前是英特尔副总裁的Renee James(之后将芯片巨头的首席执行官位置转交至Brian Krzanich),她在英特尔担任过多个职位,曾负责公司的McAfee安全软件部门。

然后是在英特尔工作多年的财务专家Chi Miller(前身为苹果公司财务总监)加入Ampere担任首席运营官兼首席财务官,我们相信他会严格地控制公司的财务状况。

Rohit Vidwans,在英特尔工作了26年,领导了许多代的Atom和Xeon处理器开发,现在是Ampere的硬件工程的执行副总裁。

之后是Atiq Bajwa,30年英特尔的老将,曾是X86架构的带头人,现在是Arm服务器芯片新贵的主架构师。

Greg favor,曾是AMD的研究员,K6和K7开发团队的一员,也是Applied Micro的X Gene处理器的首席架构师,现在是Ampere的高级研究员。

总的来说,这是一个很可怕的团队。

从以下图片,我们可以看到他们Ampere关注的市场:

与高通的「Amberwing」Centriq 2400处理器和Cavium的ThunderX和ThunderX2处理器的选定型号一样,Ampere专注于云服务器市场,也就是想打入超大规模和云市场。从上图你可以看到,服务器CPU市场增长缓慢,年复合增长率为3%,但其中的云计算部分(使用Ampere的定义,不是我们的)每年增长15%,到2021年将占服务器芯片出货量的50%左右。

我们可以预测到,IT厂商或许不会因为公共云而大量买入原始Arm服务器,但由于成本优势,Arm处理器可以(也将会)投入使用,运行各种数据和存储工作。

Ampere也知道这一点,因为Applied Micro先前已经将「Storm」X-Gene 1和「Shadowcat」X-Gene 2处理器在此方面进行了超过25,000次概念验证和机器测试。 X-Gene-1采用台湾半导体制造公司(Taiwan Semiconductor Manufacturing Corp)的40纳米工艺,提供8个强大和定制的2.4 GHz的Armv8内核;X-Gene 2理论上可以通过RoCE增强网络扩展到16个内核,但尽管使用了28纳米工艺(工艺上的很大进步),也只能在2.8 GHz运行8个内核。

2015年11月Applied Micro提出了「Skylark」X-Gene 3芯片项目的具体规划,之后在2016年10月推出,Applied Micro采用了台积电16纳米的FinFET工艺,内核数量增加,时钟频率略有增加,内存通道增加了一倍(达到八个),DDR4减速。 Applied Micro表示X-Gene 3将拥有32个内核,采用更传统的L2和L3高速缓存架构,并支持高达1 TB的2.67 GHz DDR4内存,这比英特尔「Skylake」Xeon SP Silver和Gold处理器的带宽和容量高出33%。X-Gene 3芯片还在8个控制器上集成了SATA I / O端口和42通道PCI-Express外设带宽。

不管怎么说,这是一个非常强大的服务器芯片,完全可以与Epyc或Centriq或ThunderX2等芯片竞争。然而它并不针对更强的Xeon SP Platinum和IBM的Power9。但没关系,来日方长。

X-Gene 3芯片在2017年3月开始试样,预计将于今年第一季度开始量产。 (Sankaran告诉The Next Platform ,已放弃X-Gene 1和X-Gene 2芯片)鉴于Applied Micro和MACOM过去六个月的变动,X-Gene 3芯片的交付已延迟至2018年下半年,但Sankaran说,Ampere不希望只是一个测试平台,我们期望客户投入生产。该芯片出现后,将不再被叫做X-Gene,而成为一个新的品牌,以此作为起点继续推进。而且,重要的是,它在原来设计的基础上有所调整——以比16纳米先进的工艺实现,并且时钟速度可以提升到3.3GHz。

下图展示了Ampere芯片的竞争优势:

上表中有趣的一点是,Ampere提供了SPECint_rate2006 CPU测试的整数性能(integer performance),list price和热设计功耗值(thermal design point)(我们认为是32个内核部分的最大值)。英特尔最高端的服务器(四个),28个内核的Xeon SP-8180M芯片(时钟频率为2.5 GHz),在同一测试中的额定值为5530,这意味着每个插槽(socket)的额定值约为1383。

英特尔芯片的list price是13,011美元,在同样的测试中,每SPEC性能达到9.40美元,每瓦特对应6.74单位性能。上图中的X-Gene 3 芯片在500个单位的性能上性能并不高,但每单位性能是1.90美元,每瓦特对应4.0单位性能。这比英特尔的每瓦性能提高了40%。

当然,这并不是真正的比较,因为Armv8内核不是Xeon SP内核,但也确实表示了最坏的情况。如果研究每机架(rack)的计算密度和成本,所有的加起来,与Xeon SP Gold和Silver比较,差距可能没有那么大。拿Xeon SP-6152 Gold来说,它有22个内核,时钟频率是2.1GHz。双socket机器的额定值为2120,即每socket的整数性能为1060,140瓦特,3655美元,或者说每单位性能3.45美元,每瓦7.6单位性能。后者又一次地比正在交付的Ampere X-Gene 3好。但你可以购买两个Ampere芯片来实现相同的性能,花费更少。

这一切都证明了Ampere更好,而且差距将会大到使它打入超大规模和云数据中心市场。记得要在系统层面看事物,而不仅仅在CPU层面。

Sankaran解释说:「大多数人的痛点在于降低总拥有成本(TCO),在我们想要的市场——网络层,数据分析,大数据和存储——我们的上市给客户提供了每rack相同性能下一个更低的TCO。TCO由三个向量组成:功耗,性能和价格。如果你以各种方式来调节这三个因素,就可以大大节省成本,这也是公司改变架构的原因。系统级别要实现的TCO取决于工作负载。在存储方面,任何大于5%的TCO都是一件大事,因为存储平台(storage platform)主要受到存储介质(storage media)的影响。这与大数据或Web基础设施不同,它们主要在于计算成本,这种情况下,任何节省大于15%TCO的情况下都要改变架构。」

这与Google告诉我们的结果是一致的,那就是因为20%的成本节省改变架构。

Ampere目前正在研发多于两代的X-Gene 3芯片,接下来是X-Gene 3的后续产品。下一个将会是刚成立的Ampere团队设计的第一个芯片,有相似的功率范围——所有大约125瓦,但性能更高,因此有更高的性能功耗比。在此之后,我们很难去预测。Ampere可能会继续与TSMC合作降低其工艺尺寸,但Sankaran说公司一直在寻找竞争者的工艺路线图。对于英特尔,它并没有做太多的晶圆厂工作;三星做一些;台积电(TSMC)则是完全的代工厂;而格罗方德(GlobalFoundries)也是完全的代工厂商,如果台积电不能一如既往地减小其工艺尺寸,那么格罗方德将有望赢得一些业务。

收藏

相关话题
文章来源栏目
+关注

评论(0)

加载更多评论

参与评论

分享到

QQ空间 QQ好友 微博
取消