互联网新贵OCP搞了十年,到底行不行?

描述

首先说明一点,我从来都不是OCP的歌颂者,对我来看,他们就是在做一些奇奇怪怪的东西(hack精神),和富士康的黑灯工厂一样,除了给iphone打工以外,没有其他的推广价值。

这个观点的来源是本人职业生涯中的一个关键点,在2011年的第一届OCP大会。当时Dell的DCS group经过艰苦的斗争打败了AWS和Facebook的大server供应商Rackable System[1], 正准备大展宏图,成为数据中心的硬件之王。但是OCP来了,其中的一张照片最说明问题[2]:

Forrest肯定是笑不起来的,他刚刚从一个D火箭升到了SVP,正要“乘风破浪”,结果有人告诉他,现在是“吐槽大会”了。后面的故事,业内的人都知道了。Rackable system变成SGI后被HPE收购,美国的数据中心被台湾同胞占领了。自己这个深有体会,在2009年左右的时候去找昆山产线上的高手修板子,他们的工厂在下午三点就关了空调,说主要是因为6点准时下班,到了下班时大家就内外一个温度了。当然,这个就是现在最流行的“内卷”思想了。台湾公司的上位其实是技术的悲哀。

因为这个原因,自己虽然一直在数据中心讨生活,但是一直有意无意地远离OCP。当然,OCP也在茁壮成长,facebook因为不做云计算,和其他公司没有明显竞争,微软,Google也都把自己的内部项目贡献了出来。在2017年的时候。Microsoft贡献了Project olympus [3], 基本上让高通差点丢了老命。教育一下不知道内情的小伙伴,Microsoft的人认为ARM64在服务器市场有前景,鼓励富裕的小伙伴高通来扩大业务,结果一直很冷静,不参与任何OCP项目的Hock Tan同学一看,机会来了,想一举拿下不务正业的高通。结果吓得高通直接退出数据中心[4],同时对于国内的ARM服务器生态一通重击。

因此,对于OCP的项目,我都是“谨慎乐观”。但是往往出于捡垃圾的习惯,就很关注那些不是标准服务器的项目。比如,2018年的Microsoft的另一个Project Denali[5]我就一直持了怀疑的态度。

原因是之前已经看到了另一个Project Denali的竞争者的尸体。[6]. 整个项目都开源在github,上次去印度研发中心的时候遇到一个做这个项目的印度小伙,笑称可以拿这些资料开一家公司。但是IT这个行业就是这么残酷,淘汰的技术,只会被遗忘。我只能祝福那些拿这个“洋垃圾”办公司的朋友了。

OCP 2019的时候,另一个项目也被我关注了,原因是我客户中的很多很牛逼的软件工程师嘴里都有一个名词“chiplets”,而且是和“DSA” (故意不解释,看不懂的朋友请回了”联系在一起。基本上就是,不同的ASIC的功能不一样,大家一起坐下来,像攒服务器一样攒个芯片。毕竟,过去大家都已经成功地攒了很多服务器。

这个项目就是

这个NFP感觉很眼熟,定睛一看原来是netronome的芯片,这家公司应该算是老相识了。我上一个老板就是他们的VP,一个住在东海岸boston的老美。第一在深圳相见的时候,他主动要吃湘菜,他说之前去南山区的时候就好这口,只是netronome在关键时间点败给了Mellanox,之后就没有之后了。对于NFP,一切要从Flow processor说起。Intel 22nm的第一个flow processor。

从架构上也是那段众核热的产物,和被Mellanox收购的ezchip类似。在使用TCAM做包处理的基础上再前进一步,不仅在match阶段,在action阶段也是基于flow。

第一个问题就是好灵活呀,固件同学很辛苦。

果然在网站上看到了很多软件。

从硬件角度来讲,基于SRAM的确是延时最低的。这个比现在大家做的in-memory computing的架构都先进,除了难编程和扩展性差。

当然,和第8期的IBM 一样,也有数据加速单元。

这里要讲一下,他的string matching技术还是很不错的,Sakir Sezer后面搞了一家做Reg-EX的公司,2019年被Mellanox 收购,并放在他们的Bluefield2的DPU中。

一个22nm的网卡芯片,没有25G的serdes,在现在的市场如何生存。看了一下产品。原来和之前的Intel一样。2x40G改2x25G,这样的话,成本和功耗估计都没有优势。在我常去的HPC和数据中心部件的网点,没有人敢卖2X25G超过300$, 连一直是最贵的chelsio的T6也只要285$.

作为从业人员,其实很理解这种悲凉。没有资金流下一代的芯片,一直用14nm++++++来对抗AMD这样的事,也就Intel可以干。记得上次换工作的时候,有家NVDIMM-F的公司拉我入伙,他们当时自己流片的DDR3的控制器,等到了DDR4的时候,他们已经在用我司的产品了,没资金流DDR4了,赶不上技术发展,IT行业的淘汰太残酷了。

回到ODSA,也看了他们的whitepaper, 例子就是Smartnic。

CPU Chiplet 是Free的RISC-V,I/O Chiplet应该就是serdes,觉得中间那个switching chiplet应该就是NFP了吧。不过,真的要做这个,个人觉得可以用商用的TCAM[7]也行吧。至于Domain Chiplets,我大胆地估计他们会对互联网新贵们讲,“这个是你们的应用!!!”

从最初的构想到现在最新的update,个人认为已经有一些偏差了。这个最新的project的进展:

没有了netronome的NFP的身影,而是一个NIC+FPGA+CPU的路,大家看到这个估计会笑了。目前国内的大部分smartnic已经开始从NIC+FPGA+CPU演进到了FPGA+CPU的阶段。不知道这些人target的用户到底是那些人。不过其中的OCP3.0的网卡规格的确是个好东西。2X100G的网卡数据中心标准,连Dell的服务器上都用上了。

对了,事情都是人在做,发现netronome公司的变化也挺大,

OCP Server/ODSA Project Leader Bapi 离开了公司,原来做编译器的华人大佬也去了华为英研做编译器。而整个公司的灵魂人物Gavin 居然离开了公司。

因为“新冠疫情”,这个我最近注意到第二个人。

还有一个是Nutainx 的CEO。[8]   隐隐感觉下一篇也有了着落。OCP已经快10年了,只要ticktok被打压,Facebook应该会一直玩下去,最新的美国国会作证让小马哥很火,估计他们也放弃了,毕竟我们在微信,头条和抖音的关照下没功夫理这个脸书了。

原文标题:互联网新贵搞OCP十年了,到底行不行?

文章出处:【微信公众号:ssdfans】欢迎添加关注!文章转载请注明出处。

责任编辑:haq

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分