平头哥半导体带你看懂倚天云实例 自研CPU倚天710已大规模应用

描述

2022云栖大会上,阿里巴巴宣布自研CPU倚天710已大规模应用。

编解码场景实现80%的性价比提升,数据库场景、AI推理场景、大数据场景也都分别有着30%、70%、50%的性价比有效提升。

天猫双 11 核心交易系统平滑迁移至倚天 710 云实例,算力性价比提升30%;汇量科技广告推理业务使用倚天 710 云实例,性能和网络带宽双双提升,性价比提升 40% 以上。

今天就来说说,这些蹭蹭蹭的性价比提升,阿里云ECS倚天实例是怎么实现的呢?

第一个秘密武器是平头哥自研的倚天芯片本身。

倚天710芯片采用无超线程的设计,让计算性能更高。

无超线程设计,是不是有点懵?我们先来了解一下计算机的“大脑”CPU芯片平时是怎么工作的。CPU里面有两个比较重要的分工:

计算,主要CPU核里面的执行单元负责,数量越多往往算得越快,主频则是影响计算速度,越高算得越快;

缓存,则是暂时存数据的歇脚点,比如说你要算A+B=?,就需要先把A和B暂时存着,等到算的时候才用上。

 

后来,技术人员发现,大部分情况,一个应用都用不完一整个物理核,导致CPU有很大一分部分是“闲置”的。

 

于是,就有厂商设计了超线程概念,也就是把一份物理核变成2个vCPU(虚拟CPU),就可以“同时”运行两个应用进程。传统架构的CPU就是这样。

这两个vCPU,因为是在共用一个物理核和缓存,就会导致来自不同vCPU的计算指令要排队被“计算”,同样的缓存里面等待的时候也是一样的。

这样导致的坏处是,因为相互争抢和影响,所以vCPU性能波动较为严重,单个进程也因为要排队,计算速度变慢。

 

无超线程的设计意味着ECS倚天实例采用的是独享物理核心方式,这可以让算力密集的计算指令不必排队、不必争抢,计算速度更快。

 

倚天芯片的ARM架构与生产工艺让功耗更小,运算速度更快、更稳定。

倚天处理器采用的是ARM架构,采用更精简的指令集,本来功耗就比传统架构低,加上先进制程工艺,倚天710的功耗是主流架构的1/6,优势十分明显。

一般来说芯片制程越小,功耗越小,性能越高。

生产制程指的是芯片表面晶体管的尺寸,宽度越小电流通过时的损耗越小,功耗越小;更小尺寸也意味着在同等面积中可以塞入更多的晶体管,而作为运算芯片的基本组成部分,更多的晶体管数量显然能够提供更好的性能。

 

加更多的晶体管,要怎么加也是很有学问的。一般来说架构越新性能越高、能力也更丰富。倚天芯片采用的是最新的ARM v9架构,比之前提供了更多执行单元,也增加安全性、机器学习等新能力。

 

除了算得快,倚天还功耗低,意味着成本低。功耗大不仅意味着成本,可能还会影响计算性能的平稳。传统CPU架构功耗大,导致计算负载过重时温度上升,为了避免高温造成的功能失效,会主动降低主频,进而影响了性能。倚天就没有任何降频问题。

倚天云服务器性价比高的第二个秘密武器,就是阿里云的数据中心处理器,CIPU。

CIPU开创了不同的硬件架构,让服务器以CIPU为中心。

CIPU连接2颗或者更多倚天的芯片,让多个芯片共享一台服务器,这样降低了成本,使得倚天实例更有竞争力。

同时,各个倚天芯片在各自主板上,一旦某个零件出问题,不会影响同一个机器上的另一张芯片,会让产品更为稳定。这样的设计叫多单路的硬件机型设计。

 

双路设计,单个CPU损坏将波及同一主板的CPU

 

依靠CIPU实现双单路设计,低成本+高可用

最后,CIPU将虚拟化与IO转发等数据面卸载到专用硬件上进行加速,消除了原来虚拟化损耗与性能争抢,并大幅加速了IO,也会使得整体性能更高;VPC环境下支持弹性RDMA加速能力,相比TCP时延降低70%以上。

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分