2022云栖大会上,阿里巴巴宣布自研CPU倚天710已大规模应用。
编解码场景实现80%的性价比提升,数据库场景、AI推理场景、大数据场景也都分别有着30%、70%、50%的性价比有效提升。
天猫双 11 核心交易系统平滑迁移至倚天 710 云实例,算力性价比提升30%;汇量科技广告推理业务使用倚天 710 云实例,性能和网络带宽双双提升,性价比提升 40% 以上。
今天就来说说,这些蹭蹭蹭的性价比提升,阿里云ECS倚天实例是怎么实现的呢?
❙
第一个秘密武器是平头哥自研的倚天芯片本身。
倚天710芯片采用无超线程的设计,让计算性能更高。
无超线程设计,是不是有点懵?我们先来了解一下计算机的“大脑”CPU芯片平时是怎么工作的。CPU里面有两个比较重要的分工:
❖
计算,主要CPU核里面的执行单元负责,数量越多往往算得越快,主频则是影响计算速度,越高算得越快;
❖
缓存,则是暂时存数据的歇脚点,比如说你要算A+B=?,就需要先把A和B暂时存着,等到算的时候才用上。
后来,技术人员发现,大部分情况,一个应用都用不完一整个物理核,导致CPU有很大一分部分是“闲置”的。
于是,就有厂商设计了超线程概念,也就是把一份物理核变成2个vCPU(虚拟CPU),就可以“同时”运行两个应用进程。传统架构的CPU就是这样。
这两个vCPU,因为是在共用一个物理核和缓存,就会导致来自不同vCPU的计算指令要排队被“计算”,同样的缓存里面等待的时候也是一样的。
这样导致的坏处是,因为相互争抢和影响,所以vCPU性能波动较为严重,单个进程也因为要排队,计算速度变慢。
无超线程的设计意味着ECS倚天实例采用的是独享物理核心方式,这可以让算力密集的计算指令不必排队、不必争抢,计算速度更快。
❙
倚天芯片的ARM架构与生产工艺让功耗更小,运算速度更快、更稳定。
倚天处理器采用的是ARM架构,采用更精简的指令集,本来功耗就比传统架构低,加上先进制程工艺,倚天710的功耗是主流架构的1/6,优势十分明显。
一般来说芯片制程越小,功耗越小,性能越高。
生产制程指的是芯片表面晶体管的尺寸,宽度越小电流通过时的损耗越小,功耗越小;更小尺寸也意味着在同等面积中可以塞入更多的晶体管,而作为运算芯片的基本组成部分,更多的晶体管数量显然能够提供更好的性能。
加更多的晶体管,要怎么加也是很有学问的。一般来说架构越新性能越高、能力也更丰富。倚天芯片采用的是最新的ARM v9架构,比之前提供了更多执行单元,也增加安全性、机器学习等新能力。
除了算得快,倚天还功耗低,意味着成本低。功耗大不仅意味着成本,可能还会影响计算性能的平稳。传统CPU架构功耗大,导致计算负载过重时温度上升,为了避免高温造成的功能失效,会主动降低主频,进而影响了性能。倚天就没有任何降频问题。
❙
倚天云服务器性价比高的第二个秘密武器,就是阿里云的数据中心处理器,CIPU。
CIPU开创了不同的硬件架构,让服务器以CIPU为中心。
CIPU连接2颗或者更多倚天的芯片,让多个芯片共享一台服务器,这样降低了成本,使得倚天实例更有竞争力。
同时,各个倚天芯片在各自主板上,一旦某个零件出问题,不会影响同一个机器上的另一张芯片,会让产品更为稳定。这样的设计叫多单路的硬件机型设计。
双路设计,单个CPU损坏将波及同一主板的CPU
依靠CIPU实现双单路设计,低成本+高可用
最后,CIPU将虚拟化与IO转发等数据面卸载到专用硬件上进行加速,消除了原来虚拟化损耗与性能争抢,并大幅加速了IO,也会使得整体性能更高;VPC环境下支持弹性RDMA加速能力,相比TCP时延降低70%以上。
全部0条评论
快来发表一下你的评论吧 !