业界唯一内置AI的数据中心CPU来了。4月6日,英特尔在北京首钢园推出第三代至强可扩展处理器(代号Ice Lake),最多支持40核,进一步强化AI性能和安全性,在主流数据中心工作负载上性能平均提升46%。英特尔还将该新品的AI性能与AMD竞品及NVIDIA A100 GPU做了对比。2021年第一季度,这款芯片已出货超过20万颗,主流云服务提供商均计划今年提供基于Ice Lake的服务,在超过50家独立OxM合作伙伴中赢得了超过250个订单。
同时,英特尔宣布推出傲腾持久内存200系列、傲腾固态盘SSD P5800X、NAND固态盘SSD D5-P5316,以及英特尔以太网800系列适配器和全新的英特尔Agilex FPGA,并展示了整体解决方案,以及英特尔产品组合自身独具的优势。
01.第三代至强可扩展处理器:10nm、最多40核、AI推理性能猛增
自2013年以来,英特尔已在云端部署超过10亿个至强处理器核心,有超过800个云服务提供商部署了基于英特尔至强可扩展处理器的服务器。从2017年推出第一款英特尔至强可扩展处理器至今,英特尔已向全球客户交付了超过5000万颗至强可扩展处理器。
如今,采用英特尔10nm先进制程的第三代至强可扩展处理器Ice Lake终于来了,依然是业界唯一内置人工智能(AI)加速的数据中心处理器。新Ice Lake采用了新Sunny Cove核心,可额外增加20%的IPC性能,更加强调灵活性,主要服务于单路和双路服务器。加上去年发布的Cooper Lake产品系列,迄今第三代至强产品系列已能满足从单路到8路的市场需求。
其新旗舰Xeon Platinum 8380拥有40个核心,相较上一代28核Cascade Lake,其IPC性能可提升20%,平均性能可提升46%,AI推理性能可提升74%,平均性能相比已部署5年的老系统可提升2.65倍,这对于想要更新旧基础设施的客户来说是相当不错的收益。
在云计算、5G、物联网、HPC、AI等不同应用领域,第三代至强可扩展处理器均带来超过1.5倍的代际提升。
具体来看,第三代至强可扩展处理器在AI和安全性方面的特点尤其凸显。从AI算力的增强来看,通过采用英特尔深度学习加速技术(DL Boost),其推理性能较上一代提高74%,在20种主流AI工作负载上的性能最高可达AMD EPYC 763的1.5倍、NVIDIA A100 GPU的1.3倍。
相比默认发行版,经英特尔软件优化后的新一代至强在运行TensorFlow上ResNet50的深度学习性能提高了10倍,在Scikit-learn上SVC和kNN预测的机器学习性能提高了100倍。
从安全性来看,这是英特尔第一个主流双插槽并启用SGX英特尔软件防护扩展(SGX)技术的数据中心处理器,能帮助保护敏感的代码及数据,能满足主流工作负载的需求。除了能做到应用程序隔离,该处理器还引入了英特尔全内存机密技术、英特尔平台固件弹性技术相结合,可批量加密全内存空间,防止物理攻击。即使平台的软件或硬件组件遭到入侵,依然能保护该区域内的机密信息。此外,英特尔推出了英特尔平台固件弹性技术,用于固件层的防御甚至恢复,以防止永久性的拒绝服务攻击。第三代至强可扩展处理器还内置英特尔密码操作硬件加速,能通过公钥对称加密、哈希法等很多重要的加密算法,减少普遍加密对系统性能和响应时间的影响,并为客户的敏感数据提供更高级别的保护。
数据中心计算机架构不仅需要提高吞吐量,同时也需具备最佳的响应能力,才能更好地处理数据中心普遍存在的不同类型工作负载。对此,Ice Lake采用了一个可扩展且平衡的架构,在内核架构方面进一步优化其性能,支持关键的矢量化扩展,并提升了转译后备缓冲区(TLB)和预存数据性能,以确保内存阻塞时间最少,还增加了总体共享缓存。
内存方面,该处理器每插槽最多可支持6TB系统内存,内存通道数量由6个增加到8个,进一步改善内存带宽,内存速度最高可达3200。此外,英特尔Ice Lake支持PCIe 4.0,核心之间的网状互连采用了更新的算法向核心提供IO,槽间互连传输速度提高到11.2GT/s,还通过每个IP块内的独立电源管理代理来实现更好的电源管理。通过六个技术支柱,英特尔在芯片计算、内存、IO、架构平衡方面都取得了进步,并已开发优化的底层库,用于ISV和开放源码社区合作,确保在软件优化后第三代至强可扩展处理器的性能最大化释放。为了进一步降低应用门槛,目前超过500个可立即部署的英特尔物联网行业整体解决方案和英特尔精选解决方案已搭载第三代英特尔至强可扩展处理器,帮客户提高规模化部署的效率。其中近80%的英特尔精选解决方案将在今年年底完成更新。
02.计算存储连接阵容集体上新
如果仅看新处理器的参数,英特尔的优势可能不算明显,毕竟有其他厂商的核心数已经奔着64核、128核去了。但谈及丰富的软硬件组合,当前没有一家处理器厂商比英特尔的布局更全面。具体来看英特尔产品组合的新成员,其中新一代傲腾持久内存200系列的内存带宽增加了32%,每个插槽内存容量最高可以达到6TB。
新一代傲腾固态盘P5800X被英特尔称作世界上最快的数据中心固态盘,相比上一代,其平均时延可降低40%,服务质量(QoS)提高50%,耐久性提高67%,而延迟降低到NAND固态盘的1/13。
新一代NAND固态盘D5-P5316采用了英特尔最先进的OLC NAND技术,相比硬盘能将数据访问速度提高25倍,能将客户存储空间最多减少到原来的1/20;其耐久性是上一代QLC固态盘系列的5倍。
新一代英特尔以太网适配器800系列把网络数据吞吐量提高至每个适配器200GB/s,适合高性能vRAN、NFV转发面、存储、高性能计算、云和内容交付网络等带宽密集型工作负载,能为虚拟机密度提供最多2倍的资源。
有些数据中心对灵活性和敏捷性的要求很高,对此英特尔打造了新一代Agilex FPGA。这款FPGA采用英特尔最先进的10nm SuperFin制程技术,包含从140万到270万个逻辑元件,搭配Quartus Prime软件,据称能提供比竞争对手7nm FPGA高30%的逻辑结构性能和高2倍的结构每瓦性能。
据英特尔公司副总裁兼至强处理器与存储事业部总经理Lisa Spelmam分享,从平台到边缘到云,通过整合更多产品组合,英特尔已经建立了一个价值超过10亿美元的业务,并且这一业务还在增长。英特尔还分享了与阿里云、腾讯云等云计算巨头的合作案例,在第三代至强可扩展处理器及其深度学习加速技术的支持下,阿里云视频转码性能最高可提升40%,腾讯云支撑的游戏角色创建速度比上一代提升了4.2倍。新一代至强还帮助进一步降低了总拥有成本。当英特尔新一代至强与傲腾持久内存、固态盘、以太网、PCle 4.0等平台组件,及所有软件优化工具等功能结合时,能帮助客户大幅提高性能。
03.面向数据中心,英特尔的五大竞争优势
在发布新品之余,英特尔技术专家还分享了客户为何继续购买英特尔产品的5个理由。
第一是丰富灵活的产品组合,包括数据中心处理器、傲腾持久内存、以太网适配器等在内的英特尔软硬件产品组合,可以带来极高的性能提升。第二是为客户关键工作负载提供可预测的结果和低时延。通过与竞品的参数对比可见,英特尔新一代至强可扩展处理器的本地插槽延时更短,远程插槽延时性能更优,响应速度更快。
第三是持续优化软件,英特尔有近万名工程师每天专注于更新软件堆栈,确保客户在购买至强平台多年后,仍能持续从英特尔受益。围绕工作负载加速指令集,英特尔已经构建了庞大的软件生态系统,并根据客户需求持续迭代。
第四是虚拟化计算池具有一致性,易于部署、易于管理,客户未来能方便地从第三代至强迁移到第五代至强,大幅减少迁移成本。第五是供应链和物流能力更稳定,英特尔是一家集成设备制造商(IDM),因此在向客户交付产品时,英特尔能确定什么时候交付、怎样优先排序、如何可以更好满足客户的需求,从而如期交付客户所需的产品。
04.结语:或刺激数据中心新一轮换机潮
2021年宛如英特尔新的转折之年。从英特尔新任CEO帕特·基辛格宣布IDM 2.0战略,到今日推出以第三代至强可扩展处理器为中心的一系列数据中心新品,英特尔似乎正摆脱去年因7nm延期而陷入的焦灼境地,开始向快速扩张的数据中心市场发起新一轮攻势。对于英特尔来说,AMD、Arm系处理器的强势发展显然正为其产品带来新的竞争压力。但与此同时,英特尔全技术维度提升的优势仍具有独特性,至少从现在来看,没有其他竞争对手能提供像英特尔这样全面统一的软硬件及生态布局。随着英特尔Ice Lake导入市场,以及更多来自其他品牌的处理器加入竞争,更高性能的芯片新品有望刺激企业数据中心服务器新一轮的换机潮。
原文标题:新品 | 史上最擅长AI推理的云端CPU!Q1已出货超20万颗
文章出处:【微信公众号:机器人创新生态】欢迎添加关注!文章转载请注明出处。
责任编辑:haq
全部0条评论
快来发表一下你的评论吧 !