关于AMD技术沟通会上都有哪些内容

电子说

1.2w人已加入

描述

在处理器市场上,AMD Ryzen对Intel造成的实际压力越来越大。据外媒报道,Mercury Research发布的2018年第三季度处理器市场份额报告显示,AMD在桌面x86处理器的市场占有率提升到了13%,环比增加0.8个百分点,同比增加2.1个百分点。在笔记本处理器市场,AMD的份额在第三季度提升了1.5个百分点,摸到10.9%,服务器市场的增幅更是高达10.6%。

AMD Zen架构取得了空前成功,今年还优化为Zen+增强版,并有同样优化的12nm工艺辅助,而现在我们终于迎来了全新的第二代Zen 2架构,以及全新的7nm工艺加持。

AMD原计划采用GlobalFoundries 7nm为自家新CPU、GPU代工,但后者已经放弃7nm及后续工艺,好在还有天字一号代工厂台积电,AMD 7nm CPU、GPU全都转移了过去,而且目前看起来很顺利,无论产品设计还是路线图都在按计划进行。

根据台积电提供的数据,7nm相比于目前的14/12nm可以将晶体管密度提高一倍,同等频率下功耗可以降低一半,而同等功耗下性能提升可以超过25%。

如果说12nm更多地是在“数字”上领先Intel 14nm,这一次7nm则是在技术上完全实现超越,也能稍微领先Intel仍在难产的10nm。

Zen 2,这是世界上第一个7nm工艺的高性能x86 CPU,除了新工艺主要变化包括:CPU核心执行增强、更深入的安全增强、模块化设计灵活配置并降低制造难度。

Zen 2实现了两倍于第一代的吞吐能力,这主要得益于执行流水下的改进、浮点单元和载入存储单元的翻番、核心密度的翻番、每操作功耗的减半。

在前端设计上,Zen 2重点改进和优化了分支预测、指令预取、指令缓存、操作缓存。

而在浮点方面,Zen 2将浮点宽度翻了一番达到256-bit,载入存储带宽同样翻了一番,并提升了分发/回退带宽,所有模块都保持着很高的吞吐。

安全性方面,AMD重点强调了新架构可以在硬件层面免疫Spectre幽灵安全漏洞。

Zen 2架构支持更多核心,但并不是单纯地增加核心数量,而是采用了特殊的组合结构:EPYC霄龙最多单路64核心128线程,分为八个Die,每个Die内八个物理核心,同时外部还有一个单独的I/O Die,集成内存控制器、Infinity Fabric高速总线、I/O输入输出,专门负责联络各个Die与物理核心。

这种新的模块化设计更加灵活,可以单独针对每个模块进行优化、调配,同时借助I/O Die大大优化了整体延迟与功耗。

不过注意,CPU Die部分用的是7nm工艺, I/O Die部分则还是14nm,因为后者大部分都是模拟电路,对新工艺并不敏感,即便上了7nm也不会带来集成度、性能、功耗的明显改善,成本却会明显增加,所以采用了这种混合工艺模块组合。

事实上,Intel也正在同一颗芯片内尝试不同工艺的组合,都是出于同样的目的。

以上说的都是Zen 2架构的理论部分,最终落实到EPYC霄龙、Ryzen锐龙产品上,还会有不同的表现,但可以预料,新架构新工艺,必然会带来明显更高的频率、更低的功耗,而且无论桌面还是服务器,AMD这几年都会保持前后代兼容。

AMD还首次确认,Zen 4架构已经在设计中,将在7nm+ Zen 3之后面世,时间上估计至少会在2021年。

7nm Radeon Instinct系列首发两款产品,型号分别是MI60、MI50,主打机器学习训练、高性能领域,也可用于虚拟化、机器学习推理,将在今年底出货,相关系统和应用明年问世,2020年还有下一代产品。

Radeon Instinct MI60、MI50仍旧基于Vega GPU核心架构,但是一方面升级新工艺,另一方面也针对数据中心应用做了调整优化,包括计算单元、显存、PCI-E 4.0等等。

14nm Vega 10核心拥有125亿个晶体管,核心面积484平方毫米,7nm Vega则增至132亿个晶体管(增幅6.4%),面积却缩小到331平方毫米(幅度31.6%),同时只相当于对手(815平方米的12nm GV100)的大约40%。

新核心对基础的计算单元进行了针对性的调整增强,比如矢量ALU单元支持16/32/64位操作,同时所有模块都支持ECC。

它还是世界上第一个显存带宽达到1TB/s的GPU,最多32GB HBM2。

架构优化加上频率提升(具体未公开),MI60相比于MI25在流处理器相同的情况下,性能提升幅度十分惊人,比如FP16浮点性能快了20%,INT8、INT4整数性能分别快了140%、380%,还有新的指令集,更适合执行机器学习应用。

如果只是进行矩阵乘法运算,MI60只会提升25%以上,但对于Resnet-50这样的特定应用,提升幅度最高可达2.8倍,非常惊人。

TensorFlow FP32提升幅度在25-50%之间,而且凭借Infinity Fabric,MI60还支持近乎线性提升的多路扩展,比如四路性能就几乎是单路的整整4倍。

Vega、EPYC现在都支持PCI-E 4.0,但是平台尚未构建完成,所以八路并行在PCI-E 3.0下性能提升会受到一定的限制,未来都换到PCI-E 4.0还有望更猛。

PCI-E 4.0,7nm Vega是第一个支持的GPU,Rome EPYC则是第一个支持的CPU,二者互相配合,双向带宽可达64GB/s,最多可以四块并行。

Infinity Fabric总线则可以在不同显卡之间提供200GB/s的带宽,是PCI-E 3.0的足足6倍,不过注意这里用了硬件桥接方式互连,目的是更方便地处理超大传输数据量。

而得益于对硬件虚拟化的支持(唯一哦),MI60/56还可以最多八块卡并行,但实现方式略有不同,每四块通过Infinity Fabric高速互联,然后两组四块卡再通过PCI-E总线互连。

如果不需要这么多卡,也可以一块、两块、四块各自组成虚拟机再并联于同一个系统内,但注意必须是完全同一型号的卡,不能混用。

MI60是个完全体,集成64个计算单元、4096个流处理器,峰值整数性能INT4 118Tops、INT8 59Tops,峰值浮点性能FP16 29.5TFlops、FP32 14.7TFlops、FP64 7.4TFlops,技术特性支持全芯片ECC错误校验、RAS、PCI-E 4.0、双链路Infinity Fabric,显存搭配4096-bit 32GB HBM2,带宽1TB/s,热设计功耗300W。

MI50精简到60个计算单元、3840个流处理器,性能降低约9.5%,显存容量减半至16GB,其他完全同上。

对手如此来势汹汹,Intel这边也坐不住了。据Anandtech,Intel宣布将于12月11日 举办“Forward-Looking(展望未来)”架构沟通会。

本次活动密级很高,议程和内容尚不得而知,且只有少数媒体、分析师可以参与。不知何故,Intel如今对架构技术细节越发“三缄其口”,甚至取消了Intel开发者大会。

对于Intel来说,可谈的话题相当多,比如CPU、GPU、AI、FPGA、PCIe 4.0/DDR5、安全漏洞、10nm家族、摩尔定律等,甚至还包括Jim Keller/Raja Koduri等行业大牛加入后对Intel产品路线的调整。

另外,一直有传言酷睿架构将走到尽头,难道这次Intel要放大招了?

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分