Meta第二代自研AI芯片出世,性能提升三倍以上 基于5nm打造,性能三倍以上
相较上一代MTIA v1,新的MTIA v2的工艺从台积电的7nm换成了台积电5nm,芯片主频也从800MHz提升至1.35GHz。得益于芯片工艺的改进,即便晶体管数量大幅增加,其芯片面积仅增加了12%。

软件栈引入新的编译器
随着新硬件的发布,Meta也加大了他们在软件栈上的开发力度。作为PyTorch的开发者,MTIA的软件栈从设计之初就做到了PyTorch 2.0的完全集成,也支持TorchDynamo和TorchInductor等新特性。但与此同时,为了简化应用开发者的工作,为MTIA v1开发的代码,也能向下兼容新的MTIA v2硬件。而且Meta表示,因为已经将全部的软件栈集成在新的MTIA芯片内,在发布之际,他们已经在自己的服务器上用MTIA v2跑了一段时间了。正因为有这种兼容的软件栈方案,Meta可在九个月内就能让商用模型运行在16个地区的服务器上。为了为全新的MTIA硬件生成更高性能的代码,Meta还打造了一套新的Triton-MTIA编译器。Triton是由OpenAI开发的一套开源语言和编译器,用于编写高效的ML计算内核。Triton极大地提高了开发者编写GPU代码的速度,但Meta发现Triton也很适合用于MTIA这样非GPU的硬件架构。写在最后
从MTIA v2的性能来看,该加速器应该不会替代其购置的大量GPU用在LLM模型上,而是追求算力、内存带宽和内存容量的平衡,用于排名和推荐的大模型上。这样一来大容量的SRAM还是用在GPU上,而Meta最大收入来源的广告业务,可以靠MTIA之类的加速器减少成本。Meta除了投资定制AI芯片和下一代GPU这样的计算芯片外,Meta也强调他们会继续投资内存带宽、网络、容量相关的下一代硬件系统。不仅如此,Meta也在探索增加MTIA的应用范围,包括未来可能支持GenAI的负载。全部0条评论
快来发表一下你的评论吧 !