ARM架构的关键能力

描述

作者简介

十四年IT基础设施研发经验,其中包括六年Linux kernel一线研发经验,在suse,华为,星际比特(技术合伙人)等公司工作。

作为团队核心成员参与了大陆第一个Cortex-A8 SOC芯片研发,负责CPU软件验证,操作系统移植等工作。

作为华为派驻到Linaro的技术专家,主导/参与多个Linux与arm架构相关特性研发(ILP32,continuous bit hint,kernel selftest等)

在拉斯维加斯,柏林,布达佩斯和北京多次发表技术演讲

2022年6月6日,WWDC 2022,苹果推出了新的Macbook Air和Macbook Pro,最大支持24G内存和2T存储,支持8k视频,支持18-20小时的续航,价格分别是1199美元和1299美元起。二者都适用了苹果最新自研的M2芯片。

作为底软的吃瓜群众,迫不及待的想把air拆开,一探究竟,无奈囊中羞涩。只好隔着屏幕一探M2的究竟。健哥整理了M1和M2的部分特性(表格横屏查看):

SOC M1 M2
Architecture ARM v8.5 ARM v8.5
CPU 4xFirestorm 4xIcestorm 4xAvalanche 4xBlizzard
Memory 8G/16G lpddr4 8/16/24G lpddr5
Transister 16 billion 20 billion
Product MacBook Air/Pro 2020 Macbok Air/pro 2022
Release Date 2020 2022

资料来源:Apple公司官网,整理人:健哥。原始表格:https://fvot4kwt4n.feishu.cn/sheets/shtcn69s9nbcvYxX0bAnDgxiAUb

M2使用了和A15一样的两个CPU IP Avalanche,Blizzard,分别作为性能核心和能效核心。二者组成大小核,会根据系统需要,选择合适的CPU,平衡性能和功耗。ARM公司官方的最新大小核技术称为DynamIQ。很遗憾,健哥暂时没有查到苹果大小核技术的更多信息,希望以后有机会向大家分享。

可以看到M2支持了更大的内存和更好的带宽。资料显示,M2使用了LPDDR5 6400,带宽可以到达100G。BTW,很多手机使用了LPDDR5,例如华为Mate P40,小米10,带宽大约在30-40G。

健哥查到的第一个使用LPDDR5的笔记本是华为的擎云L420,这个笔记本使用了华为麒麟9006C SOC。该芯片也采用了5nm工艺,最高频率3.13GHz。某东8+256的版本是7999元。

芯片

想了解一个ARM CPU,最为核心的是知道这个CPU的架构,根据网上的资料,M2的CPU是支持ARMv8.5扩展的。ARM从v8开始,除了v8,v9的大版本,还有若干小版本。目前最新的是v8.8和v9.3。虽然v8.5不是最新的ARM架构,但是v9.0除了SVE2,CCA,其余和v8.5是一样的。很多很多年之后,即使没有ARMv8a处理器了,今天学习的v8.5特性,也是未来继续跟踪ARM架构发展的很好的切入点。

芯片

从上图可以看到v8.5的主要增强有:

MTE: Memory Tagging Extension;

BTI: Branch Target Identification;

随机数生成器;

增强对PMEM的支持。

Memory Tagging Extension,顾名思义,是一个tag相关的特性。它使用了虚拟地址是不使用的位作为tag,可以用于use-after-free和buffer overrrun两个内存安全特性。

Branch Target Identification:从名字上可以看出,这是一个和跳转相关的特性,作用是在页表,PSTATE和BTI指令的配合下,检查是否发生了预期之外的跳转。如果是预期之外的跳转,会触发异常。

随机数生成器是引入了RNDR,RNDRRS两条指令。

对PMEM的支持:增加了PoDP,PoDP可以保证即使硬件故障导致了断电,Persistent memory的数据不会出错。

除了第三个特性,其它三个看起来都有点复杂,其实用健哥上次直播介绍的ARM架构三大基石(汇编,异常和内存)和三步学习方法(理解原理,阅读代码,实验验证),咱们都能化繁为简。

比如BTI特性,由三部分组成

页表中的GP位,用于设置是否是guarded page。这背后是对页表的基本理解;

BTI指令用于指定检查的规则。例如是否可以跳转的动态链接库。这背后是汇编语言的基本语法和过程调用标准(APCS64);

PSTATE.BTYPE位用于在guarded区域(上面所说guarded page的区域)的指令是否产生异常。

可以看到,理解BTI特性需要从汇编,异常和内存三方面配合理解。有了上面的初步了解,再结合原本plt的代码代码(下图),我们可以想象在打开BTI特性的情况下,如果是guarded区域,br指令如果访问了x16, x17之外的寄存器,会产生异常。

芯片

编译器使能bti后,我们的确能看到0x790行插入了bti c指令。

芯片

对于MTE也是一样的,学习MTE特性是对三大基石的巩固和提高,然后我们可以借助对于MTE的了解,更多的理解软硬件如何配合,近可以看看操作系统下为内存安全还做了哪些事情,远可以更多学习操作系统的内存管理知识,从而更深理解操作系统。

芯片

在课程中,我们会和今天一样,先从软硬件系统的整体出发到ARM CPU,然后聚焦在汇编,异常和内存三部分,每一部分都有三个学习要点,每个要点都通过原理,代码和实验三部分打通。打通之后,我们通过对于更深入特性的拆解,验证前面的学习效果。欢迎大家报名我的ARM工作坊,我带大家一起打通和爆破ARM架构的关键能力。

原文标题:Apple M2和ARMv8.5特性

文章出处:【微信公众号:Linux阅码场】欢迎添加关注!文章转载请注明出处。  

      审核编辑:彭静

 

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分