一文解析ARM处理器都经历了哪些技术变革

电子说

1.2w人已加入

描述

  生产芯片,江湖却到处都有它的传说,这就是ARM。在手机出货量放缓的当下,很多业内公司在寻求着新兴领域的突破,ARM也是如此。同时ARM推出全新DynamIQ技术,该公司也强调:“DynamIQ技术将会被广泛的用于人工智能和机器学习领域”。今天小编就给大伙扒一扒ARM处理器的发展历程及技术升级之路。

  ARM发展历程

  1978年12月5日,物理学家赫尔曼·豪泽(Hermann Hauser)和工程师Chris Curry,在英国剑桥创办了CPU公司(Cambridge Processing Unit),主要业务是为当地市场供应电子设备。1979年,CPU公司改名为Acorn计算机公司。

  

  起初,Acorn公司打算使用摩托罗拉公司的16位芯片,但是发现这种芯片太慢也太贵。“一台售价500英镑的机器,不可能使用价格100英镑的CPU!”他们转而向Intel公司索要80286芯片的设计资料,但是遭到拒绝,于是被迫自行研发。无情的英特尔估计现在肠子都悔青了。

  

  1985年,Roger Wilson和Steve Furber设计了他们自己的第一代32位、6MHz的处理器,用它做出了一台RISC指令集的计算机,简称ARM(Acorn RISC Machine)。这就是ARM这个名字的由来。

  1990年11月27日,Acorn公司正式改组为ARM计算机公司。苹果公司出资150万英镑,芯片厂商VLSI出资25万英镑,Acorn本身则以150万英镑的知识产权和12名工程师入股。公司的办公地点非常简陋,就是一个谷仓。

  

  公司成立后,业务一度很不景气,工程师们人心惶惶,担心将要失业。由于缺乏资金,ARM做出了一个意义深远的决定:自己不制造芯片,只将芯片的设计方案授权(licensing)给其他公司,由它们来生产。正是这个模式,最终使得ARM芯片遍地开花,将封闭设计的Intel公司置于“人民战争”的汪洋大海。

  20世纪90年代,ARM公司的业绩平平,处理器的出货量徘徊不前。但是进入21世纪之后,由于手机的快速发展,出货量呈现爆炸式增长,ARM处理器占领了全球手机市场。

  经过12年的发展,在2002年,ARM架构芯片的出货量正式突破10亿。随着智能设备的爆炸式成长,如今,要完成10亿片的出货量只需要一个月。

  2004年,Cortex系列的诞生是ARM公司的大事件,从此该公司不再用数字为处理器命名。它分为A、R和M三类,旨在为各种不同的市场提供服务。

  2006年,全球ARM芯片出货量为20亿片,2010年预计将达到45亿片。

  2015年,ARM基于ARMv8架构推出了一种面向企业级市场的新平台标准。此外,他们还开始在物联网领域发力。同年,福布斯杂志将ARM评为世界上五大最具创新力的公司之一。

  

  如今ARM已经被软银收购,孙正义也瞬间变成2016超级“网红”,还扬言要制霸物联网时代。果然,吸一口ARM“纯氧”,瞬间精气神都不一样了。

  

  ARM处理器经历的技术变革

  一、32位处理器时代

  在32位处理器之前是16位处理器,起初,Acorn公司打算使用摩托罗拉公司的16位芯片,但是发现这种芯片太慢也太贵。“一台售价500英镑的机器,不可能使用价格100英镑的CPU!”1985年,Roger Wilson和Steve Furber设计了他们自己的第一代32位、6MHz的处理器,用它做出了一台RISC指令集的计算机,简称ARM(Acorn RISC Machine)。这就是ARM这个名字的由来。

  

  Acorn公司正式改组为ARM计算机公司是在1990年11月27日。

  在此之前,也就是1985年,ARMv1架构诞生,该版架构只在原型机ARM1出现过,只有26位的寻址空间(64MB),没有用于商业产品。第二年,ARMv2架构诞生,首颗量产的ARM处理器ARM2就是基于该架构,包含了对32位乘法指令和协处理器指令的支持,但同样仍为26位寻址空间。其后还出现了变种ARMv2a,ARM3即采用了ARMv2a,是第一片采用片上Cache的ARM处理器。

  1990年,ARMv3架构诞生,第一个采用ARMv3架构的微处理器是ARM6(610)以及ARM7,其具有片上高速缓存、MMU和写缓冲,寻址空间增大到32位(4GB)。

  1993年,ARMv4架构诞生,这个架构被广泛使用,ARM7(7TDMI)、ARM8、ARM9(9TDMI)和StrongARM采用了该架构。ARM在这个系列中引入了T变种指令集,即处理器可工作在Thumb状态,增加了16位Thumb指令集。

  1998年,ARMv5架构诞生,ARM7(EJ)、ARM9(E)、ARM10(E)和Xscale采用了该架构,这版架构改进了ARM/Thumb状态之间的切换效率。此外还引入了DSP指令和支持Java。

  2001年,ARMv6架构诞生,ARM11采用的是该架构,这版架构强化了图形处理性能。通过追加有效进行多媒体处理的SIMD将语音及图像的处理功能大大提高。此外ARM在这个系列中引入了混合16位/32位的Thumb-2指令集。

  2004年,ARMv7架构诞生,从这个时候开始ARM以Cortex来重新命名处理器,Cortex-M3/4/7,Cortex-R4/5/6/7,Cortex-A8/9/5/7/15/17都是基于该架构。该架构包括NEON技术扩展,可将DSP和媒体处理吞吐量提升高达400%,并提供改进的浮点支持以满足下一代3D图形和游戏以及传统嵌入式控制应用的需要。

  2007年,在ARMv6基础上衍生了ARMv6-M架构,该架构是专门为低成本、高性能设备而设计,向以前由8位设备占主导地位的市场提供32位功能强大的解决方案。Cortex-M0/1/0+即采用的该架构。

  处理器

  二、64位处理器

  2011年,ARM宣布了自己的第一个64位指令集处理器架构“ARMv8”,该架构基于32位的ARMv7而来,并保留了TrustZone安全执行环境、虚拟化、NEON(高级SIMD)等关键技术特性。ARM宣称,ARMv8新架构将把高能效的64位计算带入高端服务器等新的领域,并提供向下兼容性,便于现有软件的移植,誓有一股挑战英特尔的姿势。

  当时是基于怎样的市场需求和历史背景呢?

  随着设备的发展和新技术——语音识别、3D游戏和高分辨率显示屏——逐渐普及,32位处理器的能力已经渐渐被推到了极限。ARM看到了64位节能处理器的需求,并在正式发布ARMv8-A架构。

  ARM上64位计算的好处并不仅限于智能手机和平板电脑。ARM的生态系统很广阔,他们的处理器也被许多不同类型的设备所使用。服务器市场是ARM处理器影响力有限的一个领域。信息时代的发展让维持数据中心所消耗的能源持续快速增长,而任何能够降低能源使用的技术都是对于资金和自然资源的节省。除了节能之外,在服务器当中使用64位ARM芯片还有其他的好处。这些服务器都会被动散热,这意味着你可以将它们集中在一起,而无需担心会发生过热的情况。这样一来,用于散热上的花费也将有所降低。

  苹果凭借着iPhone 5s的全新64位A7处理器震惊了整个移动领域。A7采用了苹果设计的ARMv8双核处理器,名为Cyclone。它使用了两个64KB L1缓存(供两个核心分别使用),一个1MB L2缓存(被两个核心所分享)和一个4MB L3缓存(为整个SoC所用)。

  

  至于服务器软件,Linux这样的操作系统已经是64位的了,其主线内核当中也已经加入了对于ARMv8的支持。这也就是说,制作运行于64位Linux、ARM处理器的服务器并不会很困难。

  最后总结一句话,多亏了ARM,64位的移动计算时代就要到来了。这些新的处理器不仅速度更快,还为移动平台开启了更多的可能性。

  大小核(big.LITTLE)芯片设计架构

  在ARM推出旗下首款64位构架ARMv8的同一年,该公司还推出了big.LITTLE技术,制造商可利用该技术将高性能核心与节能核心结合起来,并用软件控制核心间的无缝切换,以达到省电的目的。它解决了当今行业面临的一个难题:如何创建既有高性能又有极佳节能效果的片上系统 (SoC) 以延长电池使用寿命。

  大小核设计到底是什么原理呢?

  为此,ARM专门录制了一个视频,深入浅出地做出解释,并用两个人来分别代表big.LITTLE架构中的“角色”,身材魁梧高大的男士是big,身材娇小的是LITTLE,如下图。

  

  基于big.LITTLE技术的八核处理器,并没有将传统内核放在单一的处理器上,而是一分为二,其中一个使用了4个“小核心”,另一个则使用了4个“大核心”,这两个“核心”都有着自己独立的速度和性能。通过两大核心自主运行,搭载big.LITTLE技术的处理器比之前的手机CPU更加高效,毕竟后者只有一个或者两个内核。

  当需要用智能手机打开一个网页时,手机就可以用一个大的内核来处理该任务,而小的内核则同时处理其他小任务,比如查看电子邮件、拨打电话等。当手机不需要工作时,big核心和LITTLE核心都可以停下来休息。

  三星Exynos 5 Octa八核移动处理器是采用Big.Little结构的第一款CPU。该芯片其实是由两颗四核处理器封装在一起。一颗 1.8GHz 的 Cortex-A15 架构的四核处理器和一颗 1.2GHz Cortex-A7 架构的四核处理器。据三星解释,高性能的处理器将用来处理更加复杂的运算,平时一般使用的时候则采用低性能的处理器,两者可以根据使用情况不同进行协同, 因此也能有效降低功耗。Exynos 5 Octa采用了28纳米的制作工艺,号称功耗比市面上的四核处理器降低了70%,但是性能却提升了2倍之多。

  三、DynamIQ技术

  2017年3月21日下午,ARM在北京金隅喜来登酒店召开发布会,正式发布了全新的有针对人工智能及机器学习进行优化的DynamIQ技术,而这项技术也将作为未来下一代ARM Cortex-A系列处理器的基础。这一技术也被称为big.LITTLE技术的重要演进。

  

  但他到底是个什么鬼?

  原有的big.LITTLE技术是将多个大核组成一个计算集群、多个小核组成另一个计算集群,然后进行协作运行。而全新的DynamIQ big.LITTLE将允许在单一计算集群上进行大小核配置,可以出现比如1+3、1+7、3+5等诸多类型(目前最多可以支持配置8核),将可配置性提升到了一个新的台阶。同时,DynamIQ big.LITTLE还可以对每一个处理器进行独立的频率控制以及开、关、休眠状态的控制,可以实现高效的、无缝的在不同任务间切换最合适的处理器。

  此外,DynamIQ还对内存子系统进行了重新设计,可以对内存进行更细颗粒度的管理,实现更快的数据读取和全新的节能特性。

  在该技术的发布会上,ARM副总裁表示,未来将会推出基于DynamIQ技术的大小核。而且2018年,就会有相应的终端出现。DynamIQ技术将会率先被用在智能手机领域,此外也将会进入汽车、嵌入式领域、企业级市场等。

  

  然则,ARM的这步棋更多针对的是人工智能这一领域,首先人工智能对于大小核之间的调配、无缝切换都要求很高,但全新的DynamIQ big.LITTLE架构是非常适合的,将会为机器学习和人工智能应用带来更快的响应速度。

  其次,DynamIQ还特别加入了针对人工智能的指令集和优化库,下一代ARMV8.2版本的指令集将支持神经网路卷积运算,可以极大的提升人工智能和机器学习的效率。

  据ARM透露,针对人工智能和机器学习的全新处理器指令集在采用DynamIQ技术的Cortex-A系列处理器在优化应用后,可实现比基于现有的Cortex-A73的设备高50倍的人工智能性能,并最多可提升10倍CPU与SoC上指定硬件加速器之间的反应速度。

  ARM的诞生可能存在着一些无奈,但这并不妨碍ARM靠自己独特的授权方式搜刮市场。以低功耗和高性能赚得盆满钵满,最新的DynamIQ技术也试图霸占人工智能领域,新兴领域的风口似乎已经打开,ARM有着非常不错的底子,再加上被软银收购,未来还是非常令人期待的。

打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分