Intel Core i7四核处理器

qzgywf 2012-03-09 3344

cpu

19人已加入

描述

　　Intel Core i7是一款45nm原生四核处理器，处理器拥有8MB三级缓存，支持三通道 DDR3内存。处理器采用LGA 1366针脚设计，支持第二代超线程技术，也就是处理器能以八线程运行。根据网上流传的测试，同频Core i7比Core 2 Quad性能要高出很多。

　　简介

　　基于Nehalem架构的下一代桌面处理器沿用“Core”（酷睿）名称，

　　命名为“Intel Core i7”系列，至尊版的名称是“Intel Core i7 Extreme”系列。

　　而同架构服务器处理器将继续延用“Xeon”名称。至于为什么是“i7”，

　　而不是大多数人认为的“Core 3 ”，Intel还没给出详细的解释，

　　估计意思是Intel的第七代处理器，

　　但2000年推出NetBrust架构的Pentium 4处理器应该是属于第七代产品的

　　综合之前的资料来看，英特尔首先会发布三款Intel Core i7处理器，

　　频率分别为3.2GHz、2.93GHz和2.66GHz，

　　主频为3.2GHz的属于Intel Core i7 Extreme，

　　处理器售价为999美元，当然这款顶级处理器面向的是发烧级用户。

　　而频率较低的2.66GHz的定价为284美元，约合1940元人民币，

　　面向的是普通消费者。全新一代Core i7处理器将于2008第四季度推出。

　　Intel于2008年11月18日发布了三款Core i7处理器，

　　分别为Core i7 920、Core i7 940和Core i7 Extreme Edition 965。

　　而从英特尔技术峰会2008（IDF2008）上英特尔展示的情况来看，

　　core i7的能力在core2 extreme qx9770（3.2GHz）的三倍左右。

　　IDF上，intel工作人员使用一颗core i7 3.2GHz处理器演示了CineBench R10多线程渲染，

　　结果很惊人。渲染开始后，四颗核心的八个线程同时开始工作，

　　仅仅19秒钟后完整的画面就呈现在了屏幕上，

　　得分超过45800。相比之下，core2 extreme qx9770 3.2GHz只能得到12000分左右，

　　超频到4.0GHz才勉强超过15000分，不到core i7的3分之一。core i7的超强实力由此可窥见一斑。

　　1. 基于Nehalem微架构

　　2. 2-8颗核心。

　　3. 内置三通道DDR3内存控制器。

　　4. 每颗核心独享256KB二级缓存。

　　5. 8 MB共享三级缓存。

　　6. SSE 4.2指令集（七条新指令）。

　　7. 超线程技术。

　　8. Turbo mode（自动超频）。

　　9. 微架构优化（支持64-bit模式的宏融合，提高环形数据流监测器性能，六个数据发射端口等等）

　　10. 提升预判单元性能，增加第二组分支照准缓存。

　　11. 第二组512路的TLB。

　　12. 对于非整的SSE指令提升性能。

　　13. 提升虚拟机性能（根据Intel官方数据显示，Nehalem相对65nm Core 2在双程虚拟潜伏上有60%的提升，而相对45nm Core 2产品提升了20%）

　　14. 新的QPI总线。

　　15. 新的能源管理单元。

　　16. 45nm制程，32nm制程产品随后上线，代号Westmere。

　　17. 新的1366针脚接口。

　　Nehalem相当于65nm产品有着如下几个最重要的新增功能。

　　1. SSE4.1指令集（47个新SSE指令）。

　　2. 深层休眠技术（C6级休眠，只在移动芯片上使用）。

　　3. 加强型Intel动态加速技术（只在移动芯片上使用）。

　　4. 快速Radix-16分频器和Super Shuffle engine，加强FPU性能

　　5. 加强型虚拟技术，虚拟机之间交互性能提升25%-75%。

　　Nehalem的核心部分比Core微架构改进了以下部分：

　　Cache设计：采用三级全内含式Cache设计，L1的设计与Core微架构一样；L2采用超低延迟的设计，每个核心各拥有256KB的L2 Cache；L3则是采用共享式设计，被片上所有核心共享使用。

　　集成了内存控制器（IMC）：内存控制器从北桥芯片组上转移到CPU片上，支持三通道DDR3内存，内存读取延迟大幅减少，内存带宽则大幅提升，最多可达三倍。

　　快速通道互联（QPI）：取代前端总线（FSB）的一种点到点连接技术，20位宽的QPI连接其带宽可达惊人的每秒25.6GB，远超过原来的FSB。QPI最初能够发放异彩的是支持多个处理器的服务器平台，QPI可以用于多处理器之间的互联。

　　Nehalem的核心部分比Core微架构新增加的功能主要有以下几方面：

　　New SSE4.2 Instructions （新增加SSE4.2指令）

　　Turbo Mode （内核加速模式）

　　Improved Lock Support （改进的锁定支持）

　　Additional Caching Hierarchy （新的缓存层次体系）

　　Deeper Buffers （更深的缓冲）

　　Improved Loop Streaming （改进的循环流）

　　Simultaneous Multi-Threading （同步多线程）

　　Faster Virtualization （更快的虚拟化）

　　Better Branch Prediction （更好的分支预测）

　　Core i7的改进

　　原生四核+全新缓存设计

　　我们知道，Core 2 Quad系列四核处理器其实是把两个Core 2 Duo处理器封装在一起，并非原生的四核设计，通过狭窄的前端总线FSB来通信，这样的缺点是数据延迟问题比较严重，性能并不尽如人意。Core i7则采用了原生四核设计，采用先进的QPI（QuickPath Interconnect，下面将进行介绍）总线进行通讯，传输速度是FSB的5倍。

　　缓存方面也采用了三级内含式Cache设计，L1的设计和Core微架构一样；L2采用超低延迟的设计，每个内核256KB（256x4 KB）；L3采用共享式设计，被片上所有内核共享，容量为8MB。

　　采用全新QPI总线

　　Core i7的Nehalem架构最大的改进在前端总线（FSB）上，传统的并行传输方式被彻底废弃，转而采用基于PCI Express串行点对点传输技术的通用系统接口（CSI），被Intel称为QuickPath。QuickPath的传输速率为6.4Gbps，这样一条32bit的QuickPath带宽就能达到25.6GB/sec。QuickPath的传输速率是FSB 1333MHz的5倍，前者虽然数据位宽较窄，但传输带宽仍然是后者的2.5倍。由于分别用于双处理器和单处理平台，Gainestown有两条QuickPath，而Bloomfield仅有一条。不难看出，在AMD推出HyperTransport高速串行总线，并逐渐在高性能运算领域建立优势之后，Intel也迎头赶上。若干年前，关于串行传输将一统天下的预言已经变成了现实，我们所要等待的是串行内存何时重返市场。

　　集成内存控制器

　　内存控制器相信大家不会感到陌生，竞争对手AMD早在K8时代CPU已经集成了内存控制器，能大幅提升内存性能，而Intel方面则表示由于时机还不合适，因此没有在Core2中使用，现在最新的Core i7终于拥有集成内存控制器IMC（Integrated Memory Controller），可以支持三通道的DDR3内存，运行在DDR3-1333，内存位宽从128位提升到192位，这样总共的峰值带宽就可以达到32GB/s，达到了Core 2的2-4倍。处理器采用了集成内存控制器后，它就能直接与物理存储器阵列相连接，从而极大程度上减少了内存延迟的现象。

　　同步多线程技术

　　原生四核Core i7有八个逻辑内核

　　超线程技术（Hyper-Threading），最早出现在130nm的Pentium 4上，超线程技术就是利用特殊的硬件指令，把两个逻辑内核模拟成两个物理芯片，让单个处理器都能使用线程级并行计算，进而兼容多线程操作系统和软件，减少了CPU的闲置时间，提高的CPU的运行效率。超线程技术使得Pentium 4单核CPU也拥有较出色的多任务性能，现在通过改进后的超线程技术再次回归到Core i7处理器上，新命名为同步多线程技术（Simultaneous Multi-Threading，SMT）。

　　同步多线程（Simultaneous Multi-Threading，SMT）是2-way的，每核心可以同时执行2个线程。对于执行引擎来说，在多线程任务的情况下，就可以掩盖单个线程的延迟。SMT功能的好处是只需要消耗很小的核心面积代价，就可以在多任务的情况下提供显著的性能提升，比起完全再添加一个物理核心来说要划算得多。比起Pentium 4的超线程技术（Hyper-Threading），Core i7的优势是有更大的缓存和更大的内存带宽，这样就更能够有效的发挥多线程的作用。按照INTEL的说法，Nehalem的SMT可以在增加很少能耗的情况下，让性能提升20-30%。

　　为什么Core 2没有使用SMT？很显然，它是可以做到的。SMT是在节省电力的基础上增加了性能，而且软件支持的基础建设也早就有了。有2个可能的原因：一是Core 2可能没有足够的内存带宽和CPU内部带宽来利用SMT获得优势。通常，SMT能够提升内存级并行（memory level parallelism，MLP），但是对于内存带宽已经成为瓶颈的系统则是个麻烦。而更有可能的原因则是SMT的设计、生效等是很麻烦的，而当初设计SMT是由INTEL的Hillsboro小组主持，而并非是Haifa小组（Core 2是由这个小组负责的）。这样Core 2不使用SMT就避免了冒险。

　　自动超频，核心加速

　　Turbo Mode，顾名思义，就是加速模式，它是基于Nehalem架构的电源管理技术，通过分析当前CPU的负载情况，智能地完全关闭一些用不上的核心，把能源留给正在使用的核心，并使它们运行在更高的频率，进一步提升性能；相反，需要多个核心时，动态开启相应的核心，智能调整频率。这样，在不影响CPU的TDP情况下，能把核心工作频率调得更高。

　　举个简单的例子，如果游戏只用到一个核心，Turbo Mode就会把其他三个核心自动关闭，把正在运行游戏的那个核心的频率提高，也就是自动超频，在不浪费能源的情况下获得更好的性能。Core 2时代，即使是运行只支持单核的程序，其他核心仍会全速运行，得不到性能提升的同时，也造成了能源的浪费。

　　Turbo Boost默认是开启的，通过自动调高CPU的倍频提高性能。在Intel原厂X58主板上，低负载时默认调高1-2个倍频。例如Core i7 920默认频率为2.66G，在Turbo Boost默认是开启的情况下，运行Super PI是以单核2.8G来跑，这样单线程性能也就得到提升。

　　超频爱好者也许会想到，Turbo Mode自动提升的那个频率可以手动调整吗？如果可以，不就能利用它进行超频吗？答案是可以的，只要是Exterme Edition CPU，就可以手动调整，好好利用，新的超频方式从此诞生。

　　文本处理再提速！完整SSE4指令支持

　　完整的SSE 4（Streaming SIMD Extensions 4，流式单指令多数据流扩张）指令集共包含54条指令，其中的47条指令已在45nm的Core 2上实现，称为SSE 4.1。SSE 4.1指令的引入，进一步增强了CPU在视频编码/解码、图形处理以及游戏等多媒体应用上的性能。其余的7条指令在Core i7中也得以实现了，称为SSE 4.2。SSE 4.2是对SSE 4.1的补充，主要针对的是对XML文本的字符串操作、存储校验CRC32的处理等。

打开APP阅读更多精彩内容