ADI公司提供一套全面的硬件监控产品,适用于台式机和笔记本电脑以及服务器。智能系统监控设备使复杂的风扇速度控制技术成为可能,以提供足够的冷却并保持系统中的最佳热性能。在过去的一年中,我们开发了一系列产品,包括ADM1029双通道PWM风扇控制器和温度监控器、ADM1026和ADM1030/31完整、符合ACPI标准的双通道±1°C远程热监控器,集成风扇控制器,适用于一个或两个独立风扇。它们基于ADM102x PC系统监控器产品组合中的核心技术(另见模拟对话33-1和33-4)。这些新产品根据系统内测量的温度提供风扇速度控制,提供更完整的热管理解决方案。我们在这里讨论对这种复杂控制水平的需求以及提供这种控制所固有的问题。
背景
随着新千年的到来,处理器正在实现 1 GHz 甚至更高的速度。它们在速度和系统性能方面的显著改进伴随着使用它们的机器内产生的热量不断增加。安全散热的需求,以及计算行业开发“绿色PC”和用户友好型机器(随着互联网设备成为主流)的举措,推动了对更复杂的冷却和热管理技术的需求和发展。
PC也开始变得更小,尺寸和形状不那么传统 - 这可以在市场上任何最新概念的PC或超薄笔记本电脑中看到。严格的功耗规范,如“移动电源指南'99”(参考文献1)规定了通过笔记本电脑键盘可以安全散热而不会引起用户不适的程度。任何多余的热量必须通过其他方式从系统中排出,例如沿热管和散热器板对流,或使用风扇使空气通过系统。显然,我们需要的是一种可以普遍采用的智能、有效的热管理方法。各种行业团体已经聚集在一起解决这些问题和其他问题,并制定了诸如笔记本电脑的ACPI(高级配置和电源接口)和服务器管理的IPMI(智能平台管理接口)等标准。
行业标准
新的热管理/速度控制产品的开发受到ACPI和IPMI标准的推动。高级配置和电源接口-ACPI由英特尔,微软和东芝定义,主要用于定义和实现笔记本电脑的电源管理。
电源管理被定义为“硬件和软件中的机制,用于最小化系统功耗、管理系统热限制并最大限度地延长系统电池寿命。电源管理涉及系统速度、噪声、电池寿命、处理速度和交流功耗之间的权衡。
首先考虑一个笔记本电脑用户,他在穿越海洋或大陆时键入旅行报告。哪个特性更重要,最大 CPU 性能或延长电池寿命?在这样一个简单的文字处理器应用程序中,用户击键之间的时间几乎是CPU时钟周期的永恒,最大CPU性能远不如电源的持续可用性那么重要。因此,CPU 性能可以与延长电池寿命相权衡。另一方面,考虑想要在数字多功能磁盘 (DVD) 上以全动态、全屏、令人麻木的声音和亮度观看最新詹姆斯邦德电影的用户。至关重要的是,系统必须以足够快的性能水平运行,以足够快的速度解码软件,而不会丢失图片或音频帧。在这种情况下,CPU 性能不会受到影响。因此,发热将处于最高水平,对热管理的关注对于在不损害可靠性的情况下获得最佳性能至关重要。输入 ACPI。
那么什么是ACPI?ACPI 是描述组件之间的接口及其行为方式的规范。它不是纯粹的软件或硬件规范,因为它描述了 BIOS 软件、操作系统软件和系统硬件应如何交互。
ACPI 规范概述了两种不同的系统冷却方法:被动冷却和主动冷却。被动冷却依靠操作系统 (OS) 和/或基本输入/输出系统 (BIOS) 软件来降低 CPU 功耗,以减少机器的散热。如何实现这一点?通过做出明智的决策,例如在指定时间后未检测到击键或其他用户交互时进入挂起模式。或者,如果系统正在执行一些密集的计算,例如 3D 处理,并且变得非常热,BIOS 可能会决定限制(减慢)CPU 时钟。这将减少机器的热输出,但以牺牲整体系统性能为代价。这种被动式冷却有什么好处?其明显的优点是系统功率要求以静默方式降低(不需要风扇操作)以降低系统温度,但它确实限制了性能。
那么,主动冷却呢?在主动冷却的系统中,操作系统或 BIOS 软件采取直接操作(如打开 CPU 安装的风扇)来冷却处理器。它的优点是,通过CPU的金属块或散热器增加的气流允许热量相对快速地从CPU中排出。在被动冷却系统中,仅 CPU 节流会阻止 CPU 进一步发热,但散热器对“静止空气”的热阻可能相当大,这意味着散热器会将热量非常缓慢地散发到空气中,延迟恢复全速处理。因此,采用主动冷却的系统可以结合最大的CPU性能和更快的散热。但是,风扇的运行会将噪音引入系统环境并消耗更多功率。哪种冷却技术更好?实际上,这取决于应用程序;多功能机器将使用这两种技术来处理不同的情况。ACPI 根据两种不同的模式概述了冷却技术:性能模式和静默模式。图1和图2比较了这两种模式。
图1.性能优先。主动模式(_ACx,风扇打开)以 50 度进入,被动模式(_PSV,油门后退)以 60° 进入。关断发生在临界温度 (_CRT) 90°。风扇速度可能会在高于 ACx 的水平上增加。
图2.静音和电池经济性优先。被动模式首先在 45 度时进入,风扇直到 60° 才打开。
图1和图2是温标示例,说明了性能、风扇噪声和功耗/耗散之间的各自权衡。为了使系统管理设备符合 ACPI 标准,它应该能够以 5°C 的间隔或 SCI(系统控制中断)事件发出信号,表明发生了新的超限温度增量。这些事件提供了一种机制,操作系统可以通过该机制跟踪系统温度,并就是否限制 CPU 时钟、增加/降低冷却风扇的速度或采取更激烈的操作做出明智的决策。一旦温度超过_CRT(临界温度)策略设置,系统将作为故障安全装置关闭,以保护 CPU。图 1 和图 2 中显示的其他两个策略设置是_PSV(被动冷却或 CPU 时钟限制)和_ACx。(主动冷却,当风扇打开时)。
在图 1(性能模式)中,冷却风扇在 50°C 时打开。 如果温度继续上升到 60°C 以上,则启动时钟限制。此行为将最大限度地提高系统性能,因为系统仅在较高温度下才会变慢。在图 2(静默模式)中,CPU 时钟首先在 45 摄氏度时受到限制。如果温度继续升高,可以在 60 摄氏度时打开冷却风扇。这种降低性能的模式也往往会延长电池寿命,因为节流时钟会降低功耗。
图3显示了温度测量带的限值如何跟踪温度测量。每次越界都会产生一个中断。
图3.通过移动极限和生成中断来跟踪温度变化。
智能平台管理接口 (IPMI) 规范(参考文献 2)为服务器带来了类似的热管理功能。IPMI 旨在通过监控系统的关键“心跳”参数(温度、电压、风扇速度和 PSU(电源单元))来降低服务器的总拥有成本 (TCO)。IPMI的另一个动机是服务器之间的互操作性需求,以促进基板和机箱之间的通信。IPMI 基于 5 伏 I 的使用2C 总线,消息以数据包形式发送。
ADI公司温度和系统监控(TSM)系列的所有成员均符合ACPI和IPMI标准。
温度监测
在PC内实现智能风扇速度控制的先决条件是能够准确测量系统和处理器温度。所使用的温度监测技术一直是许多文章的主题(例如,参见模拟对话33-4),这里将仅简要介绍。ADI公司的所有系统监控设备都使用称为热二极管监控(TDM)的温度监控技术。该技术利用了这样一个事实,即在恒定电流下工作的二极管连接的晶体管的正向电压表现出负温度系数,约为-2mV/°C。 由于VBE的绝对值因设备而异,因此此功能本身不适合用于批量生产的设备,因为每个设备都需要单独校准。在TDM技术中,两个不同的电流依次通过晶体管,并测量电压变化。温度与VBE的差异有关:
ΔVBE = kT/q × ln(N)
其中:
k = 玻尔兹曼常数
q = 电子电荷大小
T = 绝对温度,单位为开尔文
N = 两个电流的比值
图4.基本TDM信号调理电路。
在任何CPU中,最相关的温度是芯片上“热点”的温度。系统中的所有其他温度(包括散热器温度)将滞后于该温度的上升。出于这个原因,几乎每个CPU(自早期英特尔奔腾II处理器以来制造)在其芯片上包含一个战略性位置的晶体管,用于热监控。它给出了真实的、基本上是瞬时的芯片温度曲线。图5显示了系统中反复进入和从挂起模式唤醒的温度曲线。它比较了连接到CPU散热器的热敏电阻和基板热二极管测量的温度。在实际芯片温度来回变化约13度的短时间内,散热器热敏电阻无法检测到任何变化。
图5.散热器热敏电阻和TDM在一系列进入和退出挂起模式期间测量的温度比较。
风扇温度控制
通过建立精确的温度监控方法,可以实现有效的风扇控制!通常,该技术是使用TDM来测量温度,将检测晶体管集成在片内或外部放置在尽可能靠近热点的位置,并将风扇速度设置为确保在该温度下足够传热的水平。控制回路的各种运行参数都是可编程的,例如最小速度、风扇启动温度、速度与温度斜率以及开/关迟滞。所描述的速度控制方法将包括开关、连续(“线性”)和脉宽调制(PWM)。
风扇控制方法:从历史上看,PC中风扇速度控制的方法范围从简单的开关控制到闭环温度到风扇速度控制。
两步控制:这是PC中采用的最早的风扇速度控制形式。BIOS 将测量系统温度(最初使用靠近 CPU 的热敏电阻),并决定是完全打开还是关闭冷却风扇。后来,PC使用更精确的基于TDM的温度监视器来实现相同的两步风扇控制。
三步控制: BIOS 或操作系统再次使用热敏电阻或热敏二极管测量温度,并根据软件设置决定是完全打开、完全关闭风扇还是将其设置为半速运行。
线性风扇速度控制:这种较新的风扇速度控制方法也称为电压控制。BIOS 或操作系统从 TDM 测量电路读取温度,并将一个字节写回片内 DAC,以设置输出电压以控制风扇的速度。这种类型的IC风扇控制器就是一个例子,ADM1022具有8位DAC片内,输出电压范围为0 V至2.5 V。它与具有所选风扇适当设计额定值的外部缓冲放大器配合使用。ADM1022还包含默认的自动硬件跳变点,如果TDM电路检测到过热情况,则风扇将全速驱动。这些类型的设备的首次亮相标志着自动风扇速度控制的出现,其中一些决策从操作系统软件转移到系统监控硬件。
脉宽调制 (PWM) 风扇速度控制: 在ADI公司的系统监控产品线中,这些PWM类型是最新的风扇控制产品。BIOS 或操作系统可以从 TDM 设备读取温度,并通过调整应用于冷却风扇的 PWM 占空比来控制冷却风扇的速度。
值得注意的是,上述所有风扇速度控制方法都依赖于CPU或主机干预,通过2线系统管理总线从TDM器件读取温度。然后,由CPU执行的热量管理软件必须决定风扇速度应该是多少,并将一个值写回系统监视器IC上的寄存器以设置适当的风扇速度。
风扇速度控制发展的下一步是实现自动风扇速度控制回路,该循环可以独立于软件运行,并在给定的芯片温度下以最佳速度运行风扇。这种闭环速度控制有很多好处。
一旦系统监控设备初始化(通过加载具有所需参数的限值寄存器),控制环路就完全独立于软件,IC可以在没有主机干预的情况下对温度变化做出反应。当发生灾难性系统故障时,此功能尤其理想,系统无法从中恢复。如果PC崩溃,操作系统中的电源管理软件将不再执行,从而导致热量管理丢失!如果PC无法读取正在测量的温度(因为PC已崩溃),则无法期望设置正确的风扇速度以提供所需的冷却水平。
闭环实现的另一个切实好处是,它将在任何给定温度下以最佳速度运行风扇。这意味着噪音和功耗都降低了。全速运行风扇可最大限度地提高功耗和噪音。如果可以通过回路优化有效管理风扇速度,则仅在给定温度下仅以所需的速度运行,则功耗和可听见的风扇噪音都会降低。在电池供电的笔记本电脑应用中,这是一个绝对关键的要求,其中每一毫安电流(或毫安秒的电荷)都是宝贵的商品。
自动风扇速度控制回路
以下是实现自动风扇速度控制回路的方法,该回路将使用TDM技术测量温度,并将风扇速度适当地设置为温度的函数。可编程参数允许更完整地控制环路。要编程的第一个寄存器值为 T最低.这是风扇首次打开的温度(对应于 ACx),也是风扇速度控制开始的温度。速度暂时设置为最大以使风扇运转,然后返回到最低速度设置(请参阅图 6)。允许控制温度风扇速度函数斜率的参数是从 T.MAX到 T最低或 T范围.T 的编程值最低和 T范围定义风扇达到最大速度的温度,即 T.MAX= T最低* u范围.可编程温度范围可选:5&de;C、10°C、20°C、40°C 和 80°C。 为了避免在T附近快速循环上下最低,滞后用于建立低于 T 的温度最低,此时风扇将关闭。可编程到环路中的迟滞量为1°C至15°C。 此风扇控制回路可由操作系统软件通过 SMBus 进行监控,PC 可以随时决定覆盖控制回路。
图6.风扇速度编程为温度的自动函数。
PWM 与线性风扇速度控制
有人可能会问,如果线性风扇速度控制已经广泛使用,为什么脉宽调制是可取的。
考虑使用线性风扇速度控制驱动的 12V 风扇。当施加到风扇的电压从 0 V 缓慢增加到约 8 V 时,风扇将开始旋转。随着风扇电压的进一步增加,风扇速度将增加,直到在 12 V 驱动时以最大速度运行。因此,12V 风扇的有效工作窗口介于 8 V 和 12 V 之间;范围仅为 4 V,可用于速度控制。
对于笔记本电脑使用的 5-V 风扇,情况变得更糟。风扇在施加的电压约为 4 V 之前不会启动,高于 4 V,风扇将趋向于接近全速旋转,因此在 4 到 5 伏之间几乎没有可用的速度控制。因此,线性风扇速度控制不适合控制大多数类型的5V风扇。
通过脉宽调制(PWM),最大电压施加在受控间隔(方波的占空比,通常为30至100 Hz)内。随着该占空比或高时间与低时间之比的变化,风扇的速度将发生变化。
在这些频率下,清洁转速表(转速表)脉冲从风扇接收回来,从而实现可靠的风扇速度测量。随着驱动频率的提高,存在用于精确测量的转速脉冲不足的问题,然后是噪声,最后是电尖峰破坏转速信号。因此,大多数PWM应用使用低频激励来驱动风扇。外部PWM驱动电路非常简单。它可以通过单个外部晶体管或MOSFET来驱动风扇来实现(图7)。由模拟速度电压驱动的线性风扇速度控制等效物需要一个运算放大器、一个调整管和一对电阻来设置运算放大器增益。
图7.PWM驱动电路与线性驱动电路的比较。
如何测量风扇速度?3 线风扇具有转速输出,通常每转输出 1、2 或 4 个转速脉冲,具体取决于风扇型号。然后,该数字转速信号直接施加到系统监控设备上的转速输入。转速脉冲不计算在内,因为风扇运行相对较慢,并且需要相当长的时间才能积累大量转速脉冲以进行可靠的风扇速度测量。相反,转速脉冲用于将运行频率为22.5 kHz的片内振荡器选通计数器(见图8)。实际上,正在测量转速周期以确定风扇速度。转速值寄存器中的高计数表示风扇低速运行(反之亦然)。限位寄存器用于检测风扇粘连或停止。
图8.风扇速度测量。
风扇速度控制还有哪些其他问题?
当使用PWM控制风扇时,可靠连续风扇运行的最小占空比约为33%。但是,风扇不会以 33% 的占空比启动,因为没有足够的功率来克服其惯性。如图 6 的讨论中所述,此问题的解决方案是在启动时将风扇旋转 2 秒钟。如果风扇需要以最低速度运行,则在风扇旋转后,PWM占空比可以降低到33%,并且由于迟滞而防止其失速。
风扇失速和风扇故障
然而,在系统中使用时,风扇可能会在某个时候停止。原因可能包括风扇运行太慢,或灰尘积聚阻止其旋转。因此,ADI公司的系统监视器具有基于风扇转速输出的片内机制,用于检测并重新启动停止的风扇。如果未收到转速脉冲,则转速值寄存器中的值将超过转速极限寄存器中的限制,并将设置错误标志。这将导致控制器尝试通过尝试旋转风扇 2 秒钟来重新启动风扇。如果风扇继续出现故障,最多尝试重新启动 5 次,则确认存在灾难性风扇故障,并且 FAN_FAULT 引脚将置位以警告系统风扇出现故障。在双风扇双控制器系统中,第二个风扇可以全速旋转,以尝试补偿由于第一个风扇故障而导致的气流损失。
总结
ADI公司继续开发卓越的热管理解决方案,并将其提供给计算行业。为ADM1029、ADM1030/31和ADM1026开发的技术将PC内的热管理提升到一个新的水平。这些器件具有温度监控、硬件自动温度控制、风扇速度测量、支持备用和冗余风扇、风扇存在和风扇故障检测、可编程 PWM 频率和占空比等功能。随着电源准则变得更加严格,PC运行温度明显更高,正在开发更复杂的温度测量和风扇速度控制技术,以更有效地管理未来的系统。
审核编辑:郭婷
全部0条评论
快来发表一下你的评论吧 !