让CPU在较高的温度下运行是一件很“酷”的事

让CPU在较高的温度下运行是一件很“酷”的事

这篇文章是由戴尔公司的热设计工程师Hasnain Shabbir撰写的。

为什么要撰写这篇博文?

在进行戴尔服务器热设计,尤其是其热控制系统的设计时,我发现您的反馈对工作十分有益。它能帮助我提升下一代产品的性能,并使您了解热设计的特性。

自从我们的第12代PowerEdge服务器全线上市以来,我们就听到了客户对系统温度的担忧,例如:组件、面盖及排气温度。为了让您放下这些担忧,我希望帮您解释一下第12代服务器背后的核心热设计原理。撰写这篇博文,目的是为您提供一些有用的信息,如:温度水平,BIOS中所包含的温度调节选项,以及其它一些非直观的优势如能耗节省等方面的介绍。

“热”是什么?

让我们就温度做个简短的交流吧。当我们“感受”温度时,我们会把我们的感受与所熟悉的温度进行对照。在许多商务建筑内,空气温度大约在25℃(77F)左右,这个温度是最宜居的。一杯热咖啡的表面温度大约在45-55℃(113-131F)左右,用手碰一下会觉得烫得不能忍受。服务器的表面温度也可能会达到相同的范围,由于您平时可能没有接触过那种温度的其它事物,所以会让您误以为是服务器出现了异常。

结果证明,服务器内的CPU和许多其它组件(如内存、网络和存储控制器芯片等),是可以在那么高的温度下稳定运行的。例如,服务器CPU的温度上限为90-100℃——之所以是一个范围是依CPU插头的不同而不同的,这意味着您可以让处理器运行在接近上限的温度,而CPU的稳定性不会受到影响。由于很多关于组件发烫的讨论最终都会归结为对稳定性的担忧,所以上述的最后结论是非常重要的。

所以,如果有人说,“计算机表面碰起来感觉烫手!”在我们的日常工作中,这在我们看来是很正常的现象。当周围环境的温度升到35℃(95F)的时候,我们也许会觉得真的很热,或者,当物体表面的温度达到50℃(122F)的时候,我们会觉得烫得不能碰,然而,类似这种承受极限类比至服务器CPU时,其运行温度在90℃(176F)时才达到极限。但是,运行在较高的温度下并不降低产品的稳定性,事实上,在产品的使用寿命内,这些产品是被设计为可以运行在接近临界温度条件下的。

但是为什么要让产品运行在那么高的温度下

所以,接下来的问题自然是:为什么戴尔要让其CPU运行在那么高的温度下?为什么不让CPU或服务器的运行温度更低些呢?

对于我来说,设计一款服务器,让其运行温度更低一些,这实际上是一件比较容易的事,这个消息可能会让您大吃一惊吧。很奇怪,对吗?但是用来给CPU降温的风扇自身会消耗一大部分服务器的能耗。由于您需要支付运行服务器的能耗费用,因此,我想尽我所能降低风扇的运行速度,同时允许CPU运行在其标称温度范围内,希望通过这些方法来降低您的能耗费用。另外,降低风扇的运行速度可以降低环境噪音。

系统散热的设计理念是让您的系统能耗尽可能低些。相比于让风扇时刻都保持全速运转、让服务器的表面最高温度更接近于人的感受舒适度、将服务器能耗的20%用于系统散热,我选择优化风扇的运转速度、让CPU在较高的温度下运行、将服务器能耗的3%用于系统散热。这种设计可以极大地节省能耗。部署的服务器数量越多,能耗就会随之成倍地节省,并且在整个服务器生命周期内,会不断地节省能耗费用。另外,从服务器中流出的空气需要被处理和降温,这样会加重有其自身成本的数据中心空气制冷的需求。所以我们的努力是将服务器的温度控制下来(但不让温度过分地低),以确保系统内的所有组件都运行在散热标称范围内,同时将散热的能耗浪费降到最低。

我觉得这儿很热!

让服务器内的组件运行在稍高的温度以节约和优化系统能耗,但接下来的问题是,系统内部和系统周围的平均温度更高了,包括排气温度。这通常可能会让IT专业人士有些不满,因为在维护过程中,他们必须与服务器物理接触。尽管这些温度在他们能够适应的安全范围和处理能力限度内,并且能耗降低并未影响系统的稳定性,但这样的环境毕竟让人感到不舒适。基于以上想法以及不同客户有不同需求的事实,戴尔提供附加的控制点,允许IT专业人士将风扇的运转速度设置得比热控算法规定的速度更高些。通过这种方法,可以减少对散热的担心,降低人员工作时的环境温度,但其代价是:风扇的能耗随转速的提高而增加。请注意:风扇只能被设置成更高的转速,而不能设置成比热控算法规定的速度更低,这样可以保持系统处在散热标称范围内,并确保系统的稳定性不存在风险。一些人可能会担心风扇在更高的转速下会影响风扇的稳定性,但是请您放心:风扇在产品的寿命期内,即使始终全速运转也不会影响其稳定性。上述控制点设在BIOS菜单内,以下白皮书第8-10页中有详细描述:

http://www.dell.com/downloads/global/products/pedge/advanced_thermal_control_whitepaper.pdf

酷吗?

因此,我希望这篇博文能够帮助您以开放的心态接纳更高的热度(但是能效更高了),让您在花钱的时候感觉更酷一些(节省您的日常运行成本)。我将很高兴接受对本博文的“热议”和“冷议”,并希望在未来发表更多您感兴趣的博文。

下面我为您提供一些有帮助的链接,方便您进一步阅读:

戴尔电力与散热技术网站: http://content.dell.com/us/en/enterprise/power-and-cooling-technologies.aspx

高级热控制白皮书: http://www.dell.com/downloads/global/products/pedge/advanced_thermal_control_whitepaper.pdf

英特尔处理器技术规格: http://ark.intel.com/

0
  • 客户之所以担心服务器发热,是基于寿命和运行安全还有稳定性考虑,很多时候,很多数据中心还有服务器的元器件一般都会超出设计寿命运行,客户自身也是基于自己的实际寿命需要而对这些情况经行反馈....