2020年初,世界顶级学术期刊《Science》刊登的论文《重新校准全球数据中心能耗估算》的数据却表明:全球数据中心的能耗增长其实在放缓。
一、序言
从各类数据的表面来分析,数据中心无疑是“能耗大户”。从微观上看,一个超大型数据中心每年的耗电量近亿度;从宏观上看,全世界数据中心的耗电规模为205TWh[1],占全世界耗电规模的1%。据中国信息通信研究院(以下简称“中国信通院”)发布的《数据中心白皮书》统计,我国数据中心产业年增长30%以上,有人因此担心数据中心的能耗也会迅速扩增,而事实真的是如此吗?2020年初,世界顶级学术期刊《Science》刊登的论文《重新校准全球数据中心能耗估算》的数据却表明:全球数据中心的能耗增长其实在放缓。
一般观念里面对于耗电都是只讲“总数”不讲“边际”,数据中心耗电的“总数”看似庞大,其实从“边际”的角度来看,数据中心确实通过努力在逐渐摘掉“能耗大户”的帽子。《重新校准全球数据中心能耗估算》的研究表明:与2010年相比,2018年全球数据中心计算实例增加了550%,而同期全球数据中心的耗电量仅增加了6%。从每个计算实例来看,全球数据中心的能耗强度自2010年以来每年下降20%,能耗效率显著提升。
二、能耗增长放缓的原因
综合《重新校准全球数据中心能耗估算》和全球发展现状分析,数据中心能耗增长放缓的原因主要有三点:
一是得益于积极的政策引导。在全球各地区政策的引导下,数据中心从较小的传统数据中心向超大规模数据中心转变,有效降低PUE值。目前数据中心的规模正在从较小的传统数据中心向更大、更节能的超大规模数据中心转移,2010年全球传统小型数据中心规模占计算实例的79%,而到了2018年全球超大型数据中心规模占计算实例的89%。
二是得益于IT设备的技术与效率的不断提高。在2010-2018年期间,全球服务器效率以及虚拟化程度的提高相结合减少了每个计算实例所需的电量,使全球计算实例增加了6倍的同时服务器能耗仅增加25%;存储驱动器效率和密度的提高相结合使全球存储容量增加了25倍的同时存储能源的使用仅增加了3倍。
三是得益于制冷和供配电等基础设施技术的不断改进。这些基础设施的技术进步使得能源使用量大幅减少,有效降低PUE值。据估计,2018年全球数据中心的平均PUE为2010年的75%左右,得到有效改善。
三、能耗改善的实践
1. 政策方面政策引导数据中心走向大型化和集约化,有效降低能耗。国内数据中心在2013年以前存在着过热、盲目和重复建设问题,同时,全国大部分数据中心存在规模偏小、布局不合理、能效水平低等问题。从2013年开始,工信部陆续通过联合四部委印发《关于数据中心建设布局的指导意见》、滚动更新《全国数据中心应用发展指引》(中国信通院云计算与大数据研究所具体支撑)等方式引导数据中心合理建设和布局,多个省市通过陆续出台一系列政策引导规范数据中心的建设,我国数据中心的能效水平总体提升。
2013年以前,全国对外服务型数据中心平均PUE在2.5左右,而到2019年底,全国对外服务型数据中心平均PUE近1.6,实现质的飞跃。同时数据中心也朝着大型化、集约化的方向迈进,2013年以前全国大型以上数据中心的数量较少,而到了2019年,在对外服务型数据中心中,大型以上数据中心机架规模占比达到70%左右,这极大地促进了数据中心能耗效率的提升。
不仅PUE的平均水平在优化,我国数据中心的最佳PUE也在不断创新低。自2013年起,中国信通院云计算与大数据研究所已经测过众多数据中心的PUE,其中PUE表现良好的大部分为互联网和通信行业大型数据中心。很明显,随着时间的推移,参测数据中心PUE已经由1.4-1.5区间降低到1.2-1.3区间。
年度参测数据中心PUE平均值
在国际上,以美国公共机构为例,美国政府从2010到2019十年时间内,通过美国联邦数据中心整合计划(FDCCI)、联邦政府信息技术采购改革法案(FITARA)、数据中心优化倡议(DCOI)等一系列政策措施,实现了数据中心数量减少7000个,减少约50%;近一半大型数据中心PUE从平均2.0以上优化至1.5甚至1.4以下;部分服务器利用率从5%提升到65%以上。
2. 技术方面数据中心供电架构逐步简化,提高用电效率。随着产业规模快速增长,高压直流(HVDC)逐渐成为数据中心供电系统的新选择, “HVDC+市电直供”相结合的模式,供电效率可提升到94%-95%,若采用HVDC离线模式,供电效率可提升至97%以上,目前HVDC已在大型互联网公司得到了广泛应用。由于HVDC的容量所限等原因,巴拿马电源横空出世,它颠覆了传统IDC供电架构,从中压10KV AC直转240V DC,减少转换次数缩短电流旅程,相比传统双U架构配电节省投资44%,IDC整体投资节省7%以上。
液冷逐渐成为数据中心制冷的新方向,更加节能。随着新兴技术的快速发展,特别是高性能计算设备和GPU服务器的使用,将使单机架用电规模朝着20kW-30kW甚至更高规模发展,而用电密度提升对数据中心制冷系统提出挑战。传统风冷已无法达到所需的散热能力,液冷逐渐成为数据中心制冷的新模式。液冷模式通过液体直接导向热源带走热量,散热效率更高、更加节能。国内以ODCC(开放数据中心委员会)为代表的行业平台积极推动了液冷的标准化进程,加速了数据中心液冷团体标准、行业标准的出台。
整机柜服务器支撑新技术新应用,有效降低能耗。天蝎整机柜服务器目前完成三代技术演进,实现了服务器供电、散热和系统管理层面标准化、资源池化,不仅可以实现性能的提升、总成本的降低,同时也降低了能耗。如整机柜ARM64服务器,对比同配置X86服务器,计算性能提升1-2倍,单节点能耗省40W;整机柜GPU服务器,通信带宽提升2-4倍,延时缩小1倍,比传统GPU服务器性能提升30%,能耗降低7%以上。
四、小结
由于计算能力和能源消耗的正比关系,数据中心的高能耗属性不会改变,但是我们可以通过政策引导和技术创新来实现数据中心的高能效和高质量发展,同时也需要关注数据中心对经济发展带来的显著促进作用。随着数据中心进入新基建的序列,数据中心的社会关注度骤升,相关政策密集研究和出台,我们也期待并尽力推动更多的数据中心技术创新。
[1] Recalibrating global data center energy-use estimates
作者简介
吴美希,中国信息通信研究院云计算与大数据研究所数据中心研究部高级业务主管。
郭亮,中国信息通信研究院云计算与大数据研究所副总工程师,开放数据中心委员会(ODCC)新技术与测试工作组组长
(来源:中国信通院CAICT)