算力的尽头是电力,下一个尽头是建立“共享能源经济”
返回美国似乎在迎来核电的复兴。大模型与AI,及其带来的智算基础设施大规模建设,正在催生对可持续算力的新的焦虑。核能似乎是它们能找到的短期相对可行的解决方案之一。
亚马逊AWS这两天正在招聘首席核工程师,为其数据中心用电制定核电路线图,招聘要求还特别强调了要在小型模块化(SMR)技术上有丰富经验。微软去年就已经招到了该技术领域的核技术总监,这两天刚和核电巨头星座能源(Constellation Energy)达成协议,重启三里岛核电站(Three Mile Island)。谷歌和甲骨文都准备建造1GW以上的数据中心,正在考虑的能源解决方案中包括模块化核反应堆。
算力越来越成为AI发展的瓶颈。这些科技巨头正在面临“杰文斯悖论”在智算用电上的再次奏效,先前制定的碳中和目标岌岌可危,甚至连Sora等先进技术规模落地都遇到了困难。但它们主要还是重启与接入核电,是应急之举。未来智算用电将继续膨胀,最关键是创造“共享能源经济”这样的新型电力系统。
杰文斯悖论下的算力可持续问题
计算就是能源的处理形式。在数据中心这一基础设施里,电力转化成了算力。对于这一基本的“物理原理”,由于涉及因素繁多,不确定性较强,不同的研究机构在不同场景下,测得智算中心用电增长的趋势,差距颇大。但整体而言,到2030年,全球尤其是作为大模型技术主要竞争对手的中国与美国,对智算规模增长带来的用电需求,都达到了空前的水平。
未尽研究此前曾发布报告《AI改变能源》预测,届时,中国智算中心的用电需求,最高将达到1.3万亿度;在芯片迭代、算法架构等持续进化下,这一数值可能降低至0.6万亿度。从总量上看,这似乎还不算是过于庞大的数据。年初,中电联预计今年全国全社会用电量就将达到9.8万亿度,明年有望超过10万亿度。但从增量上看,未来,智算用电占整个中国新增用电的比例将非常惊人,至少达到27%。
这对应着全球经济的新一轮“电气化”。最近,荣鼎投资预测,十年后,美国的新增电力需求将被交通电气化、工业电气化与智算中心所分食。其中, 电动汽车会吃掉增量的50%,智算中心则会吃掉增量的25%。
长期以来,欧美发达国家的社会经济发展依赖于服务化会与数字化,用电增量处于相当平缓的趋势。在大模型时代到来之前,由于数据中心整体能效不断提升,用电量占比较长一段时间都维持在1%-1.5%的水平。如今,尽管这个趋势仍在持续,黄仁勋就常常在发布会上给大家打气,无论是用于训练还是推理,英伟达芯片的算力性能提升速度都高于能耗提升速度,但目前起主导作用的却是大模型发展所带来的绝对规模的增长。据美国电力研究协会(EPRI)预测,如果智算用电以15%的年复合速度增长,到2030年,它将占美国用电量的9.1%。
拐点已经到来,大模型与AI是最大的变量。随着大模型与生成式AI从文本向视频等多模态落地,智算用电将进一步增长。距离Sora公之于众已经过去了半年多,但它一直没有真正公开发布。其中一个重要的原因是能源。如果它是一款杀手级应用,像tiktok或者youtube那样,那么它所需要72万张H100级别的智算集群。事实上,美国的科技巨头还在探索十万卡的单一集群——公开宣布达成这样记录的马斯克,事实上正在使用燃气轮机为其供电——到2025年才有望扩展到30万卡集群。
制造这样的智算集群,本身也需要庞大的电力支持。芯片制程节点越先进,它就越耗电。据IMEC分析,从28nm到3nm,它的碳排放翻了一倍。台积电是典型“受害者”,五年来用电量增长了85%,用电量占当地电力市场近13%。考虑到台湾岛内绿电资源与潜力不足,台积电要从如今的11%绿电到2040年实现碳中和,困难重重。中国也发展大模型,半导体制造工艺也在追赶先进制程,同时要求算力来源自主可控,也将面临类似的考验。
算力用能也逃不开杰文斯定律。计算效率的提升,不但不会减缓计算用能的增长,反而会加速它进一步增长。算力越是高效低廉,技术创新就越迅速与深入,市场应用范围就越广,规模就越大,带来的能源消耗也就越高。工业革命以来煤炭、电力、石油的利用,都遵循了杰文斯定律。
照明是最典型的案例之一。从1850年到1900年,随着资源价格下降,油气照明的成本下降为原来的1/10,但照明用能规模扩展了近5倍。1920年代,照明进入了电气时代,它的能源消耗规模短期内陡然下降,照明成本也进一步下降。但很快,它就迎来了规模应用爆发,从1945年到2006年的六十年间,它的成本进一步下降为原来的1/10,用能规模则扩展了近10倍。
算力也将如此,无限的算力,可能需要无限的电力。这就是算力可持续问题。整个算力的产业链的每一个环节,都在使得它成为一个迫切问题。
美国科技巨头碳中和目标正在失守
在大模型时代之前,美国科技巨头在碳中和目标上显得非常高调。RE100是一个全球性的倡议,旨在鼓励并支持企业致力于实现100%使用可再生能源电力的目标,目前有400多个成员。美国科技巨头在列,主导了全球绿电采购协议市场。去年,亚马逊的协议采购(PPA)规模最大,接近9吉瓦(GW),Meta达到了3吉瓦,谷歌、特斯拉与微软也在1吉瓦左右。
但是,这还远远不够。美国科技巨头在算力可持续方面的努力,严重滞后于AI的发展。这两年,它们的年化资本支出,从1380亿美元同比增长到2290亿美元,近1000亿元投入到算力基础设施建设上,也就是AI优先。
这导致它们的碳中和的理想与现实之间的落差开始拉大。谷歌从2019年到2023年,碳排放增加了48%;微软2023年比2020年增加了30%;亚马逊碳排放自从2019年增加了40%。谷歌今年已经破了防,不好意思再提碳中和;微软此前还宣传要在2030年实现负碳,也就是把历史上排放过的碳都收回来,估计也要低调一些。
谷歌与微软希望能以更严格的标准来衡量实际使用的无碳能源,大致可以划入24/7无碳能源派。由于基于地理位置的碳排放与基于市场的碳排放的差异越来越大,谷歌还呼吁要在“在地理和时间上更细致的范围2核算”等。Meta与亚马逊显然不认同这一观点,是典型的“排放优先”派,也就是先排了再说,然后通过其他手段把它抵消掉,包括新建绿电发电厂、采购绿电协议,或者更多绿证。但这种做法遭致越来越多批评,它没有带来直接的绿电的增量效用,而且物理上还是往大气中排放了越来越多的温室气体。
目前,美国科技巨头对碳账户标准的角力还在继续。温室气体核算体系(Greenhouse Gas Protocol)预计将于2025年完成调整初稿并征求意见,于2026年下半年正式发布。但这一核算体系目前的资助方是都是美国科技巨头,包括贝索斯地球基金、Meta与微软。中国也应该有一家巨头参与进去,共商共建兼顾全球可持续与中国利益的统计、披露标准。
实现共享能源经济的新型电力系统
美国科技巨头的单打独斗正在碎片化地解决电力尤其是绿电对AI发展带来的束缚。它们的数据中心与当地电力公司进行耦合,以核电为主;建立独立的备用电源,以天然气为主;还在尝试地热与氢能等新的能源储存方式,以及早期投资核聚变等未来的能源应用。
巨头们的最新动向,是结成投资联盟。微软与中东主权财富基金,共同成立成千亿美元规模的基金,解决迫在眉睫的数据中心部署和电力“卡脖子”问题。
如果电网不改变自己,或者太慢,美国巨头等不及了,就会自己想办法改变电力系统。数据中心长期有效实现算力可持续,最终需要整个能源电力系统的低碳化,并在此技术上构建出一套称上的“共享能源经济”的新型电力系统。
全球都在推进可再生能源的规模部署,中国各省市电网的碳因子将在未来十年内大幅下降。但伴随着将来电力系统中可再生能源占比的提高,未来的电力系统将变得越来越异构、多元与分散。这对同时保持整个电力系统的弹性与稳定性带来挑战。美国加州为了应对这个炎热的夏季,电网中传输着至少十种不同来源的电子,它在一天的峰谷波动就达到了30%。其中,太阳能就在白天贡献了最多的绿电,但在其他时间段需要储能及大量依靠燃气发电或外部输入。
简言之,这是一个非常动态、碎片化,需要高度协调的新型电力系统。目前,加州已经可以做到每年实现100天的100%绿电供应。这是未来电力系统演变的方向,中国也在抓紧建设。青海目前新能源发电量过半,在2022年时候做到了全年35天的100%绿电。
尽管大模型的发展似乎正在趋缓,但美国科技巨头宁愿过度投资,也不愿意错过投资。它必须加快发展AI,但它最大的现实问题是传统电力系统从立项、审批、建设到上网的各个环节推进缓慢。美国已经多年没有新建核电站,新建要经过审批、环评、建设、投产,正常时间下来要十年八年,这也是为什么美国科技巨头此前都是“拆东墙补西墙”,与民争电;即使是风与光发电也需要六七年的时间。中国的速度明显会快一点,但至少也要三四年,这与大模型每个月都在推陈出新的节奏并不协调。
美国科技巨头正在加强游说。上周,美国政府刚刚成立了一个专责小组,促进AI基础设施的建设,包括在联邦政府的权责范围内加速数据中心和电力部署的审批。成效如何,还有待观察。
数据中心既要快速扩张,又要获得稳定和廉价的电源,还要减低碳排放,有望推动共享能源经济模式的出现。美国的电力系统市场化程度相对较高,未来,数据中心与电网可以从当前的“被动负载”模式,转变为协作共赢的模式,电网和数据中心的电力资源将得以完全整合,即电网资源为数据中心供电,而数据中心的备用资源,则为电网的可靠性和灵活性做出贡献。中国则在尝试源网荷储的一体化。
而AI自身将是这一“共享能源经济模式”最重要的加速和使能技术。
来源:未尽研究