东升国际

您现在的位置: 东升国际 > 关于东升国际 > 企业动态 > 最新资讯 > AI服务器电源:智能时代的动力命脉

AI服务器电源:智能时代的动力命脉

发布时间:2025.09.08  点击量:

在人工智能浪潮席卷全球的今天,AI服务器已成为驱动技术革命的核心基础设施。从大语言模型的训练推理到自动驾驶的实时决策,从科学模拟到智能医疗,这些前所未有的算力密集型任务正依托于规模空前的GPU集群与异构计算架构。然而,在这座由芯片与算法构筑的智慧大厦背后,一个常被忽视的组件却扮演着决定性角色——AI服务器电源。

AI服务器电源作为支撑算力稳定运行的核心“能量底座”,其重要性已超越传统供电设备,成为决定AI产业发展的关键瓶颈与技术高地。


01

算力革命的“动力心脏”


AI服务器电源不仅是能量的供给者,更是高密度算力能否安全、稳定、高效释放的关键瓶颈。相较于传统服务器,AI服务器电源需应对千瓦级功率密度、瞬时尖峰电流与极端能效要求的三重挑战,其可靠性直接关系到数百万美元的计算资产与关键研发进程。一旦供电出现毫秒级闪断,可能导致训练数周的模型中断乃至硬件永久损坏;而能效的微小提升,则意味着巨大的运营成本节约与碳足迹降低。


因此,AI服务器电源已超越传统配件的范畴,它是智能时代算力革命的“动力心脏”,是平衡性能、可靠性与可持续发展的重要支点。


02

行业发展趋势分析


[一] 市场规模爆发式增长

当生成式AI的参数规模突破万亿级、自动驾驶训练数据量以PB级每日递增,AIDC的供电需求正在飞速增长,相关数据表明:柜外电源2030年市场规模预计达996亿元(CAGR 50%);服务器电源2030年全球规模将达1470亿元(CAGR 42%),其中AI服务器电源占比从2024年40%升至2030年45%。

2017-2024年中国内地数据中心在运营标准机架数量及市场规模


[二] 芯片单体功耗急速增加,AIDC供配电架构加速变革

芯片方面,英伟达的H100和H200单芯片功耗为700W,GB200达到2700W,单芯片功耗显著提升;服务器配置方面,AIDC 需部署高功率 GPU/TPU 服务器,单机柜功率达传统 IDC 的 5-10 倍。为减少数据中心供电的能量转换层级、降低电流损耗并提升功率密度,服务器电源正朝着高压架构发展。

英伟达单GPU芯片功耗


[三] 液冷方案兴起

在高功率密度机柜的场景下,为了解决机柜间的散热需求,液冷方案逐渐兴起。液冷方案的散热能力更强,同时可以降低数据中心的PUE。随着机架密度升至20kW以上,为满足高热密度机柜的散热需求,多种液冷技术应运而生。

*注释:PUE(Power Usage Effectiveness),即电源使用效率;PUE=数据中心总能耗/IT设备能耗。


[四] 新型器件与生态协同

为解决数据中心能耗高、功率密度提升需求迫切等问题,需要新器件与生态系统协同配合,采用SiC/GaN替代硅基器件,可将效率提升3–5%;此外,利用光储直柔(PEDF)系统将光伏、储能与HVDC直接耦合,可以减少转换环节,提升绿电利用率。


03

技术发展路线


服务器电源技术的发展遵循着一条清晰的主线:如何更高效、更可靠、更密集地为增长惊人的计算负载供电。


[一] 从传统交流到高压直流

传统交流UPS架构:采用交流不间断电源(UPS)为服务器供电。服务器内部的电源单元(PSU)再将交流电(AC)转换为直流电(DC)供主板、CPU等使用。这种架构存在转换环节多(AC->DC->AC->DC)、效率低(通常90-94.5%)、占地面积大等问题。


HVDC架构:HVDC架构为提升供电效率应运而生。该方案在电力机房设置集中式整流柜,将交流电一次性转换为240V/336V/±400V/800V等高压直流,并直接输送至服务器机柜。其采用的AC/DC直流直供结构大幅简化了系统架构,故障点减少超50%,同时显著降低能量传输损耗,系统典型效率可提升至94%-96%,兼具高效与可靠。

UPS与HVDC供电结构对比


巴拿马电源架构:在HVDC系统上进一步简化,取代了传统架构的众多中间设备功率模块,相较于HVDC,巴拿马电源最大的变化为采用移相变压器替代传统工频变压器,将降压与整流功能合二为一,可直接将输入的10kV市电转化为240V/336V/±400V/800V等高压直流。目前数据中心巴拿马电源使系统典型效率增至97.5%。

巴拿马供电结构


SST固态变压器:SST的基本工作原理是先将输入的工频交流电通过整流器转换为直流电,接着利用逆变器将直流电逆变为高频交流电,再通过高频变压器进行电压变换和电气隔离,最后经整流将高频交流电还原为所需电压等级的直流电输出。相较于巴拿马电源,采用基于电力电子变换技术的固态变压器(拥有三级功率变换架构),可通过高频变压器实现电气隔离与电压匹配,直接完成10kV交流到800V直流的转换,eff约98%。

SST供电结构


[二] PSU的技术革新

功率密度持续提升:以某头部厂家为例,其PSU升级路线中,PSU架构从3.3kW、5.5kW到12kW、22kW的电源功率进阶,功率密度将从32W/立方英寸提升至100W/立方英寸,核心是通过硅、Sic、GaN等半导体材料提升电源的功率密度,以在有限的空间内提供更高的功率输出。

PSU功率与功率密度提升


电压平台不断升级:PSU 输出电压随算力需求升级逐步走高。早期CRPS以12V、5V、3.3V为主,适配传统服务器低功耗需求,此后48V中间母线兴起,契合ORv3标准,平衡效率与设备兼容性。2025年5月英伟达(NVIDIA) 在COMPUTEX大会上宣布,其800V HVDC架构将于 2027年全面部署,以支持单机柜功率超过1MW的AI计算集群。结合BBU提升系统故障冗余能力:BBU由电池组和BMS、充电器和其他功能块组成,与PSU一一对应,当母线电压低于48.5V持续2ms以上时,BBU模块放电模式被激活,并在2ms内接管母线电压,在断电时为服务器提供短暂供电支撑。

PSU与BBU对应关系


04

核心挑战


[一] 响应速度的超高要求

当前计算芯片的功耗正飞速增长,GB300 NVL72机柜的功耗预计将达到135kW~140kW, GPU芯片瞬态电流需求极高,在AI模型训练时,处理器负载迅速从低功耗状态迅速上升到高功耗状态,短时间内电流需求激增,负载变化率可达10~60A/us,如电源响应速度不够快,无法及时调整电压,可能导致处理器电压跌落,进而影响性能和系统稳定性、甚至导致硬件损坏,这对PSU的响应速度提出了极高的要求。


[二] 负载特性难以测试还原

对于几十安培每微秒的负载动态变化,常规电子负载难以精确还原;此外,随着PSU功率密度提升,Power Shelf功率已突破33kW/1U,机柜功率早已突破100kW。服务器电源厂家的研发实验室以及产线,如何匹配电流响应快、功率范围宽、兼容适配性高的电子负载设备成为了新的难题。


[三] 液冷技术的工程化挑战

当前风冷技术的散热效率已达瓶颈,对于部署了GB300等高功耗芯片的AI数据中心来说,液冷不仅是降低PUE的选择,更是唯一可行的散热解决方案;但液冷技术的散热效率虽高,随之而来的是漏液风险、维护复杂、改造困难以及高昂的建设成本。


[四] 绿色能源整合的技术鸿沟

大型AI数据中心的供能要求爆发式增长,需要进行可再生能源整合,但光伏和风电的输出功率波动可达±30%,导致母线电压波动超10%,影响服务器稳定性。需引入超级电容或飞轮储能作为缓冲,但这会增加系统复杂度。


[五] 标准化与兼容性困境

与技术的快速迭代相伴而来的是标准化与兼容性难题,例如不同厂商的PSU存在连接器不兼容问题(OCP ORv3 要求的 12VHPWR 接口与传统 8 针接口并存),导致数据中心需储备多类型线缆,运维成本增加 15%。

新旧技术如何平滑过渡、不同方案如何协同工作的难题,需要芯片厂商、电源供应商、服务器制造商和数据中心运营商等产业链各方共同协作,通过建立统一的行业标准和规范来逐步解决。


05

总结


作为算力基座的“心脏”与“减碳枢纽”,AI服务器电源已从幕后配角升级为决定AI产业发展的关键瓶颈与技术高地,针对日益增加的测试需求,东升国际 即将推出针对AI服务器电源的测试方案,敬请期待!


var _hmt = _hmt || []; (function() { var hm = document.createElement("script"); hm.src = "https://hm.baidu.com/hm.js?4b3ee861d5af59f35934c3b5eef6acc3"; var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(hm, s); })();