全球AI算力军备竞赛白热化:2026年AI服务器出货量预计达980万台

首页 / AI资讯 / 泛AI领域

【导语】2026年6月,全球AI算力市场正处于一场深刻的范式转型中——从"芯片性能的军备竞赛"转向"系统级算力效率的全方位博弈"。IDC和Gartner的综合数据显示,2026年全球AI服务器出货量预计达到980万台,同比增长44%。其中高端GPU/NPU服务器占比从2025年的37%跃升至55%,"算力饥渴"已经从小范围蔓延至千行百业。

算力供需的微妙变化:B200良率与H100反弹的连锁反应

2026年Q2,全球AI算力市场出现了两个看似矛盾的现象:高端芯片供不应求与部分算力价格承压并存。 一方面,英伟达的B200/B210系列出货节奏出现了微妙变化。受先进封装产能CoWoS-L良率爬坡速度低于预期影响,B200 Ultra实际交付量仅为预期目标的68%。这直接导致了6月现货市场H100/H800二手租用价格出现短暂反弹——华东地区H800八卡服务器月租价格从4月的18.5万元回升到6月初的21.2万元,涨幅约14.6%。 另一方面,这一波动并未动摇市场对下一代算力的信心。AMD的MI400X正式进入量产爬坡阶段,Q2出货量预计达到15万片,是去年同期的3倍,迅速填补了英伟达留下的部分产能缺口。数据中心运营商纷纷表示,"终于有了除了英伟达之外的可靠选择"。

液冷时代的加速到来

2026年AI算力市场最值得关注的趋势之一是液冷散热技术的快速普及。随着单芯片功耗突破700W门槛(英伟达B200为700W,昇腾920为750W),传统风冷散热已经无法满足高效散热需求。 2026年6月,飞荣达、英维克等液冷解决方案供应商订单同比暴增210%。液冷服务器渗透率在新建数据中心中已从2025年的25%快速攀升至45%。行业共识是,2027年液冷将成为AI数据中心的"标配",不再是一项"可选增值服务"。 液冷技术的推广不仅关乎散热效率,还直接影响数据中心的选址和运营成本。液冷系统可以将数据中心的PUE(电源使用效率)降低到1.1以下,相比传统风冷的1.4-1.6,每年可节约数百万级别的电费支出。

HBM4量产:内存带宽突破与良率难题

在GPU算力快速增长的同时,AI系统的"内存墙"问题日益突出。2026年6月,三星与SK海力士同时宣布HBM4进入量产爬坡阶段。HBM4相较HBM3e将堆叠层数从12层提升至16层,单堆容量达到64GB,带宽突破2TB/s。 然而,HBM4的量产良率令人担忧——目前仅为60%-65%,这意味着单颗HBM4成本较HBM3e高出约40%。这一良率问题直接推高了B200 Ultra等高端GPU的BOM成本。据估算,一颗B200 Ultra的HBM4内存成本就占其芯片总成本的30%以上。 一个隐藏的变量是光互联技术的商业化突破。英特尔在2026年5月宣布其基于硅光子技术的OCI芯片已进入小批量试产,预计2027年Q1进入数据中心市场。OCI芯片可以将GPU之间的互联带宽提升10倍的同时,功耗降低80%。一旦这一技术落地,将从根本上改变AI集群的拓扑结构。

云厂商资本支出的结构性调整

2026年6月,谷歌、微软、亚马逊三大云厂商的年度资本开支指引出现了罕见的"结构性调整"——总金额继续上调(三巨头合计预计超过2200亿美元),但用于传统CPU服务器的采购预算被大幅压缩,转而投向液冷数据中心和定制AI芯片。 微软Azure在6月初宣布,其新一代Maia 3 AI加速芯片将在2026年Q3进行内部大规模部署。Maia 3通过Chiplet架构将功耗控制在600W以内,但通过HBM4内存实现了2.3TB/s的显存带宽——超越了英伟达B200的1.8TB/s。这表明定制芯片在特定推理场景下已经具备了与通用GPU正面竞争的性价比优势。 云厂商的自研芯片趋势将对AI芯片产业格局产生深远影响。当谷歌、微软、亚马逊都开始"自产芯片"时,英伟达在数据中心AI芯片市场的统治地位将面临前所未有的挑战。

局部算力过剩与AI IaaS模式

站在2026年6月的时间节点,一个隐忧正随着算力供给暴增而逐渐显现。据TrendForce估算,2026年全球AI训练芯片总产能(等效H100)约为450万片/年,而有效实际需求约为360万片/年——供需缺口已从2024年的"严重短缺"缩小至"基本平衡"。 特定场景甚至出现了算力闲置。2026年Q2,国内一些小型云厂商的算力租赁价格已较2025年同期下降20%-30%。但行业专家认为这种"局部过剩"是结构性的而非系统性的——随着多模态大模型、视频生成和自动驾驶等对算力要求更高的应用普及,算力需求仍然远未到天花板。 与此同时,一种名为"AI基础设施即服务"的新商业模式正在快速兴起。阿里云2026年6月推出的"算力期货"服务允许客户提前锁定未来3-6个月的GPU租赁价格。二三线城市(如贵州贵安、甘肃庆阳)利用廉价绿电和土地优势建设"AI算力特区",算力租赁价格仅为一线城市的40%-50%。

来源:综合自IDC、Gartner、TrendForce行业报告、云熵数据平台、阿里云官方公告等公开信息

发布时间:2026-06-25