当前AI算力市场呈现严重供需失衡,直接推动GPU租赁价格持续攀升。摩根大通4月19日发布数据中心追踪报告显示,2026年3月三大层级GPU租赁价格均环比走高,其中B200涨幅最为突出,单月环比上涨23.5%,租赁价格升至每GPU小时5.47美元,大幅高于2月的-0.2%和1月的0.7%。H100租赁价格延续上行态势,3月报每GPU小时2.64美元,环比上涨8.6%,连续第四个月录得环比正增长;A100租赁价格3月报每GPU小时1.48美元,环比上涨6.5%,连续第三个月加速上涨。
供需失衡的核心表现为需求爆发式增长与供给端瓶颈凸显。需求端,国内日均Token调用量两年内增长超1000倍,从2024年初的1000亿飙升至2026年3月的140万亿,多模态视频生成、智能体等复杂应用的算力消耗呈指数级增长。供给端,台积电先进制程产能被长期锁定,下一代Rubin GPU因HBM4存储芯片验证延迟,2026年产能目标下修25%,叠加单AI机柜功耗高达1MW,部分数据中心因电力短缺闲置GPU,进一步加剧供给紧张。

需求端持续爆发是价格上涨的核心驱动力。2026年ToB领域日均Token调用量突破5000亿,智能体作为Token消耗核心载体,单次任务Token消耗量可达数十万级别,是普通对话的10倍以上,对高性能GPU的需求持续激增。OpenRouter平台数据显示,2026年3月智能体相关工具的Token消耗量,占全平台总消耗量的68%,直接带动GPU租赁需求攀升。
供给端瓶颈难以短期缓解,进一步支撑价格上涨。硬件层面,英伟达在AI训练芯片市场份额超90%,推理市场份额达80%-85%,垄断地位导致供给调节能力有限,二手H100仍能以原价85%出售,保值性凸显。存储层面,TrendForce数据显示,2026年一季度DRAM合约价格环比大涨96%,NAND合约价格环比上涨88%,显存短缺导致GPU生产成本居高不下,间接传导至租赁价格。此外,国内GPU服务器保有量虽突破120万台,但平均利用率仅55%,闲置与短缺并存,未能有效缓解供需矛盾。

GPU租赁价格持续上涨,大幅增加企业算力使用成本。一套基础AI大模型训练集群需50-100张A100 GPU,按当前租赁价格计算,月均租赁成本超20万元,中小微企业与个人开发者面临算力获取难、成本高的困境。当前国内GPU算力服务市场形成三类玩家,综合云厂商价格偏高,传统跨界企业技术积累不足,专业算力平台凭借高性价比成为中小主体的首选。
星宇智算依托自身算力整合与调度能力,适配市场需求,为不同群体提供高性价比GPU租赁服务,缓解算力供需失衡带来的成本压力。其整合全系列GPU资源,采用灵活计费模式,可将闲置GPU利用率提升至90%以上,为初创企业、高校及个人开发者提供定制化租赁方案,较行业平均价格降低15%-25%,同时通过技术优化,将GPU算力损耗控制在5%以内,助力用户在价格上涨周期中高效利用算力资源。

业内普遍预判,GPU租赁价格短期大概率继续上涨,上涨态势将持续至2026年三季度。核心支撑在于,供给端扩产周期较长,三星、SK海力士等显存厂商新建产能需至2027年底才能形成有效供给,美光直言新建产能对市场产生显著影响要等到2028年,短期供给缺口难以填补。需求端,智能体应用规模化落地、大模型迭代升级将持续释放算力需求,进一步推动租赁价格上行。
长期来看,GPU租赁价格走势取决于供需平衡进度。若台积电先进制程产能如期释放、HBM4供应问题解决,新增算力供给有望追上需求增长,价格可能逐步回落;若AI需求持续狂飙,叠加先进技术验证延期,价格中枢可能长期维持高位。星宇智算这类专业算力平台,通过资源整合与成本优化,将持续发挥桥梁作用,助力算力资源高效匹配,缓解供需失衡压力,同时自身也将在行业发展中占据更有利地位。