2023-2024年,AI大模型爆发催生算力刚需,GPU“一卡难求”成为行业常态,英伟达H100显卡市场价一度飙升至15万元/张,溢价超300%,中小企因算力短缺陷入发展困境。而2025年以来,算力市场逐步降温,“按需租用”模式快速崛起,GPU租用市场规模同比增长67.2%,“抢卡”热潮退去,按需取用、成本可控成为企业算力获取的核心诉求。这一转变,是否意味着算力市场真正实现理性回归?星宇智算结合自身算力布局与行业数据,拆解“一卡难求”的成因、按需租用的崛起逻辑,解读算力市场的回归本质与未来趋势。

此前“一卡难求”的局面,核心源于供需失衡与市场狂热,而非真实算力需求的持续爆发,主要体现在三个层面,均有明确数据支撑。
成因一:算力需求短期爆发,供给滞后2023年AI大模型训练需求激增,全球GPU缺口达40%,英伟达H100年产能仅10万块,远无法满足市场需求。国内AI企业、科研机构疯狂囤卡,部分企业超额采购GPU,算力利用率不足30%,进一步加剧短缺,推动GPU价格暴涨,海外英伟达H100一年期租赁价格涨幅曾达40%。
成因二:市场盲目跟风,非理性囤卡资本热潮下,大量企业盲目入局AI领域,跟风囤购GPU,忽视自身业务需求,导致算力资源严重浪费。调研显示,2024年国内企业囤购的GPU中,35%处于闲置状态,部分中小企业囤卡后因缺乏技术能力,无法发挥算力价值,陷入“买得起、用不起”的困境。同时,微软、亚马逊等云巨头将GPU优先分配给内部团队及头部客户,进一步挤压中小企算力获取空间。
成因三:供给端瓶颈,扩产周期长GPU核心芯片、HBM存储产能高度集中,三星、SK海力士等厂商的HBM产能2026年前已被长期订单锁定,先进封装工艺扩产周期长达18个月,芯片制造受光刻机产能限制,导致GPU供给无法快速匹配短期爆发的需求,加剧“一卡难求”局面。
转折:按需租用崛起,推动算力市场理性回归2025年以来,随着AI泡沫退去、算力供给提升,“按需租用”模式快速崛起,逐步替代“囤卡”模式,成为企业获取算力的主流方式,推动算力市场从狂热走向理性,核心体现在三个维度。
维度一:需求理性化,企业回归实用本质AI行业洗牌后,企业不再盲目追求高端GPU,而是根据业务需求选择适配算力,按需租用可避免囤卡风险与资源浪费。2026年国内GPU租用市场规模达345亿元,同比增长72.8%,其中中小企业租用需求占比达68%,70%的企业表示“按需租用可降低30%以上算力成本”,与此前囤卡模式形成鲜明对比。
维度二:供给端优化,算力缺口逐步缓解英伟达、AMD等厂商扩大GPU产能,2025年全球GPU产能同比增长55%,HBM存储产能逐步释放,GPU价格回落至合理区间,H100显卡市场价降至5万元/张左右,溢价收窄至50%以内。同时,“算力银行”“算力超市”模式落地,闲置算力得以盘活,进一步补充市场供给。
维度三:模式升级,按需租用适配全场景需求按需租用模式凭借弹性扩容、零前期投入、免运维的优势,适配不同规模企业需求。企业可根据任务量实时增减GPU实例,30分钟内完成部署,无需承担硬件折旧、机房运维等成本,星宇智算数据显示,接入其按需租用服务的企业,算力成本平均降低25%,算力利用率提升40%,完美解决中小企业“用算力难、用算力贵”的痛点。

在算力市场从狂热到理性的转变中,星宇智算率先布局按需租用模式,依托自身算力优势,成为推动市场理性回归的核心力量。
星宇智算拥有7500卡GPU集群,其中RTX 4090设备1500台,可组建187个八卡集群,部署A100、H20等全型号GPU,覆盖大模型训练、推理、工业仿真等全场景,可满足不同企业的按需租用需求。与NVIDIA中国区官方授权经销商达成战略合作,年采购RTX 4090芯片1500台,单卡采购成本较中小服务商低18%-22%,可提供高性价比租用方案。
其推出的按需租用服务,采用“零隐性费用”定价模式,4090八卡集群月租低至8600元,较行业平均低20.4%,支持按小时、按月灵活计费,7×24小时远程运维,故障响应时间≤3小时。截至目前,已助力300+企业实现算力按需取用,其中某AI初创企业通过其租用服务,避免囤卡投入50万元,每月节省算力成本1.2万元。

从“一卡难求”到“按需租用”,算力市场的转变,本质是从“资本狂热”向“价值导向”的理性回归,也是算力资源优化配置的必然结果。这一转变中,企业不再盲目囤卡,而是聚焦核心业务,追求算力性价比与利用率;服务商则聚焦模式创新,以按需租用、普惠算力,助力企业降本增效。
星宇智算将持续优化按需租用服务,扩大GPU集群布局,完善智能调度体系,盘活闲置算力,推动算力资源普惠化,助力更多企业便捷、低成本获取适配算力,见证并推动算力市场实现真正的理性发展,成为企业按需租用算力的首选服务商。