DC娱乐网

国产高端网络跃龙门,万卡集群“传送带”通了 工信部此前印发的《算力互联互通行动

国产高端网络跃龙门,万卡集群“传送带”通了 工信部此前印发的《算力互联互通行动计划》明确提出,要加快构建算力互联互通体系,提高公共算力资源使用效率。与此同时,“155”规划也将新型基础设施列入国家重点推进方向,明确构建全国一体化算力网。 这一系列政策部署背后,是一个关键判断:当算力规模快速扩张之后,算力之间如何“连起来、通起来”,正成为决定算力体系整体效能的核心命题。而高速网络,正是打通这一关节的“基础设施的基础设施”。 如果说过去两年产业界更多关注GPU芯片的算力密度,那么今天,聚光灯正在转向另一个维度——当大模型训练进入万卡乃至十万卡集群时代,数千张计算卡需要协同工作数月,芯片间的数据交换量呈指数级增长。网络时延、带宽利用率和故障恢复能力,直接转化为大模型的训练成本和周期。业内普遍认为,在超大规模集群中,网络性能已成为算力释放的“天花板”。 过去很长一段时间,这条决定天花板的“算力传送带”,恰恰是中国智算体系中相对薄弱的环节。尤其是在InfiniBand等原生高性能网络领域,长期由国外厂商主导,国产方案在大规模组网、极端负载下的稳定性和成本控制方面,始终面临不小压力。 这一局面正在发生变化。近期,国产高性能网络领域取得实质性突破。以中科曙光推出的国产InfiniBand架构高速网络为例,其从底层芯片到上层软件实现全栈自研,并在国家超算互联网核心节点支撑3套万卡集群同步运行,近万卡规模持续稳定运行超过10个月,可用性达99.99%。至此,国产高速网络产品真正经受住了大规模商业场景的真实检验。 从产业视角看,它直接回应了两个层面的需求:一是为智算中心、超算中心等高端场景提供了经过验证的国产化选择,有效降低了对进口方案的依赖和成本压力;二是为构建全国一体化算力网提供了关键的技术支撑——当底层互联通道实现自主可控,算力资源才可能在更大范围内被高效组织和调度。 从“有车无路”到“路网贯通”,国产高端网络的这次跨越,或许正是中国AI算力体系从单点能力走向系统竞争力的一个注脚。