这两年看AI基础设施,很多人盯着芯片和服务器,但真正决定大集群能不能跑起来的,往往是网络。
中科曙光近期把scaleFabric放到万卡集群叙事里,我觉得是个值得关注的信号。因为大模型训练进入万卡、十万卡阶段后,网络不再是配套件,而是算力系统的“交易高速路”。卡越多,数据交换越密集,网络一堵,算力利用率就会掉。
从财经角度看,scaleFabric的意义不只是国产替代,而是曙光试图把“服务器+网络+集群+平台”做成一套系统生意。这样公司的价值,就不只是卖硬件,而是参与AI基础设施整体建设。
我看好曙光,核心看三点:万卡集群交付能不能持续,scaleFabric能不能在更多客户场景复制,以及国产高速互联能不能真正形成生态。
中科曙光 scaleFabric AI基础设施 万卡集群
