Day0适配+性能反超H20?海光这波操作,给国产AI生态狠狠上了一课
今天刷到海光信息和智源研究院联手,在面壁智能发布MiniCPM5-1B的当天就完成了Day0全量适配,这事儿比模型本身更值得细品。以前我们总盯着芯片制程看,觉得硬件是硬道理,但这次合作证明,软件栈的打通才是国产算力爆发的“胜负手”。
依托众智FlagOS这个统一系统软件栈,海光DCU不仅实现了对端侧小模型的快速支持,更关键的是TTFT(首Token延迟)全面低于NVIDIA H20原生基线。这意味着什么?意味着我们不再需要为了跑通某个新模型去等厂商漫长的底层优化,FlagOS把过去数周的适配周期压缩到了“发布即支持”的程度。从之前DeepSeek V4的云端大模型,到如今MiniCPM5的端侧轻量化模型,海光这套“CPU+DCU”双芯底座正在形成闭环。这种“一次开发、跨芯运行”的能力,才是打破生态壁垒、让国产AI真正落地的核心底气。
海光信息 国产算力 智源研究院 人工智能
