DeepSeek最近开始融资,估值从100亿涨到200多亿美元,阿里和腾讯都派人去谈合作,但具体条款还没敲定,这轮融资关系到中国大模型公司能不能生存下去,比起已经上市的智谱AI和Minimax,DeepSeek现在的价格便宜不少,市场认可它的技术实力和低成本优势,只是还没有完全体现出来。
他们缺钱,主要是因为三件事压得喘不过气来,第一是算力太烧钱,一个千亿参数模型跑一次就要上千万美元,以前靠幻方量化输血,现在撑不住了,第二是人留不住,2025年下半年起,好几个核心研究员跳槽去了海外或者国内云厂商,不发股权激励,人真要跑光,第三是想上市,得讲好故事,大家盯着V4版本,虽然没官宣,但消息说已经适配了华为昇腾910B芯片,可能今年二季度就推出来,重点是跑得更快、更容易装进本地系统。
黄仁勋在三月说过一句实在话,DeepSeek和华为合作,是国内最有可能突破美国技术垄断的组合,这不是打广告,而是基于技术的判断,他们的MoE架构用同样的算力能比别人快三成,开源模型的下载量在全球排第二,只比Meta的Llama少一点,这说明他们底子确实扎实,不是靠吹出来的。
消息一出,相关股票跟着上涨,做昇腾芯片的公司、光模块的厂商、液冷数据中心的企业,股价一个月里涨了12%到18%,但别太兴奋,很多人把V4和国产替代联系得太紧,忽略了两个关键问题,高质量中文数据仍然不够用,出海还要面对合规挑战,更现实的是,DeepSeek现在没有云服务,也没有API,还没发展出规模化的企业客户,赚钱的路子还没走通,这点没人仔细讨论,但很重要。
现在AI这个圈子里面,大家不比谁家模型参数多,比的是谁能把模型用起来,还能用得省,DeepSeek走这条路对不对,过半年就能看出来。
