#DeepSeekV4掀了美国AI牌桌#【#中美大模型性能基本实现技术追平#】这几天,全球AI圈“卷”疯了。
Anthropic的Claude Mythos被评价为将网络攻击带入“工业化”时代,OpenAI的GPT-Image-2画得真假难辨,让人直呼“有图有真相”一去不返。
百花齐放中,DeepSeek V4预览版也揭开面纱。尽管此番重磅发布,看着似乎不如2025年初那般“炸裂”,但一些深层次的改变正在悄然发生。
去年至今,很多人时不时就会问,DeepSeek在忙什么?
在热得发烫的AI赛道上,DeepSeek似乎显得有些另类。沉默、低调,不怎么营销,也没那么多新“花活儿”。这次交卷,“话也不多”,不过答案依然可圈可点。据报道,DeepSeek V4预览版数学推理能力、代码输出能力等均得到增强,多模态短板得以补齐,特别是上下文窗口百万词元起步,颇为惊艳。
“百万词元”是什么概念?《三体》三部曲加起来近百万字,它几秒钟就能读完,一整本《红楼梦》扔进去,它能迅速找出关键信息、总结核心内容。如此强大,主要得益于三大技术突破——混合注意力架构、流形约束超连接与Muon优化器。
简单打个比方,以前AI要在1000页里寻找某个关键信息,通常是把目标页和其他999页逐一比对,工作量可想而知。但V4的解法是,先粗略判断哪些页面可能相关,再把相关页面压缩成摘要。这样一来,效率和成本都得到极大优化。
能力对标顶级AI,使用成本却依然亲民。据悉,V4-Flash版本每处理100万Token的输入内容只收1元,输出100万Token只收2元,价格仅是OpenAI同级别模型的1%。这意味着,大众使用门槛极大降低,那些原本只有付费玩家才能支付的AI复杂功能,普通人也能轻松体验。有人总结道,这是掀了“模型性能桌”“美国AI牌桌”。(评论员 田闻之) 掀了美国AI牌桌?中国“军团”要赢的是明天