DeepSeek-V4发布,带来不少技术创新。它有两个版本,DeepSeek-V4-Pro是性能怪兽,1.6T总参数、49B激活参数;DeepSeek-V4-Flash专为高效经济设计,284B总参数、13B激活参数。
技术上,DSA稀疏注意力机制是核心创新,解决了传统注意力机制长上下文计算成本高的问题。V4-Pro支持1M上下文,是主流模型中最长之一,性价比最优。
在能力上,V4-Pro Agent能力跨越式突破,编码体验超Sonnet 4.5,交付质量追Opus 4.6,成公司内部Agent编程首选。还具备深厚世界知识储备,在知识测评表现出色。