【DeepSeek上新:开源发布DeepSeek-Prover-V2-671B新

科学制造的力量 2025-05-01 17:57:41

【DeepSeek上新:开源发布DeepSeek-Prover-V2-671B新模型】5月1日消息,DeepSeek今日于AI开源社区Hugging Face上发布了一个名为DeepSeek-Prover-V2-671B的新模型。

在模型架构上,该模型使用了DeepSeek-V3架构,采用MoE(混合专家)模式,具有61层Transformer层,7168维隐藏层。

同时支持超长上下文,最大位置嵌入达163840,使其能处理复杂的数学证明,并且采用了FP8量化,可通过量化技术减小模型大小,提高推理效率。

有网友分析,该模型被视为 Prover-V1.5的升级版,专注于形式化定理证明,专门用于攻克数学难题,擅长自动证明定理和复杂计算,类似于 AlphaGo 在围棋中的自我对弈方式。

0 阅读:17
科学制造的力量

科学制造的力量

感谢大家的关注