DC娱乐网

DeepSeekV4发布 DeepSeek V4 正式发布,同步开源,分成两个版

DeepSeekV4发布

DeepSeek V4 正式发布,同步开源,分成两个版本:

DeepSeek-V4-Pro:1.6T参数,激活49B。Agentic Coding评测达到开源最佳,交付质量接近 Opus 4.6;数学、STEM及竞赛代码超越所有公开评测的开源模型。

DeepSeek-V4-Flash:284B参数,激活13B。主打极致性价比,简单任务推理与Agent表现和Pro版旗鼓相当。

两个版本都支持1M上下文窗口和最大384K输出长度。1M上下文,一百万字,成为DeepSeek所有服务的标配。

结构上最大的创新是DSA稀疏注意力机制——通过Token维度压缩,大幅降低超长上下文对计算量和显存的需求。这解决的是长文本处理成本高的行业痛点,不只是性能参数的堆叠。

就在V4发布的同时,媒体曝出DeepSeek首次开启对外融资,目标估值超200亿美元。腾讯和阿里都在接洽。

有意思的是,DeepSeek此前一直靠创始人梁文锋的量化交易公司资金支撑,没有外部融资。这次融资的核心目的不是缺钱,而是留人——核心团队成员近期被字节和腾讯挖角,公司需要通过推高估值来放大员工期权的吸引力。

一边发模型,一边融钱,一边打人才保卫战。三条线同时进行,节奏非常快。