DeepSeek联合北大发布DSpark框架：大模型推理速度提升60%–85%6

DeepSeek联合北大发布DSpark框架：大模型推理速度提升60%–85%

6月27日，DeepSeek团队联合北京大学发布《DSpark》研究论文，提出一种基于speculative decoding方向的大模型推理加速新方法。针对现有并行“草稿生成”方式因token间关联不足导致拒绝比例上升及验证算力浪费的问题，DSpark引入半自回归结构，在并行生成骨干上加入轻量级顺序模块以增强token依赖关系并提高草稿质量。同时，该方法提出“基于置信度的动态验证机制”，根据不同请求的成功概率与系统负载自适应调整验证长度，从而减少无效计算开销。离线测试显示该方法显著提升了可接受生成长度，在DeepSeek-V4线上系统中，相比基线模型推理速度提升约60%–85%，有效降低高并发下的吞吐损耗。

DC娱乐网

DeepSeek联合北大发布DSpark框架：大模型推理速度提升60%–85%6

热门分类