DeepSeek联合北京大学发布论文昨日,DeepSeek官方在Github低调发表了一篇最新论文,介绍其推理加速框架DSpark,试图解决大语言模型在高并发场景下的推理效率瓶颈。
从作者署名来看,这篇论文由DeepSeek与北京大学联合发布,值得注意的是,DeepSeek创始人梁文锋也位列作者名单。在论文中,团队开源了DSpark模型权重,并同步发布了面向推测解码、由算法驱动的训练代码仓库DeepSpec。

DeepSeek联合北京大学发布论文昨日,DeepSeek官方在Github低调发表了一篇最新论文,介绍其推理加速框架DSpark,试图解决大语言模型在高并发场景下的推理效率瓶颈。
从作者署名来看,这篇论文由DeepSeek与北京大学联合发布,值得注意的是,DeepSeek创始人梁文锋也位列作者名单。在论文中,团队开源了DSpark模型权重,并同步发布了面向推测解码、由算法驱动的训练代码仓库DeepSpec。
