钛媒体App 6月27日消息,DeepSeek联合北京大学正式发布DSpark推理加速框架,旨在解决大语言模型在高并发生产环境中的推理效率瓶颈。该框架已部署于DeepSeek-V4-Flash与DeepSeek-V4-Pro的预览版服务引擎中,相比此前生产环境采用的单token推测解码基线MTP-1,在同等吞吐量水平下可将单用户生成速度提升60%至85%。相关论文、训练代码及模型检查点已在GitHub平台DeepSpec项目中开源。
上一篇:阿里千问输入法上线macOS版:最快300字/分,AI自动润色
下一篇:MWC26上海观察:AI重构后,网络如何兑现Token价值