快科技 8 月 21 日消息,就在刚刚在线配资平台注册,深度求索宣布 DeepSeek-V3.1 正式发布。经查,目前新版模型已经默认同步上线官网、App,面向 C 端用户完全免费。
据介绍,DeepSeek-V3.1 具备 128K 超长上下文处理能力,支持混合推理架构(一个模型同时支持思考模式与非思考模式)。
此外,新版模型拥有更高的思考效率,相比 R1 能在更短时间内给出答案。
不仅如此,DeepSeek-V3.1 拥有更强的 Agent(智能体)能力,通过 Post-Training(后训练)优化,新模型在工具使用与智能体任务中的表现有较大提升。
比如,在代码修复测评 SWE 与命令行终端环境下的复杂任务(Terminal-Bench)测试中,以及在需要多步推理的复杂搜索测试(browsecomp)与多学科专家级难题测试(HLE)上,DeepSeek-V3.1 均大幅领先 DeepSeek-R1-0528。
另外,DeepSeek-V3.1 思考效率提升有了巨幅提升。经过思维链压缩训练后,V3.1-Think 在输出 token 数减少 20%-50% 的情况下,各项任务的平均表现与 R1-0528 持平。
对于 DeepSeek R2 发布延迟的原因,DeepSeek 总结称,主要由于采用国产昇腾芯片进行训练时遇到技术挑战,以及公司对模型质量的高标准要求。虽然之前有 8 月发布的传闻,但已被官方否认。目前看来,我们可能需要再等待几周的时间,但具体日期还需以官方消息为准。
航心配资提示:文章来自网络,不代表本站观点。