DeepSeek V3.2 正式版：强化 Agent 能力，融入思考推理

碧海醫心

发布： 2025-12-01 21:07:01

原创

112人浏览过

两个月前，我们推出了实验性版本 deepseek-v3.2-exp，并收到了大量热心用户提交的对比测试反馈。截至目前，并未发现 v3.2-exp 在任何特定任务场景下显著弱于 v3.1-terminus，这充分验证了 dsa 稀疏注意力机制的技术优势。衷心感谢广大社区用户的积极参与与持续支持，你们的反馈为我们不断突破技术边界提供了宝贵动力。

今日，我们正式发布两款全新模型：

DeepSeek-V3.2 与 DeepSeek-V3.2-Speciale。

官方网页端、移动 App 及 API 接口均已切换至正式版 DeepSeek-V3.2，欢迎广大用户立即体验。而 Speciale 版本目前将以临时 API 形式开放，供研究机构和开发者进行性能评测与学术探索。

新模型的技术白皮书也已同步上线：

https://www.php.cn/link/32a2bacb528ea401c06b17376cad237e

DeepSeek V3.2 正式版：强化 Agent 能力，融入思考推理

推理能力登顶全球前列

DeepSeek-V3.2 的设计目标在于实现强大推理能力与高效输出长度之间的最优平衡，适用于日常问答、通用 Agent 任务等广泛场景。在多项公开推理基准测试中，其表现已达 GPT-5 同级水平，仅稍逊于 Gemini-3.0-Pro；相比 Kimi-K2-Thinking 模型，V3.2 显著缩短了输出链长度，在保证准确率的同时大幅降低计算资源消耗与响应延迟。
DeepSeek-V3.2-Speciale 则致力于将开源模型的推理极限推向新高度，专注探索模型潜能边界。作为 DeepSeek-V3.2 的长思考增强版本，Speciale 融合了 DeepSeek-Math-V2 的定理证明架构，具备卓越的指令理解、严密数学推导与逻辑验证能力，在主流推理测评中性能比肩 Gemini-3.0-Pro（见表1）。尤为突出的是，该模型已成功取得 IMO 2025（国际数学奥林匹克）、CMO 2025（中国数学奥林匹克）、ICPC World Finals 2025（国际大学生程序设计竞赛总决赛）及 IOI 2025（国际信息学奥林匹克）金牌成绩，其中 ICPC 与 IOI 表现分别达到人类参赛者第二名与第十名的水准。

提示：在处理极端复杂问题时，Speciale 明显优于标准版，但其 Token 消耗量更高，运行成本显著上升。当前 Speciale 仅面向科研用途开放，不支持工具调用功能，亦未针对日常对话或内容创作类任务做专项优化。

DeepSeek V3.2 正式版：强化 Agent 能力，融入思考推理

表1：DeepSeek-V3.2 与其他主流模型在数学、编程及通用领域评测集上的得分对比（括号内为估算总 Token 消耗）

让思考驱动工具使用

有别于此前版本在“思考模式”下无法调用外部工具的限制，DeepSeek-V3.2 成为首个实现深度思考与工具调用深度融合的模型，同时支持在思考与非思考两种模式下调用工具。我们提出一种大规模智能体训练数据生成方法，构建了超过 1800 种复杂环境、涵盖 85,000+ 难解易验任务的强化学习数据集，显著提升了模型在真实场景中的泛化能力。

DeepSeek V3.2 正式版：强化 Agent 能力，融入思考推理

表2：DeepSeek-V3.2 与其他模型在智能体工具调用测评中的得分表现

如表 2 所示，DeepSeek-V3.2 在各类 Agent 测评中创下当前开源模型最佳纪录，极大缩小了与闭源领先模型之间的差距。需要强调的是，V3.2 并未针对这些评测所用的具体工具集进行专门训练，因此我们相信其在实际应用中将展现出更强的适应性和扩展性。

DeepSeek V3.2 正式版：强化 Agent 能力，融入思考推理

示例展示通过 LobeChat 调用 DeepSeek-V3.2 的深度思考+工具调用能力，获得更精准详尽的回答结果

闪念贝壳

闪念贝壳是一款AI 驱动的智能语音笔记，随时随地用语音记录你的每一个想法。

218

查看详情

全面开源

DeepSeek-V3.2

HuggingFace 仓库：
https://www.php.cn/link/02b710980274801e7136781fffa997c9

ModelScope 页面：
https://www.php.cn/link/be8e18628d3b1e19f8f9eb2ae7d913ca

DeepSeek-V3.2-Speciale

HuggingFace 仓库：
https://www.php.cn/link/02b710980274801e7136781fffa997c9-Speciale

ModelScope 页面：
https://www.php.cn/link/be8e18628d3b1e19f8f9eb2ae7d913ca-Speciale

官网、APP 与 API 全面升级

目前，DeepSeek-V3.2 已成为我们主推的正式服务模型，官网网页端、移动端 App 以及 API 接口均已从之前的 DeepSeek-V3.2-Exp 升级为正式版 V3.2，调用方式保持不变。

此外，为支持社区开展评估与研究工作，我们临时部署了 DeepSeek-V3.2-Speciale 的 API 服务。开发者可通过设置以下地址访问该模型：

base_url="https://www.php.cn/link/c652aee4df4084c621a094692ee6f6c9"

该 API 服务价格维持现有标准不变，仅支持思考模式下的对话交互，暂不开放工具调用等功能，最大输出长度默认设为 128K，服务有效期截至北京时间 2025-12-15 23:59。

支持思考模式下的工具调用

本次 API 更新重磅引入了 DeepSeek-V3.2 在思考模式下对工具调用的支持。现在，模型可在多轮“思考—调用—再思考”的流程中逐步推进问题求解，最终输出更加完整准确的答案。下图为该模式下的 API 请求流程示意：

DeepSeek V3.2 正式版：强化 Agent 能力，融入思考推理

在回答问题 1 的过程中（请求 1.1 至 1.3），模型经历了多次内部推理并触发工具调用后才返回最终答案。此过程要求用户将上一轮的思维链内容（reasoning_content）回传给 API，以便模型继续后续推理。
当开启新的用户提问（请求 2.1）时，需清除之前的思维链记录，仅保留其余上下文发送请求。
更详细的接入指南请参阅官方文档：
https://www.php.cn/link/2706d952855897483572487456d4498d

DeepSeek-V3.2 的思考模式现已兼容 Claude Code 使用方式，用户可通过将模型名称指定为 deepseek-reasoner，或在 Claude Code CLI 中按 Tab 键激活思考功能。但请注意，当前该模式尚未适配 Cline、RooCode 等采用非标准工具调用协议的组件，建议在使用此类工具时仍选择非思考模式运行。

源码地址：点击下载

以上就是DeepSeek V3.2 正式版：强化 Agent 能力，融入思考推理的详细内容，更多请关注php中文网其它相关文章！