两个月前,我们推出了实验性版本 deepseek-v3.2-exp,并收到了大量热心用户提交的对比测试反馈。截至目前,并未发现 v3.2-exp 在任何特定任务场景下显著弱于 v3.1-terminus,这充分验证了 dsa 稀疏注意力机制的技术优势。衷心感谢广大社区用户的积极参与与持续支持,你们的反馈为我们不断突破技术边界提供了宝贵动力。
今日,我们正式发布两款全新模型:
DeepSeek-V3.2 与 DeepSeek-V3.2-Speciale。
官方网页端、移动 App 及 API 接口均已切换至正式版 DeepSeek-V3.2,欢迎广大用户立即体验。而 Speciale 版本目前将以临时 API 形式开放,供研究机构和开发者进行性能评测与学术探索。
新模型的技术白皮书也已同步上线:
https://www.php.cn/link/32a2bacb528ea401c06b17376cad237e

提示:在处理极端复杂问题时,Speciale 明显优于标准版,但其 Token 消耗量更高,运行成本显著上升。当前 Speciale 仅面向科研用途开放,不支持工具调用功能,亦未针对日常对话或内容创作类任务做专项优化。

表1:DeepSeek-V3.2 与其他主流模型在数学、编程及通用领域评测集上的得分对比(括号内为估算总 Token 消耗)

表2:DeepSeek-V3.2 与其他模型在智能体工具调用测评中的得分表现

示例展示通过 LobeChat 调用 DeepSeek-V3.2 的深度思考+工具调用能力,获得更精准详尽的回答结果
HuggingFace 仓库:
https://www.php.cn/link/02b710980274801e7136781fffa997c9
ModelScope 页面:
https://www.php.cn/link/be8e18628d3b1e19f8f9eb2ae7d913ca
HuggingFace 仓库:
https://www.php.cn/link/02b710980274801e7136781fffa997c9-Speciale
ModelScope 页面:
https://www.php.cn/link/be8e18628d3b1e19f8f9eb2ae7d913ca-Speciale
目前,DeepSeek-V3.2 已成为我们主推的正式服务模型,官网网页端、移动端 App 以及 API 接口均已从之前的 DeepSeek-V3.2-Exp 升级为正式版 V3.2,调用方式保持不变。
此外,为支持社区开展评估与研究工作,我们临时部署了 DeepSeek-V3.2-Speciale 的 API 服务。开发者可通过设置以下地址访问该模型:
base_url="https://www.php.cn/link/c652aee4df4084c621a094692ee6f6c9"
该 API 服务价格维持现有标准不变,仅支持思考模式下的对话交互,暂不开放工具调用等功能,最大输出长度默认设为 128K,服务有效期截至北京时间 2025-12-15 23:59。
本次 API 更新重磅引入了 DeepSeek-V3.2 在思考模式下对工具调用的支持。现在,模型可在多轮“思考—调用—再思考”的流程中逐步推进问题求解,最终输出更加完整准确的答案。下图为该模式下的 API 请求流程示意:

DeepSeek-V3.2 的思考模式现已兼容 Claude Code 使用方式,用户可通过将模型名称指定为 deepseek-reasoner,或在 Claude Code CLI 中按 Tab 键激活思考功能。但请注意,当前该模式尚未适配 Cline、RooCode 等采用非标准工具调用协议的组件,建议在使用此类工具时仍选择非思考模式运行。
源码地址:点击下载
以上就是DeepSeek V3.2 正式版:强化 Agent 能力,融入思考推理的详细内容,更多请关注php中文网其它相关文章!
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号