首页 > 新闻 > IT新闻 > 正文

DeepSeek V3.2 正式版:强化 Agent 能力,融入思考推理

碧海醫心
发布: 2025-12-01 21:07:01
原创
112人浏览过

两个月前,我们推出了实验性版本 deepseek-v3.2-exp,并收到了大量热心用户提交的对比测试反馈。截至目前,并未发现 v3.2-exp 在任何特定任务场景下显著弱于 v3.1-terminus,这充分验证了 dsa 稀疏注意力机制的技术优势。衷心感谢广大社区用户的积极参与与持续支持,你们的反馈为我们不断突破技术边界提供了宝贵动力。

今日,我们正式发布两款全新模型:

DeepSeek-V3.2DeepSeek-V3.2-Speciale

官方网页端、移动 App 及 API 接口均已切换至正式版 DeepSeek-V3.2,欢迎广大用户立即体验。而 Speciale 版本目前将以临时 API 形式开放,供研究机构和开发者进行性能评测与学术探索。

新模型的技术白皮书也已同步上线:

https://www.php.cn/link/32a2bacb528ea401c06b17376cad237e

DeepSeek V3.2 正式版:强化 Agent 能力,融入思考推理

推理能力登顶全球前列

  • DeepSeek-V3.2 的设计目标在于实现强大推理能力与高效输出长度之间的最优平衡,适用于日常问答、通用 Agent 任务等广泛场景。在多项公开推理基准测试中,其表现已达 GPT-5 同级水平,仅稍逊于 Gemini-3.0-Pro;相比 Kimi-K2-Thinking 模型,V3.2 显著缩短了输出链长度,在保证准确率的同时大幅降低计算资源消耗与响应延迟。
  • DeepSeek-V3.2-Speciale 则致力于将开源模型的推理极限推向新高度,专注探索模型潜能边界。作为 DeepSeek-V3.2 的长思考增强版本,Speciale 融合了 DeepSeek-Math-V2 的定理证明架构,具备卓越的指令理解、严密数学推导与逻辑验证能力,在主流推理测评中性能比肩 Gemini-3.0-Pro(见表1)。尤为突出的是,该模型已成功取得 IMO 2025(国际数学奥林匹克)、CMO 2025(中国数学奥林匹克)、ICPC World Finals 2025(国际大学生程序设计竞赛总决赛)及 IOI 2025(国际信息学奥林匹克)金牌成绩,其中 ICPC 与 IOI 表现分别达到人类参赛者第二名与第十名的水准。

提示:在处理极端复杂问题时,Speciale 明显优于标准版,但其 Token 消耗量更高,运行成本显著上升。当前 Speciale 仅面向科研用途开放,不支持工具调用功能,亦未针对日常对话或内容创作类任务做专项优化。

DeepSeek V3.2 正式版:强化 Agent 能力,融入思考推理

表1:DeepSeek-V3.2 与其他主流模型在数学、编程及通用领域评测集上的得分对比(括号内为估算总 Token 消耗)

让思考驱动工具使用

  • 有别于此前版本在“思考模式”下无法调用外部工具的限制,DeepSeek-V3.2 成为首个实现深度思考与工具调用深度融合的模型,同时支持在思考与非思考两种模式下调用工具。我们提出一种大规模智能体训练数据生成方法,构建了超过 1800 种复杂环境、涵盖 85,000+ 难解易验任务的强化学习数据集,显著提升了模型在真实场景中的泛化能力。

DeepSeek V3.2 正式版:强化 Agent 能力,融入思考推理

表2:DeepSeek-V3.2 与其他模型在智能体工具调用测评中的得分表现

  • 如表 2 所示,DeepSeek-V3.2 在各类 Agent 测评中创下当前开源模型最佳纪录,极大缩小了与闭源领先模型之间的差距。需要强调的是,V3.2 并未针对这些评测所用的具体工具集进行专门训练,因此我们相信其在实际应用中将展现出更强的适应性和扩展性。

DeepSeek V3.2 正式版:强化 Agent 能力,融入思考推理

示例展示通过 LobeChat 调用 DeepSeek-V3.2 的深度思考+工具调用能力,获得更精准详尽的回答结果

闪念贝壳
闪念贝壳

闪念贝壳是一款AI 驱动的智能语音笔记,随时随地用语音记录你的每一个想法。

闪念贝壳 218
查看详情 闪念贝壳

全面开源

  • DeepSeek-V3.2

HuggingFace 仓库:
https://www.php.cn/link/02b710980274801e7136781fffa997c9

ModelScope 页面:
https://www.php.cn/link/be8e18628d3b1e19f8f9eb2ae7d913ca

  • DeepSeek-V3.2-Speciale

HuggingFace 仓库:
https://www.php.cn/link/02b710980274801e7136781fffa997c9-Speciale

ModelScope 页面:
https://www.php.cn/link/be8e18628d3b1e19f8f9eb2ae7d913ca-Speciale

官网、APP 与 API 全面升级

目前,DeepSeek-V3.2 已成为我们主推的正式服务模型,官网网页端、移动端 App 以及 API 接口均已从之前的 DeepSeek-V3.2-Exp 升级为正式版 V3.2,调用方式保持不变。

此外,为支持社区开展评估与研究工作,我们临时部署了 DeepSeek-V3.2-Speciale 的 API 服务。开发者可通过设置以下地址访问该模型:

base_url="https://www.php.cn/link/c652aee4df4084c621a094692ee6f6c9"

该 API 服务价格维持现有标准不变,仅支持思考模式下的对话交互,暂不开放工具调用等功能,最大输出长度默认设为 128K,服务有效期截至北京时间 2025-12-15 23:59。

支持思考模式下的工具调用

本次 API 更新重磅引入了 DeepSeek-V3.2 在思考模式下对工具调用的支持。现在,模型可在多轮“思考—调用—再思考”的流程中逐步推进问题求解,最终输出更加完整准确的答案。下图为该模式下的 API 请求流程示意:

DeepSeek V3.2 正式版:强化 Agent 能力,融入思考推理

  • 在回答问题 1 的过程中(请求 1.1 至 1.3),模型经历了多次内部推理并触发工具调用后才返回最终答案。此过程要求用户将上一轮的思维链内容(reasoning_content)回传给 API,以便模型继续后续推理。
  • 当开启新的用户提问(请求 2.1)时,需清除之前的思维链记录,仅保留其余上下文发送请求。
  • 更详细的接入指南请参阅官方文档:
    https://www.php.cn/link/2706d952855897483572487456d4498d

DeepSeek-V3.2 的思考模式现已兼容 Claude Code 使用方式,用户可通过将模型名称指定为 deepseek-reasoner,或在 Claude Code CLI 中按 Tab 键激活思考功能。但请注意,当前该模式尚未适配 Cline、RooCode 等采用非标准工具调用协议的组件,建议在使用此类工具时仍选择非思考模式运行。

源码地址:点击下载

以上就是DeepSeek V3.2 正式版:强化 Agent 能力,融入思考推理的详细内容,更多请关注php中文网其它相关文章!

AI工具
AI工具

AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型,支持联网搜索。

下载
来源:php中文网
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
最新问题
开源免费商场系统广告
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新 English
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送
PHP中文网APP
随时随地碎片化学习

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号