MiniMax M2.5— MiniMax开源的新一代旗舰AI模型

心靈之曲

发布时间：2026-02-14 15:55:29

251人浏览过

来源于php中文网

原创

m2.5 是什么

m2.5 是 minimax 正式发布的参数量约 10b 的轻量化旗舰级大模型，专为编程任务与智能体（agentic）能力深度优化。该模型具备高达 100 tps 的极致推理吞吐能力（约为 claude opus 的 3 倍），全面支持包括 go、rust、kotlin、python、java 等在内的 10 余种主流编程语言，覆盖全栈开发、高阶逻辑推演及企业级系统架构设计。在 swe-bench verified（80.2%）、multi-swe-bench（51.3%）等权威编程评测中刷新 sota 记录，展现出媲美资深架构师的任务分解、路径规划与系统协同能力；其底层采用原生 agent 架构，致力于成为下一代数字化办公的核心智能引擎。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

MiniMax M2.5— MiniMax开源的新一代旗舰AI模型

Modoer多功能点评系统2.5 精华版 Build 20110710 UTF8

Modoer 是一款以本地分享，多功能的点评网站管理系统。采用 PHP+MYSQL 开发设计，开放全部源代码。因具有非凡的访问速度和卓越的负载能力而深受国内外朋友的喜爱，不局限于商铺类点评，真正实现了多类型的点评，可以让您的网站点评任何事与物，同时增加产品模块，也更好的网站产品在网站上展示。Modoer点评系统 2.5 Build 20110710更新列表1.同步旗舰版系统框架2.增加限制图片

下载

M2.5 的核心能力

智能编程：兼容 10+ 编程语言的端到端开发流程，具备系统级建模、模块化设计、自动化测试与代码审查能力，完整覆盖软件生命周期各关键环节。
Agentic 自主执行：依托高效工具调用机制与语义感知搜索能力，以更低 token 开销和更短响应延迟自主完成多步骤复杂任务。
办公智能生成：原生支持 Word、PPT、Excel 等格式的专业内容输出，将行业经验沉淀为可复用、可组合、可迭代的标准化工作流技能。
专家定制化构建：用户可基于自身业务 SOP 和专业能力快速封装专属 Expert，当前平台已沉淀超 10,000 个经验证的领域专家模型。
极致性价比表现：以 100 TPS 持续运行一小时成本仅需 1 美元，首次让高复杂度 Agent 的长期、稳定、规模化部署在商业层面真正可行。

M2.5 的技术实现原理

Forge 原生 Agent 强化学习框架：通过引入抽象中间层，彻底解耦底层训练/推理引擎与上层 Agent 行为逻辑，支持任意第三方 Agent 协议无缝接入与持续优化；结合异步任务调度与树状结构样本合并策略，实现约 40 倍训练效率跃升，并验证模型能力随算力投入与任务规模呈近似线性增长趋势。
Agentic RL 算法与动态奖励机制：延续 CISPO 稳定训练范式保障 MoE 大模型收敛可靠性；创新引入过程导向型奖励函数，有效缓解长上下文中的信用分配难题；同时将真实任务耗时纳入 Reward 函数，实现效果精度与响应速度的协同最优。
推理加速与任务精炼优化：借助强化学习驱动模型主动压缩任务链路、减少冗余 token 使用，并融合原生 100 TPS 推理性能与并行工具调用能力，使 SWE-Bench Verified 平均完成时间较 M2.1 缩短 37%，且保持顶尖准确率。
百万级真实场景 RL 训练：基于超过 20 万个真实运行环境开展强化学习训练，涵盖编码调试、网络检索、文档处理、跨系统协作等高频办公场景；并将公司研发、产品、销售等职能的实际工作流转化为高质量训练信号，显著增强模型在开放环境下的泛化鲁棒性。
面向成本极致优化的 MoE 架构：采用稀疏激活 MoE 设计，在保障高性能的同时大幅降低计算开销；提供 50 TPS 与 100 TPS 双规格推理版本，并集成智能缓存机制，使单位输出成本降至同类模型的 1/10 至 1/20，率先达成复杂 Agent 的经济可持续运行。

M2.5 的实测性能表现

编程能力：SWE-Bench Verified 得分达 80.2%，超越 Claude Opus 4.6；Multi-SWE-Bench 多语言综合得分 51.3%，位居行业首位；VIBE-Pro 内部基准测试结果与 Opus 4.5 持平；跨框架泛化能力突出，在 Droid 测试中通过率达 79.7%，优于 Opus 4.6 的 78.9%；OpenCode 基准得分为 76.1%，同样领先于 Opus 4.6 的 75.9%。
搜索与工具协同：BrowseComp 基准成绩为 76.3%，稳居行业第一梯队；Wide Search 场景下亦表现优异；在 RISE 真实用户交互搜索评估中展现专家级意图理解与结果聚合能力；相较 M2.1，多项任务平均节省约 20% 的搜索轮次，token 利用效率显著提升。
办公场景适配性：在内部 Cowork Agent 综合评估框架 GDPval-MM 中取得 59.0% 的平均胜率；在基于 Excel 实战竞赛的 MEWC 基准以及金融建模专项评估中均达到优秀水平。

MiniMax M2.5— MiniMax开源的新一代旗舰AI模型

M2.5 的官方资源入口

项目官网：https://www.php.cn/link/7736debbc2c6bca58345c22dd791969b

如何接入并使用 M2.5

在线体验：前往 MiniMax Agent 官网即可零门槛体验 M2.5 的多轮对话、代码生成与任务编排能力。
API 集成：开发者可登录 API 开发平台 https://www.php.cn/link/5613a52e81148d177aa26925bc3a5688 注册账号、创建专属 API Key，并快速调用模型服务。