美国人工智能初创企业 arcee ai 近日发布了全新的开放权重模型系列 trinity,涵盖已上线的 trinity nano 与 trinity mini,以及预计于 2026 年 1 月发布的 trinity large。
该系列模型从数据采集、架构设计到训练流程均实现全栈自研,官方强调其“在美国完成端到端训练”,具备开放权重、强大推理性能及对开发者的全面控制能力。
Trinity 系列采用先进的多专家混合架构(afmoe),每层集成 128 个专家模块,每个 token 动态激活 8 个专家,并额外配备共享专家以增强泛化能力。训练基于超过 10T tokens 的高质量数据,并融合了 grouped-query attention、gated attention 及长上下文支持等关键技术,显著提升模型稳定性与推理效率。
https://www.php.cn/link/f5685cb5d80c3249a9770cfd98cf71eb



Arcee AI 指出,当前多数所谓“开源”模型依赖第三方基础模型进行微调,存在能力瓶颈、数据不透明及合规风险等问题。Trinity 系列坚持从零开始自主预训练,旨在打造可长期演进、支持企业在私有环境中持续训练与迭代的可信 AI 基础设施。
公司还确认,Trinity Large 正在训练中,总参数量约 420B(激活参数约 13B),依托 2048 张 B300 GPU 构建的高性能集群,训练数据扩展至 20T tokens。完整技术白皮书将于 2026 年 1 月随模型发布时公开。
源码下载地址:点击获取
以上就是美国初创公司 Arcee AI 发布开源 MoE 模型 Trinity的详细内容,更多请关注php中文网其它相关文章!
每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号