Step 3.5 Flash— 阶跃星辰最新开源的基座模型

霞舞

发布时间：2026-02-03 11:38:10

882人浏览过

来源于php中文网

原创

Step 3.5 Flash是什么

step 3.5 flash 是阶跃星辰最新发布的开源基础大模型，专为 agent 场景深度优化。该模型采用稀疏混合专家（moe）架构，总参数量达 1960 亿，但每 token 仅激活约 110 亿参数，在保持强大性能的同时显著提升推理效率。其推理吞吐高达 350 tps，原生支持 256k 超长上下文，在数学推演、代码生成（swe-bench verified 74.4%）及复杂 agent 任务上表现媲美主流闭源旗舰模型。step 3.5 flash 已全面开源，并兼容 vllm、sglang、llama.cpp 等主流推理框架，可在 mac studio m4 max、nvidia dgx spark 等消费级硬件上本地运行，兼顾数据安全与计算效能。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

Step 3.5 Flash— 阶跃星辰最新开源的基座模型

Bg Eraser

图片物体抹除和清理

下载

Step 3.5 Flash的核心能力

极致推理速度：依托 MTP-3 多 Token 预测技术，实现最高 350 TPS 的文本生成速率，保障多步复杂推理的毫秒级响应。
强 Agent 原生性：面向智能体任务定制训练，在 SWE-bench Verified 基准中达成 74.4% 准确率，可稳定执行跨步骤、跨工具、长依赖的任务链。
超长上下文处理：支持 256K tokens 上下文窗口，融合滑动窗口与全局注意力的混合机制，大幅压缩长文本推理的计算开销。
轻量化本地部署：针对终端设备深度适配，Mac Studio M4 Max、NVIDIA DGX Spark 等平台均可流畅加载并高效运行。
专业级代码理解与生成：具备高精度编程能力，支持自动工具调用、结构化输出与上下文感知的代码补全与重构。

Step 3.5 Flash的技术亮点

细粒度稀疏 MoE 架构：基于 45 层 Transformer 主干，每层集成 288 个可路由专家 + 1 个共享专家；推理时动态激活 Top-8 专家，单 token 实际参与计算的参数约 110 亿，以小成本释放 1960 亿参数模型的全部潜力。
MTP-3 多 Token 并行预测：引入专用预测头，结合滑动窗口注意力与密集前馈网络，单次前向即可同步产出 4 个 token，典型场景下生成速度达 100–300 tok/s，峰值突破 350 tok/s，显著缩短端到端延迟。
3:1 混合注意力设计：交替堆叠滑动窗口注意力层（聚焦局部语义）与全局注意力层（建模远距离关联），在 256K 长文本场景下实现计算复杂度可控与建模能力不妥协的双重目标。
全栈推理加速方案：支持专家并行（EP8）与张量并行（TP8）协同部署，叠加 FP8 低精度量化策略降低显存带宽压力；进一步融合投机解码与 MTP-3 技术，在 Hopper 架构 GPU 上达成高吞吐、低延迟的服务化落地。

Step 3.5 Flash的官方资源

GitHub 项目主页：https://www.php.cn/link/7db18f538959df68c644ed49564833a3
Hugging Face 模型页：https://www.php.cn/link/063eb8aa17714d0c60ef8b2d1e03cdf7

Step 3.5 Flash的典型应用

AI 编程助手底座：作为 Claude Code、Codex 类产品的核心引擎，提供代码生成、缺陷定位、单元测试生成、工程级重构等能力，在 SWE-bench Verified 测试中通过率达 74.4%。
自主决策智能体：适用于科研辅助分析、动态网页抓取与解析、多源异构数据交叉验证等需多跳推理与工具协同的 Agent 场景。
低延迟人机交互系统：凭借 100–350 TPS 的实时生成能力，支撑高并发聊天机器人、个性化学习辅导、多轮智能客服等对响应速度敏感的应用。
大规模文档智能解析：胜任学术论文精读、法律合同条款比对、百万行级代码库语义理解等任务，快速提取关键信息并完成结构化整合。
隐私优先的端侧 AI 计算：支持在 Mac Studio M4 Max、NVIDIA DGX Spark 等本地设备一键部署，满足金融风控、临床辅助、企业内网办公等高敏场景的数据不出域需求。

ComfyUI如何安装Manager插件？一键管理节点与模型库【安装包】

Stable Diffusion安装教程：本地部署完整步骤详解

AI一键生成API文档程序员必备的AI文档工具

百度AI助手如何总结年度团队协作成果_百度AI助手结协作法【团结】

Claude怎么用_Claude使用方法详细指南【教程】

相关标签:

git github 工具 mac nvidia 栈 ai 路由金融 claude 大模型本地部署 Agent智能体 AI编程开发 AI大模型

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：腾讯元宝怎么登录腾讯元宝官方入口网址大全下一篇：腾讯智乐ai音乐情感表达准吗_腾讯智乐情感调控法【教程】

作者最新文章

《如龙极3》试玩玩家反应画质问题官方回应是BUG补丁修复

2026-01-31 13:57

如何在 PHP 中动态累加数组中查询返回的数值

2026-01-31 14:03

如何在 Go 运行时动态覆盖命令行 flag 值

2026-01-31 14:09

如何在 Handlebars 中通过 #each 同时遍历多个数组并渲染表格？

2026-01-31 14:36

TypeORM 迁移生成失败的常见原因与解决方案

2026-01-31 14:40

《胜利女神》官宣神秘新联动！《寂静岭f》还是《莉可丽丝》？

2026-01-31 14:54

Thymeleaf 邮件模板中正确渲染 HTML 内容的完整实践指南

2026-01-31 14:55

品牌建设提示词大全

2026-01-31 15:27

N×N 矩阵顺时针旋转 90 度（支持多次旋转）的 Python 实现

2026-01-31 15:29

市场调研提示词大全

2026-01-31 15:34

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI 编程开发 AI 聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI 编程开发 AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI 编程开发 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 AI 聊天问答

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI 编程开发 AI 文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI 文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI 编程开发 AI 文本写作

智谱清言 - 免费全能的AI助手

AI 编程开发 Agent智能体

相关专题

c语言中/相关合集

本专题整合了c语言中/的用法、含义解释。阅读专题下面的文章了解更多详细内容。

2026.02.03

漫蛙漫画网页版入口与正版在线阅读漫蛙MANWA官网访问专题

本专题围绕漫蛙漫画（Manwa / Manwa2）官网网页版入口进行整理，涵盖漫蛙漫画官方主页访问方式、网页版在线阅读入口、台版正版漫画浏览说明及基础使用指引，帮助用户快速进入漫蛙漫画官网，稳定在线阅读正版漫画内容，避免误入非官方页面。

2026.02.03

Yandex官网入口与俄罗斯搜索引擎访问指南 Yandex中文登录与网页版入口

本专题汇总了俄罗斯知名搜索引擎 Yandex 的官网入口、免登录访问地址、中文登录方法与网页版使用指南，帮助用户稳定访问 Yandex 官网，并提供一站式入口汇总。无论是登录入口还是在线搜索，用户都能快速获取最新稳定的访问链接与使用指南。

2026.02.03

Java 设计模式与重构实践

本专题专注讲解 Java 中常用的设计模式，包括单例模式、工厂模式、观察者模式、策略模式等，并结合代码重构实践，帮助学习者掌握如何运用设计模式优化代码结构，提高代码的可读性、可维护性和扩展性。通过具体示例，展示设计模式如何解决实际开发中的复杂问题。

2026.02.03

C# 并发与异步编程

本专题系统讲解 C# 异步编程与并发控制，重点介绍 async 和 await 关键字、Task 类、线程池管理、并发数据结构、死锁与线程安全问题。通过多个实战项目，帮助学习者掌握如何在 C# 中编写高效的异步代码，提升应用的并发性能与响应速度。

2026.02.03

Python 强化学习与深度Q网络（DQN）

本专题深入讲解 Python 在强化学习（Reinforcement Learning）中的应用，重点介绍深度Q网络（DQN）及其实现方法，涵盖 Q-learning 算法、深度学习与神经网络的结合、环境模拟与奖励机制设计、探索与利用的平衡等。通过构建一个简单的游戏AI，帮助学习者掌握如何使用 Python 训练智能体在动态环境中作出决策。

2026.02.03