0

0

Step 3.5 Flash— 阶跃星辰最新开源的基座模型

霞舞

霞舞

发布时间:2026-02-03 11:38:10

|

882人浏览过

|

来源于php中文网

原创

Step 3.5 Flash是什么

step 3.5 flash 是阶跃星辰最新发布的开源基础大模型,专为 agent 场景深度优化。该模型采用稀疏混合专家(moe)架构,总参数量达 1960 亿,但每 token 仅激活约 110 亿参数,在保持强大性能的同时显著提升推理效率。其推理吞吐高达 350 tps,原生支持 256k 超长上下文,在数学推演、代码生成(swe-bench verified 74.4%)及复杂 agent 任务上表现媲美主流闭源旗舰模型。step 3.5 flash 已全面开源,并兼容 vllm、sglang、llama.cpp 等主流推理框架,可在 mac studio m4 max、nvidia dgx spark 等消费级硬件上本地运行,兼顾数据安全与计算效能。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

Step 3.5 Flash— 阶跃星辰最新开源的基座模型

Bg Eraser
Bg Eraser

图片物体抹除和清理

下载

Step 3.5 Flash的核心能力

  • 极致推理速度:依托 MTP-3 多 Token 预测技术,实现最高 350 TPS 的文本生成速率,保障多步复杂推理的毫秒级响应。
  • 强 Agent 原生性:面向智能体任务定制训练,在 SWE-bench Verified 基准中达成 74.4% 准确率,可稳定执行跨步骤、跨工具、长依赖的任务链。
  • 超长上下文处理:支持 256K tokens 上下文窗口,融合滑动窗口与全局注意力的混合机制,大幅压缩长文本推理的计算开销。
  • 轻量化本地部署:针对终端设备深度适配,Mac Studio M4 Max、NVIDIA DGX Spark 等平台均可流畅加载并高效运行。
  • 专业级代码理解与生成:具备高精度编程能力,支持自动工具调用、结构化输出与上下文感知的代码补全与重构。

Step 3.5 Flash的技术亮点

  • 细粒度稀疏 MoE 架构:基于 45 层 Transformer 主干,每层集成 288 个可路由专家 + 1 个共享专家;推理时动态激活 Top-8 专家,单 token 实际参与计算的参数约 110 亿,以小成本释放 1960 亿参数模型的全部潜力。
  • MTP-3 多 Token 并行预测:引入专用预测头,结合滑动窗口注意力与密集前馈网络,单次前向即可同步产出 4 个 token,典型场景下生成速度达 100–300 tok/s,峰值突破 350 tok/s,显著缩短端到端延迟。
  • 3:1 混合注意力设计:交替堆叠滑动窗口注意力层(聚焦局部语义)与全局注意力层(建模远距离关联),在 256K 长文本场景下实现计算复杂度可控与建模能力不妥协的双重目标。
  • 推理加速方案:支持专家并行(EP8)与张量并行(TP8)协同部署,叠加 FP8 低精度量化策略降低显存带宽压力;进一步融合投机解码与 MTP-3 技术,在 Hopper 架构 GPU 上达成高吞吐、低延迟的服务化落地。

Step 3.5 Flash的官方资源

Step 3.5 Flash的典型应用

  • AI 编程助手底座:作为 Claude Code、Codex 类产品的核心引擎,提供代码生成、缺陷定位、单元测试生成、工程级重构等能力,在 SWE-bench Verified 测试中通过率达 74.4%。
  • 自主决策智能体:适用于科研辅助分析、动态网页抓取与解析、多源异构数据交叉验证等需多跳推理与工具协同的 Agent 场景。
  • 低延迟人机交互系统:凭借 100–350 TPS 的实时生成能力,支撑高并发聊天机器人、个性化学习辅导、多轮智能客服等对响应速度敏感的应用。
  • 大规模文档智能解析:胜任学术论文精读、法律合同条款比对、百万行级代码库语义理解等任务,快速提取关键信息并完成结构化整合。
  • 隐私优先的端侧 AI 计算:支持在 Mac Studio M4 Max、NVIDIA DGX Spark 等本地设备一键部署,满足金融风控、临床辅助、企业内网办公等高敏场景的数据不出域需求。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
c语言中/相关合集
c语言中/相关合集

本专题整合了c语言中/的用法、含义解释。阅读专题下面的文章了解更多详细内容。

0

2026.02.03

漫蛙漫画网页版入口与正版在线阅读 漫蛙MANWA官网访问专题
漫蛙漫画网页版入口与正版在线阅读 漫蛙MANWA官网访问专题

本专题围绕漫蛙漫画(Manwa / Manwa2)官网网页版入口进行整理,涵盖漫蛙漫画官方主页访问方式、网页版在线阅读入口、台版正版漫画浏览说明及基础使用指引,帮助用户快速进入漫蛙漫画官网,稳定在线阅读正版漫画内容,避免误入非官方页面。

0

2026.02.03

Yandex官网入口与俄罗斯搜索引擎访问指南 Yandex中文登录与网页版入口
Yandex官网入口与俄罗斯搜索引擎访问指南 Yandex中文登录与网页版入口

本专题汇总了俄罗斯知名搜索引擎 Yandex 的官网入口、免登录访问地址、中文登录方法与网页版使用指南,帮助用户稳定访问 Yandex 官网,并提供一站式入口汇总。无论是登录入口还是在线搜索,用户都能快速获取最新稳定的访问链接与使用指南。

2

2026.02.03

Java 设计模式与重构实践
Java 设计模式与重构实践

本专题专注讲解 Java 中常用的设计模式,包括单例模式、工厂模式、观察者模式、策略模式等,并结合代码重构实践,帮助学习者掌握 如何运用设计模式优化代码结构,提高代码的可读性、可维护性和扩展性。通过具体示例,展示设计模式如何解决实际开发中的复杂问题。

1

2026.02.03

C# 并发与异步编程
C# 并发与异步编程

本专题系统讲解 C# 异步编程与并发控制,重点介绍 async 和 await 关键字、Task 类、线程池管理、并发数据结构、死锁与线程安全问题。通过多个实战项目,帮助学习者掌握 如何在 C# 中编写高效的异步代码,提升应用的并发性能与响应速度。

0

2026.02.03

Python 强化学习与深度Q网络(DQN)
Python 强化学习与深度Q网络(DQN)

本专题深入讲解 Python 在强化学习(Reinforcement Learning)中的应用,重点介绍 深度Q网络(DQN) 及其实现方法,涵盖 Q-learning 算法、深度学习与神经网络的结合、环境模拟与奖励机制设计、探索与利用的平衡等。通过构建一个简单的游戏AI,帮助学习者掌握 如何使用 Python 训练智能体在动态环境中作出决策。

1

2026.02.03

python end=
python end=

本专题整合了python中end=的相关内容,阅读专题下面的文章了解更多详细内容。

0

2026.02.03

python运算符优先级
python运算符优先级

本专题整合了python运算符优先级排序、用法相关内容,阅读专题下面的文章了解更多详细内容。

1

2026.02.03

python print用法与作用
python print用法与作用

本专题整合了python print的用法、作用、函数功能相关内容,阅读专题下面的文章了解更多详细教程。

1

2026.02.03

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Git 教程
Git 教程

共21课时 | 3.3万人学习

Git版本控制工具
Git版本控制工具

共8课时 | 1.5万人学习

Git中文开发手册
Git中文开发手册

共0课时 | 0人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号