0

0

AI21 开源迷你语言模型 Jamba Reasoning3B

DDD

DDD

发布时间:2025-10-09 16:39:12

|

678人浏览过

|

来源于php中文网

原创

ai21 labs 最近发布了其最新开源的小型语言模型 —— jamba reasoning3b。这款被称作“迷你语言模型”的系统专为在本地设备上运行人工智能任务而设计。作为该公司在特拉维夫研发的 jamba 系列的最新成果,jamba reasoning3b 采用开放许可的 apache 2.0 协议发布,便于广泛使用与二次开发。

不同于主流的大型语言模型(LLM),Jamba Reasoning3B 基于 AI21 自主研发的混合架构,融合了状态空间模型(SSM)与 Transformer 技术。状态空间模型是一种擅长处理序列数据的深度学习方法,在特定场景下比传统 Transformer 更高效,能够通过当前状态推断下一状态。其中,Mamba 是一种典型的 SSM 架构,构成了 Jamba 模型的核心组成部分之一。

AI21 开源迷你语言模型 Jamba Reasoning3B

该模型具备高达 256,000 token 的上下文窗口,最大可处理多达 1,000,000 token 的输入,在推理能力方面媲美 Anthropic 的 Claude、Google 的 Gemini 和 Meta 的 Llama 等大型模型,却能在 iPhone、Android 手机、Mac 及普通 PC 等资源受限的终端设备上流畅运行。

Futurum Group 分析师 Brad Shimmin 表示,他长期看好状态空间模型的发展潜力。他认为,尽管这一概念在业内已有多年历史,但直到近期才真正实现工程上的突破。随着技术进步,SSM 架构展现出更强的可扩展性和更高的运算速度,正逐步成为替代传统注意力机制的可行方案。

Elser AI Comics
Elser AI Comics

一个免费且强大的AI漫画生成工具,助力你三步创作自己的一出好戏

下载

这类 SSM 模型利用绳索缩放(rope scaling)技术优化注意力机制,能够在降低计算开销的同时更有效地聚焦关键信息。尽管 AI21 在生成式 AI 领域规模相对较小,但凭借 Google 和 AI 芯片领导者 Nvidia 的战略支持,以及自 2017 年以来累计超 6 亿美元的融资,公司已具备构建完整生态的能力,有望通过开源模型 Jamba Reasoning3B 推动商业化落地。

发布会上,AI21 展示了 Jamba 模型在多个权威基准测试中的优异表现,包括 IFBench、MMLU-Pro 和 Humanity's Last Exam,结果显示其性能超越了阿里巴巴 Qwen3.4B、Google Gemma3.4B、Meta Llama3.23B、IBM Granite4.0Micro 以及微软 Phi-4Mini 等知名开源大模型。

Shimmin 强调,该模型在企业级应用中具有巨大潜力,尤其得益于其对检索增强生成(RAG)的支持,企业可以基于私有数据进行定制化部署,同时保障数据隐私与安全。他举例指出,客户服务中心是一个极具前景的应用场景:借助模型强大的推理能力,系统可自动分析客户投诉内容,判断问题复杂度,并决定是否需转交人工或升级至更高阶模型处理。

相关专题

更多
登录token无效
登录token无效

登录token无效解决方法:1、检查token的有效期限,如果token已经过期,需要重新获取一个新的token;2、检查token的签名,如果签名不正确,需要重新获取一个新的token;3、检查密钥的正确性,如果密钥不正确,需要重新获取一个新的token;4、使用HTTPS协议传输token,建议使用HTTPS协议进行传输 ;5、使用双因素认证,双因素认证可以提高账户的安全性。

6098

2023.09.14

登录token无效怎么办
登录token无效怎么办

登录token无效的解决办法有检查Token是否过期、检查Token是否正确、检查Token是否被篡改、检查Token是否与用户匹配、清除缓存或Cookie、检查网络连接和服务器状态、重新登录或请求新的Token、联系技术支持或开发人员等。本专题为大家提供token相关的文章、下载、课程内容,供大家免费下载体验。

809

2023.09.14

token怎么获取
token怎么获取

获取token值的方法:1、小程序调用“wx.login()”获取 临时登录凭证code,并回传到开发者服务器;2、开发者服务器以code换取,用户唯一标识openid和会话密钥“session_key”。想了解更详细的内容,可以阅读本专题下面的文章。

1062

2023.12.21

token什么意思
token什么意思

token是一种用于表示用户权限、记录交易信息、支付虚拟货币的数字货币。可以用来在特定的网络上进行交易,用来购买或出售特定的虚拟货币,也可以用来支付特定的服务费用。想了解更多token什么意思的相关内容可以访问本专题下面的文章。

1261

2024.03.01

android开发三大框架
android开发三大框架

android开发三大框架是XUtil框架、volley框架、ImageLoader框架。本专题为大家提供android开发三大框架相关的各种文章、以及下载和课程。

274

2023.08.14

android是什么系统
android是什么系统

Android是一种功能强大、灵活可定制、应用丰富、多任务处理能力强、兼容性好、网络连接能力强的操作系统。本专题为大家提供android相关的文章、下载、课程内容,供大家免费下载体验。

1739

2023.08.22

android权限限制怎么解开
android权限限制怎么解开

android权限限制可以使用Root权限、第三方权限管理应用程序、ADB命令和Xposed框架解开。详细介绍:1、Root权限,通过获取Root权限,用户可以解锁所有权限,并对系统进行自定义和修改;2、第三方权限管理应用程序,用户可以轻松地控制和管理应用程序的权限;3、ADB命令,用户可以在设备上执行各种操作,包括解锁权限;4、Xposed框架,用户可以在不修改系统文件的情况下修改应用程序的行为和权限。

2013

2023.09.19

android重启应用的方法有哪些
android重启应用的方法有哪些

android重启应用有通过Intent、PendingIntent、系统服务、Runtime等方法。本专题为大家提供Android相关的文章、下载、课程内容,供大家免费下载体验。

267

2023.10.18

PS使用蒙版相关教程
PS使用蒙版相关教程

本专题整合了ps使用蒙版相关教程,阅读专题下面的文章了解更多详细内容。

23

2026.01.19

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Excel 教程
Excel 教程

共162课时 | 12.5万人学习

Java 教程
Java 教程

共578课时 | 48万人学习

Uniapp从零开始实现新闻资讯应用
Uniapp从零开始实现新闻资讯应用

共64课时 | 6.6万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号