0

0

Liquid AI 发布 LFM2-8B-A1B:8B 参数仅激活 1.5B

花韻仙語

花韻仙語

发布时间:2025-10-11 18:52:01

|

799人浏览过

|

来源于php中文网

原创

高效moe架构重塑边缘计算边界——liquid ai推出全新lfm2-8b-a1b模型,作为lfm2系列首款混合专家(mixture-of-experts, moe)架构模型,其总参数量达8.3b,但每token仅激活约1.5b参数。得益于稀疏激活机制,该模型在维持强大表达能力的同时显著降低计算开销,特别适用于手机、平板等资源受限的终端设备。与传统依赖云端部署的moe模型不同,lfm2-8b-a1b专为实时交互场景优化,突破了“小规模moe效率低下”的行业固有认知。

该模型基于LFM2混合骨干结构构建,包含18个门控短卷积块和6个分组查询注意力(GQA)模块。除前两层保持稠密以保障训练稳定性外,其余各层均集成稀疏MoE前馈网络。每一层配置32个专家,实际运行时仅激活top-4专家,并通过归一化sigmoid路由器结合自适应偏置策略,实现更均衡的专家负载分配。支持长达32K token的上下文输入,具备英文、阿拉伯文、中文、法文、德文、日文、韩文及西班牙文等多语言处理能力。

Liquid AI 发布 LFM2-8B-A1B:8B 参数仅激活 1.5B

训练与性能:12T token训练铸就媲美3-4B模型的能力

LFM2-8B-A1B历经约12万亿token的预训练过程,数据分布涵盖55%英文、25%多语言文本以及20%代码内容。后续采用Liquid Preference Alignment技术(融合长度归一化的DPO与APO-Zero方法)进行对齐训练,借助混合BF16/FP8精度方案,使整体训练效率提升超3倍。

在多项基准测试中表现亮眼:

  • 知识理解与指令遵循:MMLU-Pro得分37.4(相较LFM2-2.6B提升11.5),IFEval达77.6,Multi-IF为58.2。
  • 数学推理能力:GSM8K成绩84.4,GSMPlus为64.8,MATH500高达74.2。
  • 多语言任务表现:MGSM达到72.4,MMMLU得分为55.3。
  • 编程与写作生成:HumanEval+得分69.5,LiveCodeBench v6为21.0,EQ-Bench为44.2。

综合来看,其输出质量可对标3-4B级别的稠密模型,在多轮对话连贯性、创意文本生成、RAG检索增强回答以及工具调用等复杂任务中展现出卓越能力。

Playground AI
Playground AI

AI图片生成和修图

下载

部署与集成:最高5倍加速,全面兼容主流框架

LFM2-8B-A1B在CPU与GPU上的推理速度表现突出。在搭载AMD Ryzen AI 9 HX 370和三星Galaxy S24 Ultra等设备上,采用int4量化配合int8动态激活,并运行定制化XNNPACK MoE内核时,解码吞吐量相较Qwen3-1.7B、IBM Granite 4.0等同类模型最高提升达5倍。

GPU端已集成vLLM推理引擎,支持FlashInfer与CUDA graph编译优化,兼顾单请求低延迟与高并发在线批处理需求。

针对移动端与轻量级设备,模型提供多种量化版本:Q4_0格式仅需约4.7GB存储空间,F16版本约为16.7GB。目前支持llama.cpp(需b6709及以上版本并启用lfm2moe支持)、ExecuTorch(适用于移动及嵌入式CPU)和vLLM(GPU平台)三大主流框架。此外,Hugging Face已开放GGUF量化文件下载,并配套提供Colab微调笔记本,助力开发者快速部署与二次开发。该模型现已上线Liquid Playground平台,供用户在线体验与测试。

相关文章

Windows激活工具
Windows激活工具

Windows激活工具是正版认证的激活工具,永久激活,一键解决windows许可证即将过期。可激活win7系统、win8.1系统、win10系统、win11系统。下载后先看完视频激活教程,再进行操作,100%激活成功。

下载

本站声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

相关专题

更多
if什么意思
if什么意思

if的意思是“如果”的条件。它是一个用于引导条件语句的关键词,用于根据特定条件的真假情况来执行不同的代码块。本专题提供if什么意思的相关文章,供大家免费阅读。

751

2023.08.22

登录token无效
登录token无效

登录token无效解决方法:1、检查token的有效期限,如果token已经过期,需要重新获取一个新的token;2、检查token的签名,如果签名不正确,需要重新获取一个新的token;3、检查密钥的正确性,如果密钥不正确,需要重新获取一个新的token;4、使用HTTPS协议传输token,建议使用HTTPS协议进行传输 ;5、使用双因素认证,双因素认证可以提高账户的安全性。

6099

2023.09.14

登录token无效怎么办
登录token无效怎么办

登录token无效的解决办法有检查Token是否过期、检查Token是否正确、检查Token是否被篡改、检查Token是否与用户匹配、清除缓存或Cookie、检查网络连接和服务器状态、重新登录或请求新的Token、联系技术支持或开发人员等。本专题为大家提供token相关的文章、下载、课程内容,供大家免费下载体验。

810

2023.09.14

token怎么获取
token怎么获取

获取token值的方法:1、小程序调用“wx.login()”获取 临时登录凭证code,并回传到开发者服务器;2、开发者服务器以code换取,用户唯一标识openid和会话密钥“session_key”。想了解更详细的内容,可以阅读本专题下面的文章。

1062

2023.12.21

token什么意思
token什么意思

token是一种用于表示用户权限、记录交易信息、支付虚拟货币的数字货币。可以用来在特定的网络上进行交易,用来购买或出售特定的虚拟货币,也可以用来支付特定的服务费用。想了解更多token什么意思的相关内容可以访问本专题下面的文章。

1263

2024.03.01

PHP WebSocket 实时通信开发
PHP WebSocket 实时通信开发

本专题系统讲解 PHP 在实时通信与长连接场景中的应用实践,涵盖 WebSocket 协议原理、服务端连接管理、消息推送机制、心跳检测、断线重连以及与前端的实时交互实现。通过聊天系统、实时通知等案例,帮助开发者掌握 使用 PHP 构建实时通信与推送服务的完整开发流程,适用于即时消息与高互动性应用场景。

11

2026.01.19

微信聊天记录删除恢复导出教程汇总
微信聊天记录删除恢复导出教程汇总

本专题整合了微信聊天记录相关教程大全,阅读专题下面的文章了解更多详细内容。

79

2026.01.18

高德地图升级方法汇总
高德地图升级方法汇总

本专题整合了高德地图升级相关教程,阅读专题下面的文章了解更多详细内容。

109

2026.01.16

全民K歌得高分教程大全
全民K歌得高分教程大全

本专题整合了全民K歌得高分技巧汇总,阅读专题下面的文章了解更多详细内容。

153

2026.01.16

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Laravel---API接口
Laravel---API接口

共7课时 | 0.6万人学习

ThinkPHP6.x 微实战--十天技能课堂
ThinkPHP6.x 微实战--十天技能课堂

共26课时 | 1.6万人学习

ThinkPHP6.x API接口--十天技能课堂
ThinkPHP6.x API接口--十天技能课堂

共14课时 | 1.1万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号