0

0

端侧大模型迎来轻革命:移远通信x RWKV 打造轻量AI大脑

雪夜

雪夜

发布时间:2025-07-29 09:44:02

|

559人浏览过

|

来源于php中文网

原创

7月27日,移远通信正式宣布与rwkv公司达成深度战略合作,双方将基于移远的高性能算力平台,对rwkv最新模型架构进行优化与适配,携手推进大模型在终端设备上的低资源、高效率部署。此次合作成果首次在2025世界人工智能大会(waic)上惊艳亮相,标志着端侧大模型技术向更高效能、更广泛应用场景迈出了重要一步。

端侧大模型迎来轻革命:移远通信x RWKV 打造轻量AI大脑

RWKV(Receptance Weighted KeyValue)是全球领先的RNN类大模型架构,创新性地融合了递归神经网络(RNN)的恒定计算复杂度与高效串行推理能力,同时吸收了Transformer的并行训练优势,在文本生成、语音处理、图像视频分析及时间序列预测等多个领域表现卓越,且训练与推理成本远低于传统Transformer模型。

其核心技术在于以RWKV算子替代Transformer中的位置编码和多头注意力机制,成功破解了后者在处理长序列时面临的内存与时间复杂度激增难题。该设计实现了token级计算和内存占用的恒定,无论序列多长,推理速度与资源消耗均保持稳定,从而显著提升效率。这一特性使其在资源受限的终端设备中极具优势,堪称赋予终端一个“轻量级AI大脑”。

在WAIC 2025展会上,基于高通QCS8550平台的两大联合解决方案重磅发布:

RWKVChat:持续思考,离线对话

RWKVChat是一款完全离线运行的AI聊天应用,无需联网即可实现本地推理、深度对话与文本续写,支持个性化设置,成为用户随身的“智能助手”。例如,搭载于高通手机平台的RWKV7-G12.9B模型,推理速度可达30token/s。得益于RWKV架构无需KV缓存的特性,在长时间对话中仍能保持速度与内存占用的恒定,体验流畅不卡顿。

端侧大模型迎来轻革命:移远通信x RWKV 打造轻量AI大脑

RWKVSudoku:超长链式推理

RWKV数独展示了仅20M参数的小模型在超长思维链(Chain-of-Thought, CoT)任务中的惊人表现。凭借恒定内存占用与极低token消耗,它能够高效解决复杂数独难题,直观体现了RWKV在端侧设备上实现高效推理的巨大潜力。

端侧大模型迎来轻革命:移远通信x RWKV 打造轻量AI大脑

ONLYOFFICE
ONLYOFFICE

用ONLYOFFICE管理你的网络私人办公室

下载

在当前Transformer主导的大模型技术格局下,移远通信展现出前瞻性的战略布局,积极拓展非Transformer技术路径,致力于为行业提供更低功耗、更少内存依赖的端侧AI解决方案。

本次展出的RWKV7-G11.5B模型,在移远通信SG885G模组上经过深度工程优化后,性能表现远超同参数量级的Transformer模型。实测数据显示:

在Prefill阶段:

  • 平均耗时降低83%
  • 处理速度提升345%

在Decoding阶段:

  • CPU平均使用率下降23%
  • 内存占用减少36%
  • 功耗降低18%

SG885G模组基于高通QCS8550平台打造,具备高达48TOPS的AI算力,可支持约7B参数的多模态模型本地推理,实现图像理解与多源信息融合的实时响应。在模型兼容方面,移远已构建完善的端侧适配体系,全面支持Llama、通义千问、DeepSeek等主流开源模型,覆盖0.5B至8B参数范围,打造了一个功能强大的端侧大模型运行平台。尤为关键的是,SG885G率先支持非Transformer路线的RWKV7架构,大幅降低对硬件资源的需求。

移远通信首席运营官张栋表示:“此次与RWKV的合作,是我们‘让终端拥有AI大心脏’理念的重要实践。RWKV的线性注意力机制,彻底打破了终端设备处理长序列数据的瓶颈。结合移远的高算力模组,我们真正把大模型‘装进’了物联网终端。当农机能‘读懂’土壤状态,当手表可‘预判’健康风险,AI就不再只是云端的概念,而是深入田间地头、融入日常生活的现实力量。”

RWKV联合创始人兼COO罗璇表示:“我们的目标是让每一台设备都具备思考能力,就像植入一颗会学习的‘大脑’。随着RWKV架构在移远算力平台上的规模化落地,终端将突破资源限制,形成‘云端能力+本地智能’的双轮驱动生态,为万物智联时代打下坚实的技术基础。”

移远通信与RWKV的强强联合,不仅是硬件与算法的深度融合,更是推动智能普惠化的重要里程碑,让大模型真正从云端走向终端,赋能千行百业、千家万户。

7月26日至29日,欢迎莅临WAIC 2025移远通信展台(H1D815),亲身体验端侧大模型带来的智能变革。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
登录token无效
登录token无效

登录token无效解决方法:1、检查token的有效期限,如果token已经过期,需要重新获取一个新的token;2、检查token的签名,如果签名不正确,需要重新获取一个新的token;3、检查密钥的正确性,如果密钥不正确,需要重新获取一个新的token;4、使用HTTPS协议传输token,建议使用HTTPS协议进行传输 ;5、使用双因素认证,双因素认证可以提高账户的安全性。

6172

2023.09.14

登录token无效怎么办
登录token无效怎么办

登录token无效的解决办法有检查Token是否过期、检查Token是否正确、检查Token是否被篡改、检查Token是否与用户匹配、清除缓存或Cookie、检查网络连接和服务器状态、重新登录或请求新的Token、联系技术支持或开发人员等。本专题为大家提供token相关的文章、下载、课程内容,供大家免费下载体验。

819

2023.09.14

token怎么获取
token怎么获取

获取token值的方法:1、小程序调用“wx.login()”获取 临时登录凭证code,并回传到开发者服务器;2、开发者服务器以code换取,用户唯一标识openid和会话密钥“session_key”。想了解更详细的内容,可以阅读本专题下面的文章。

1067

2023.12.21

token什么意思
token什么意思

token是一种用于表示用户权限、记录交易信息、支付虚拟货币的数字货币。可以用来在特定的网络上进行交易,用来购买或出售特定的虚拟货币,也可以用来支付特定的服务费用。想了解更多token什么意思的相关内容可以访问本专题下面的文章。

1356

2024.03.01

页面置换算法
页面置换算法

页面置换算法是操作系统中用来决定在内存中哪些页面应该被换出以便为新的页面提供空间的算法。本专题为大家提供页面置换算法的相关文章,大家可以免费体验。

409

2023.08.14

物联网有哪些应用
物联网有哪些应用

物联网应用有智能家居、智慧城市、工业自动化、农业智能化、物流和供应链管理、医疗健康、智能交通、能源管理、环境监测、智能零售等等。详细介绍:1、智能家居,物联网技术可以将家庭中的各种设备和家居系统连接到互联网,实现智能化的家居控制和管理,例如,通过智能手机可以远程控制家中的照明、温度、安防系统等;2、智慧城市,物联网技术可以应用于城市基础设施和公共服务,实现智慧城市的建设等等。

231

2023.09.05

物联网中的m2m概念
物联网中的m2m概念

M2M是人与机器连接的手段与方式。想了解更多的相关内容,可以阅读本专题下面的文章。

422

2024.03.12

物联网应用岗位
物联网应用岗位

常见岗位包括:物联网架构师;物联网工程师;数据分析师;云计算工程师;应用程序开发人员;嵌入式系统工程师;网络安全分析师;产品经理;物联网项目经理;业务分析师等等。想了解更多物联网应用的相关内容,可以阅读本专题下面的文章。

405

2024.05.21

java入门学习合集
java入门学习合集

本专题整合了java入门学习指南、初学者项目实战、入门到精通等等内容,阅读专题下面的文章了解更多详细学习方法。

1

2026.01.29

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
帝国CMS企业仿站教程
帝国CMS企业仿站教程

共17课时 | 1.7万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号