找回密码
 立即注册
科技快报网 首页 科技快报 业界资讯 查看内容
千问第二波免单恰逢情人节 县城钟点房帮订量暴增约300%阿里投入超30亿没白花!千问总裁:效果远超预期 后期上线新功能2026央视春晚:菁彩Vivid视听技术护航,让全球华人共赏沉浸式中国年2.25~2.27,铝创未来看安义!门窗人的盛宴,邀您相聚鸿蒙版支付宝解锁新春新玩法!碰一下分享福卡,年味直接拉满反向春运不凑活!海信百吋承包三代人的快乐QQ新功能脑洞秀上线元宝,支持用Q版虚拟形象创作AI视频京东与海信签署战略合作协议 冲击三年1000亿销售目标梧桐科技与腾讯音乐共建行业首个座舱AI“声学创新实验室”安义铝博会,还能这么玩?我们用AI,把门窗界的“时空宇宙”搬到了现场大麦“麦宝”智能体升级,鸿蒙6用户通过小艺即可体验“一句话订电影票”华为乾崑智驾ADS V4.1正式推送中!全方位助力岚图汽车焕新升级春节拍照废片三连?鸿蒙版醒图这波更新,专治各种“不忍删”数智驱动奶业革新 潘刚引领伊利打造全链智能智造标杆极萌美容仪好用吗?从研发到体验,看懂它的核心优势中东皇室背书与全球高端圈层认可,AURORA手机正式落子全球高奢赛道额外优惠400元春节还不打烊 京东入手iPhone Air性价比完胜鸿蒙用户抢先体验!同花顺上线「诊大盘」功能,情绪拐点一眼看透华硕主板护航《失落星船:马拉松》试玩会从课堂知识到产业应用,学而思科创实践营探索未来创造力

端侧大模型迎来"轻"革命:移远通信 × RWKV 打造"轻量AI大脑"

2025-07-28 16:04:59

7月27日,移远通信宣布与RWKV公司建立全面合作关系,双方将依托移远的算力平台,优化并支持RWKV最新模型架构,共同推动大模型在端侧设备的低资源占用部署。此次合作成果于2025世界人工智能大会(WAIC)首次亮相,标志着端侧大模型解决方案向更高性能、更广场景的应用迈出关键一步。

RWKV(Receptance Weighted Key Value)是全球领先的RNN大模型架构,它成功结合了递归神经网络(RNN)的恒定复杂度和高效串行推理,以及Transformer的并行处理优势,使其在文本生成、时间序列、图像和视频、语音和音乐等领域表现出色,推理成本和训练成本显著低于Transformer。

这项技术的核心突破在于引入RWKV算子替代Transformer的位置编码和多头注意力机制。这一革新有效解决了Transformer在处理长序列时的空间和时间复杂度问题,在确保模型性能不受影响的前提下,实现了内存占用恒定、token计算复杂度恒定,意味着运算过程更高效、更省力。这一特性让 RWKV 在端侧设备部署中展现出显著优势:处理长序列时速度更快、内存占用更低,相当于为终端设备配备了一个 "轻量化的AI大脑"。

在本次世界人工智能大会(WAIC)上,基于高通 QCS8550 平台的两大 RWKV 联合解决方案将重磅登场:

• RWKV Chat:思考永续

RWKV Chat是一款离线AI聊天应用,无需联网即可实现推理、深度对话与文本续写,支持个性化会话配置,成为用户的"口袋级"生产力伙伴。例如其中的RWKV7-G1 2.9B模型在高通手机平台的速度可达30 token/s,且由于RWKV架构无需KV cache,在超长推理后仍然可以速度恒定,内存占用恒定。

• RWKV Sudoku:超长CoT

RWKV 数独则展示了20M超小参数模型在超长链式推理(CoT)下的数学解题能力,凭借恒定内存与极少token消耗,轻松破解复杂数独,直观呈现RWKV架构在端侧的高效潜能。

在Transformer架构主导大模型领域的当下,移远通信以前瞻性的眼光,积极布局非Transformer的技术路线,致力于为客户提供更低算力、更少内存消耗的解决方案。

此次展出的RWKV7-G1 1.5B模型,经过移远通信的工程优化后,在SG885G模组上的实测数据表现亮眼,明显优于同等参数量的Transformer架构的模型,具体来说,在Prefill阶段:

• 平均耗时减少83%

• 平均处理速度提升345%

在Decoding阶段:

• 平均CPU使用减少23%

• 平均内存使用减少36%

• 平均功耗减少18%

移远通信的SG885G基于高通QCS8550平台开发,其AI综合算力高达48 TOPS,能够支撑7B左右参数级的多模态模型在本地化推理,从而实现实时视觉理解与多模态信息融合。在模型兼容性方面,移远构建了强大的端侧适配体系,率先实现对Llama、通义千问、DeepSeek等主流开源模型的全方位兼容,兼容的参数范围覆盖0.5B至8B,打造出了功能强大的端侧大模型超级平台。此外,在架构创新上,SG885G支持运行非Transformer路线的RWKV7架构,这一特征显著降低了对算力和内存的需求。

移远通信首席运营官张栋表示:"此次与RWKV的战略合作,是移远通信 ‘让终端拥有AI大心脏'技术理念的关键落地!RWKV的线性注意力架构,突破性地解决了端侧设备的长序列处理瓶颈,再结合移远的高算力模组,成功将AI大模型‘装进'了物联网终端。当农机能‘看懂'土壤的干湿,当手表可以‘提醒'健康风险,AI就不再是飘在云里的概念,而是真真切切来到了田间地头、来到了你我的手腕上,让科技真正服务于每一处需要它的地方。"

RWKV联合创始人&COO罗璇表示:"我们希望让每一台设备都聪明起来,就像为它们植入了会思考的‘大脑'。随着RWKV架构在移远算力平台上实现规模化部署,让终端设备突破资源限制,构建‘云端能力+本地智能'的双引擎协同生态,为万物智联时代奠定技术基石。"

移远通信与RWKV的战略合作,不仅是一次技术与硬件的强强联合,更是推动智能计算走向普惠的关键里程碑,让"AI大模型"真正走出云端,融入万物。

7月26日-29日,诚邀莅临WAIC 2025移远展台(H1 D815),近距离体验端侧大模型解决方案的前沿科技魅力。

  免责声明:本网站内容由网友自行在页面发布,上传者应自行负责所上传内容涉及的法律责任,本网站对内容真实性、版权等概不负责,亦不承担任何法律责任。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,并请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。

发布者:张晴

相关阅读

微信公众号
意见反馈 科技快报网微信公众号