找回密码
 立即注册
科技快报网 首页 科技快报 快报 查看内容
速腾聚创具身智能惊艳 CES,全栈技术矩阵点亮机器人生态未来昇腾赋能 TransMLA:无需重训突破架构壁垒,助力主流大模型高效适配 MLA行业首款潮玩手机来了!荣耀500系列确认与泡泡玛特联名物理AI革命爆发:邦彦技术如何卡位下一代商用计算机?最小体积,最强性能:光子跃迁以8K AI拇指相机问鼎CES维信诺亮相2026 CES,邀你体验“未来生活家”北森推出AI+HR成熟度模型,发布《中国企业人力资源数智化成熟度模型与实践白皮书》荣膺“北斗天枢贡献奖” 东软与长安汽车共绘智能出行新蓝图3.99万美元击穿行业底价!快轮科技超轻型飞行器CES发布,无需驾照即可飞行2026年成者12周年战略新品发布会,AI会议机器人重磅亮相TTi Sound AI全景声入选机器之心2025年度AI榜单全球首个机器人唱跳舞台来了!王心凌携手智元灵犀X2亮相京东跨晚融和科技RonAgent:开启中小企业智能管理“平权”时代联想LTPC 2025:“天禧AI生态智能体先导计划”赋能开发者掘金智能体个人AI时代京东推动游戏电视3.0标准体系完善 产业生态加速升级vivo X300 大卖的性能因素更智慧更安全,华为擎云 HM740带来企业办公创新体验更智慧更安全,华为擎云 HM740带来企业办公创新体验京东家电家居暖心站台为大连一线劳动者送温暖 购取暖器享年终好价阿里云ECS AMD实例年终狂欢,算力成本最多立省75%

昇腾赋能 TransMLA:无需重训突破架构壁垒,助力主流大模型高效适配 MLA

2026-01-13 13:18:47

【科技快报网】MLA(Multi-head Latent Attention多头潜在注意力架构)凭借低秩压缩KV缓存设计,实现长上下文推理的显存与带宽双重优化,其有效性已在 DeepSeek-V2 等模型中得到了验证。但主流预训练模型如LLaMA、Qwen千问等多基于GQA构建,企业已投入大量工程优化,复用MLA需重训,成本极高。为此,在北京大学 鲲鹏昇腾科教创新卓越中心的算力支持下,北京大学人工智能研究院助理教授张牧涵团队提出TransMLA转化框架,实现了无需重训便可将主流模型向MLA迁移。

TransMLA针对GQA向MLA迁移的核心痛点,实现四大技术模块的精准破局:一是GQA→MLA结构映射,破解分组KV头与MLA单头潜在表示不兼容问题,通过特定的线性变换,将GQA分组后的K、V向量投影/融合为单一的低秩潜在表示,并配备上投影矩阵保障KV信息精准恢复,筑牢迁移基础;二是提出RoRoPE技术方案,通过创新适配让位置编码顺畅融入低秩压缩流程,解决了直接对RoPE应用PCA等通用降维方法可能导致的位置信息损失或模型性能下降问题;三是通过将RoPE中相邻频率的旋转维度进行折叠(Folding)与融合,在降低参数量的同时,更高效地集中和保留关键的位置信息,从而维持模型在长序列下的语义理解能力;四是通过均衡Key和Value矩阵在压缩前的范数分布,提升联合压缩(如PCA)的数值稳定性,减少信息损失。

在技术落地过程中,昇腾发挥了关键支撑作用。其高效并行计算架构满足结构映射模块的多任务协同处理需求,保障了架构迁移效率;其优化的存储与缓存体系,为 FreqFold 的频率信息处理、BKV-PCA 的范数均衡提供稳定硬件基础,有效提升 KV 压缩的稳定性与资源利用效率,助力 TransMLA 核心技术平稳落地。

经过实验显示TransMLA的转换过程性能优势明显,裁剪LLaMA-2-7B模型68.75%的KV缓存后无需训练,核心性能仅轻微损失,在32K序列长度、FP16精度下,基于昇腾平台的推理速度较之于业界主流GPU平台有显著提升。依托开放的生态资源,昇腾已推动TransMLA稳定支持主流模型部署并将集成至vLLM/SGLang等高性能推理框架生态,便于用户部署,大幅降低企业落地适配成本。

TransMLA与昇腾的协同创新,打通了主流模型与MLA架构鸿沟,充分发挥昇腾生态优势。昇腾全链路支持实现TransMLA“零重训、低损失”目标,保留模型参数优势,降低企业基于昇腾的升级门槛。这一软硬件协同典范,为长上下文推理提供昇腾生态解决方案,推动自主计算与前沿AI融合,彰显昇腾核心引领作用,为大模型产业依托自主硬件降本增效提供可行路径。

  免责声明:本网站内容由网友自行在页面发布,上传者应自行负责所上传内容涉及的法律责任,本网站对内容真实性、版权等概不负责,亦不承担任何法律责任。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,并请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。

发布者:快科技

相关阅读

微信公众号
意见反馈 科技快报网微信公众号