找回密码
 立即注册
科技快报网 首页 科技快报 IT资讯 查看内容
华兴资本王力行:预见AI,从技术创新走向产业变革——基础共识之上的非共识同根同心,守望相助——中国企业驰援香港火灾爱心速递以实践为笔,共绘蓝图 | 易视界携手南阳医专开启“订单班”校企合作新篇章华为联合东南大学发布科研样板点,树立教育数智化升级标杆《逃离塔科夫》上架Steam 华硕B850主板双12轻松玩《仁王3》双12实机演示 华硕X870主板带你抢先看华硕Z890/B860主板双12玩转金摇杆最佳游戏《光与影》2025科创大会「人工智能创新项目·掘金汇」成功举办华为数据存储与「DaoCloud 道客」发布AI推理加速联合解决方案华硕Z890/B860主板有颜有实力 双12带你畅玩新游华为小艺亮相央视总台《2025科创大会》,打造Agent时代人机交互新范式高频科技超纯水运维服务:护航安全运营,助力降本增效执笔生态进化,腾易科技的“连接者”阳谋强强联合!文远知行+Uber携手落地中东首个纯无人Robotaxi商业化运营别再东奔西走借会员了!鸿蒙有礼爱奇艺会员年卡免费抽!旧手机也有福利领!升级鸿蒙6后,我用知乎严选年卡重启深度阅读鸿蒙有礼这把玩这么大,爱奇艺的年卡会员直接送?供应链安全最优解:长鑫七大模组直击 OEM 痛点当墨迹天气遇见鸿蒙,智慧气象如何重塑你的生活?御芝林:构建“研发-生产-服务”三角体系,引领大健康产业数智化升级

依托鲲鹏处理器矩阵算力 中科大陈俊仕团队破解稀疏计算效率

2025-11-29 18:42:30

从电路模拟的复杂推演到量子化学的微观分析,大规模稀疏线性方程组的高效求解是科学计算领域的核心需求。但传统稀疏直接求解器因数据非零元分布稀疏且不规则,导致运算低效、算力浪费等问题。近日,中国科学技术大学计算机科学与技术学院特任副研究员陈俊仕团队,在鲲鹏昇腾科教创新卓越中心的算力支持下,创新研发出面向鲲鹏处理器矩阵算力基于密集kernel的LU直接求解器,以密集运算方式实现了稀疏计算的高效求解,成功突破传统运算瓶颈。

该研究创新构建了一种面向稀疏矩阵计算的密集计算范式,系统化解构了传统稀疏直接求解器的性能瓶颈。团队通过将分散的非零元整合为更加规整的密集数据块,将不规则稀疏矩阵映射为统一稠密的大块结构,进而采用基于稠密矩阵运算的数值分解算法,取代传统稀疏运算中聚合非零小分块的碎片化计算模式,显著降低了由不规则内存访问引发的计算与调度开销,最终实现了计算效率与硬件利用率的协同优化。

该方案的顺利落地,深度依赖于鲲鹏平台的计算特性。硬件层面,鲲鹏920新型号集成专用矩阵运算单元,原生具备高密度数值分解运算的高效承载能力,可精准匹配密集数据块的集中化处理需求;其多核架构为大规模密集数据块的并行运算提供了坚实基础,避免算力闲置或过载。软件层面,鲲鹏 KML 数学库针对密集型矩阵运算进行深度优化,通过底层算法与硬件架构的协同,进一步放大了密集运算模式的性能潜力。经 70 余个跨领域测试集验证,该方案性能较SuperLU 求解器平均加速32.2倍,在基础硬件配置下实现了平均 9.6 倍性能加速,大幅压缩了科学计算的时间成本。

目前,相关研究成果已发表于 CCF B 类国际会议 Euro-Par 2025,其核心技术已申请中国发明专利并获得授权。此次成果是鲲鹏平台在科学计算领域的典型实践,该方法对于现代高性能处理器上稀疏计算问题的高效求解、充分地发挥处理器上的矩阵运算单元具有很好的应用价值。未来,随着鲲鹏生态的持续完善,其在高性能计算领域的赋能作用将进一步凸显,助力更多科研团队突破技术难关,推动科研成果加速落地转化。

  免责声明:本网站内容由网友自行在页面发布,上传者应自行负责所上传内容涉及的法律责任,本网站对内容真实性、版权等概不负责,亦不承担任何法律责任。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,并请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。

发布者:张晴

相关阅读

微信公众号
意见反馈 科技快报网微信公众号