【科技快报网讯】8 月 22-24 日, 2025 中国算力大会在山西大同成功举办。中国算力大会是由工业和信息化部主办的中国规格最高的算力大会,2025 年本届大会由山西省人民政府、山西省工业和信息化厅承办,以“算网筑基 智引未来”为主题,齐聚基础电信企业、芯片企业、算力企业、科研机构、高等院校等单位代表及行业专家。本届大会聚焦算力基础设施构建、智算融合发展与绿色低碳创新,全方位展示我国算力产业最新成果。 中昊芯英作为国内 TPU 架构 AI 算力的核心推动者,深度参与本届大会。联合创始人及 CTO 郑瀚寻在开幕式主论坛发表《攻坚 AI 软硬件协同效能:国产自研TPU芯片软件栈的优化实践与生态构建》主题演讲;中昊芯英展区以“算力硬件—云服务—解决方案”三维场景全面展示 TPU AI 基座,并凭借全自研的 TPU 架构 AI 专用算力芯片“刹那®”获评“创新先锋案例”;同期,中昊芯英首席架构师平晓峰在大会重榜活动“星耀之夜”发表《基于 GPTPU 架构的国产高性能智算平台》主题分享,中昊芯英解决方案架构师顾立程在智能计算创新发展论坛中发表《TPU AI 专用算力芯片:大模型基础设施的突破之路》主题演讲。 开幕式主论坛:联合创始人及 CTO 郑瀚寻阐释软硬件协同创新,定义国产算力新路径 中昊芯英联合创始人及 CTO 郑瀚寻受邀在大会的开幕式主论坛发表《攻坚 AI 软硬件协同效能:国产自研 TPU 芯片软件栈的优化实践与生态构建》主题演讲。面对当前 AI 算力规模快速扩张与系统效能瓶颈之间的突出矛盾,他指出软硬件协同设计作为突破算力性能约束的关键路径,并深度阐释国产 GPTPU 架构 AI 芯片全栈软件生态的协同创新模式。 郑瀚寻以中昊芯英自研的 GPTPU 架构 AI 专用算力芯片“刹那®”为核心,详细解析了针对先进大模型全生命周期性能优化的关键技术路径,通过算子优化、KV融合与访存优化、计算图拓扑重构与系统级优化(io_uring)等软硬件协同设计关键技术,实现 Attention 层耗时降低、 token 延迟减少、读写效率提升、系统通信性能优化等系统级优化,显著提升大模型训练与推理任务的执行效率。这些软件栈的系统级创新成果在 DeepSeek 等国产主流大模型的适配中得到充分验证,并成为全国首批通过由中国信通院、人工智能软硬件测试验证中心、中国人工智能产业发展联盟联合权威发布的“DeepSeek 大模型适配通过名单”的 8 家企业之一,展现了中昊芯英从技术追赶到产业引领的战略转型决心。 获评 2025 中国算力大会“创新先锋案例”,TPU 架构 AI 专用算力芯片获权威认可 在大会创新成果发布与颁奖环节,中昊芯英凭借全自研的 TPU 架构 AI 专用算力芯片“刹那®”获评“创新先锋案例”,该芯片拥有完全自主可控的 IP 核、全自研指令集与计算平台,AI 算力性能超越海外著名 GPU 产品近 1.5 倍,能耗降低 30%,单位计算成本降低近 50%。同时,采用 Chiplet 技术与 2.5D 封装,实现同等制程工艺下的性能跃升。支持 1024 片芯片高速片间互联,系统级性能比传统 GPU 集群提升数倍,为构建千卡、万卡规模超算集群奠定基础。基于“刹那®”芯片构建的“泰则®”GPTPU 人工智能服务器与计算集群系统,单集群最大浮点运算能力在 TF32 计算精度及稀疏算力技术下可达 400P 以上,有力支撑包括超千亿参数 AIGC 大模型运算、高级无人驾驶模型训练、蛋白质结构精密预测等各类高强度 AI 运算场景。该方案在算力性能、能效比、兼容性等方面表现突出,目前已应用于多个大型智算中心,支持大模型训练、推理及行业 AI 应用落地。 中昊芯英在核心展区打造 69 平方米特装展位,以“算力硬件—云服务—解决方案”三维场景全面展示 TPU AI 基座。现场重点展出全自研 TPU 架构 AI 芯片“刹那®”及人工智能服务器“泰则®”,并部署多台服务器设置交互体验环节,实机运行 DeepSeek 等国产大模型,吸引大量专业观众驻足交流。 分论坛及专题活动分享,多维展现国产 TPU 的架构创新、集群实践与生态共建 在大会同期重磅活动“算力中国·星耀之夜”,中昊芯英首席架构师平晓峰发表《基于 GPTPU 架构的国产高性能智算平台》主题分享。该活动由工业和信息化部新闻宣传中心副主任赵荣贵、山西省工业和信息化厅副厅长刘勇、大同市委常委兼大同经开区党工委书记宁文鑫等重要领导出席并致辞。平晓峰在演讲中系统阐述了公司从自主芯片研发到全栈服务布局的技术体系,重点介绍了基于 GPTPU 架构的高性能智算平台建设成果与产业实践。并结合与深圳联通、天津移动等伙伴共建智算中心的落地案例,以及在金融、法律、创新创业等多领域的 AI 垂直大模型融合应用,呈现中昊芯英以全栈自主、生态兼容的 GPTPU 架构云平台推动国产算力底座建设与行业智能化转型的核心价值与实施路径。 在智能计算创新发展论坛中,中昊芯英解决方案架构师顾立程发表《TPU AI 专用算力芯片:大模型基础设施的突破之路》主题演讲。回顾 GPU 架构变化历史,发现 Tensor Core 的架构革新对 GPU 算力性能提升显著,而 TPU 本质上是独立出来的 Tensor core,为 AI 大模型训练而生。中昊芯英 TPU 架构 AI 芯片在大规模计算单元调度、能效优化及千卡集群构建方面的核心技术突破,“泰则®”智算系统与千卡级集群能力,全面展示了中昊芯英在算力效能、能效比和软硬件协同方面的显著优势,为传统行业智能化转型提供可复用的算力支撑。 本届大会见证了我国算力产业的蓬勃生机。中昊芯英凭借在自研 TPU 架构、千卡集群与全栈软件生态上的系统性突破,充分展现了国产算力支撑大模型创新与行业智能化转型的实力与决心。未来,公司将继续深化软硬件协同创新,携手产业伙伴共促智算融合与自主创新,为构建自主可控、高效绿色的智能算力基石持续贡献力量。 |
免责声明:本网站内容由网友自行在页面发布,上传者应自行负责所上传内容涉及的法律责任,本网站对内容真实性、版权等概不负责,亦不承担任何法律责任。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,并请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。