找回密码
 立即注册
科技快报网 首页 科技快报 业界资讯 查看内容
潘刚引领伊利实现绿色智造升级 续写绿色实践新篇章三星Galaxy S26系列发布 四大革新定义移动体验新标杆推动视频编码标准演进,高通专家:协作式探索加快新一代压缩技术的开发解锁光的魔法:3月19日,COMSOL带你玩转光学超材料设计革命!易视界拜祖大典圆满举行 弘扬传统文化精神存储芯片价格持续走高,三星Q4大赚,市占重回第一二十而冠,向新而行 深圳村田科技有限公司20周年庆典暨新年会盛大举行Dell Private Cloud新增对Nutanix的兼容支持,为企业带来更多选择Soul创始人张璐团队联合复旦发布社交趋势报告,解码Z世代社交图谱2026最强黑马,AURORA定义奢品新秩序Dell Private Cloud新增对Nutanix的兼容支持,为企业带来更多选择投资璀璨会——从散户赋能到游资崛起,张自如引领的六年成长之路EV集团推出面向大批量生产的下一代 EVG®120 全自动涂胶机网易Q4创新业务环比增长42.4% 严选多赛道持续领跑获阿特斯2025年“最佳协作供应商”奖特别通讯丨新春打粮正当时践行企业社会责任 维塔金基金会深耕南亚为全球困境儿童点亮灯火一位迷路的外卖小哥,接到一封奇怪订单,误闯入铝博会的“千门万窗”华为董事长梁华:2025年公司销售收入突破8800亿元,再创新高透过一扇门,读懂一座城,门,对安义人,是闯荡、是事业,是回家的路

阿里云机器学习PAI发布基于HLO的全自动分布式系统 TePDist,并宣布开源!

2023-04-24 13:40:12

近日,阿里云机器学习平台PAI正式发布自研的基于HLO的全自动分布式深度学习系统 TePDist。它通过在HLO上做分布式策略搜索,能够与用户模型构建语言解耦。并且在保持通用性的同时,能够在可接受的策略搜索时间内,追求高性能分布式策略,同时用户无需修改模型主体代码,系统能够全自动地帮助用户做分布式扩展,有效解决了分布式框架长期以来在实际生产场景中手工优化和自动分布式工作存在的诸多性能和效率问题。

TePDist不仅仅是一个分布式Compiler,还拥有自己的分布式Runtime,以解决深度学习模型并行策略的自动搜索与分布式策略实施问题。在架构方面,TePDist采用Client/Server模式,实现分布式策略与模型描述的解耦。Server端是TePDist最重要部分,以HLO IR作为输入,自动探索并实施分布式并行策略;Client端以用户描述的模型为输入,将其转换成HLO IR。因此,任何具有转换HLO IR能力的Client,都可经过适配后接入Server端。

在功能方面,TePDist分为两个部分。一是在HLO IR上进行SPMD(Data Parallel和Sharding)和Pipeline并行的策略搜索。并以此构建编译基于Task Graph的执行计划。二是高效运行执行计划的分布式执行引擎。同时,TePDist提供了不同优化级别,高优化级别更加追求分布式策略质量,低优化级别会额外采取一些Heuristic,以较为微小策略质量牺牲,换取更快地搜索时间,以此满足落地需求。

性能上,TePDist通过在GPT和MoE模型上SPMD+Pipeline混合策略的模型扩展性实验,TePDist能够使GPT和MoE分别达到峰值能力的62%和58%。同时,在自动化方面的通用性上,TePDist也通过了VGG-19,DNABert和UNet等模型实验验证。

一直以来,大模型在模型效果上被证明具有显著优势。而ChatGPT的出现,证明了其在工业生产工具方面具有巨大潜力。阿里云机器学习平台PAI也宣布将TePDist开源,与AI开发者共同打造更快更好的自动分布式系统,全面助力AI大模型发展!

  免责声明:本网站内容由网友自行在页面发布,上传者应自行负责所上传内容涉及的法律责任,本网站对内容真实性、版权等概不负责,亦不承担任何法律责任。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,并请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。

发布者:sophia

相关阅读

微信公众号
意见反馈 科技快报网微信公众号