找回密码
 立即注册
科技快报网 首页 科技快报 IT资讯 查看内容
笔误?BYDFi 在圣詹姆斯公园讲述 BUIDL 背后的故事国庆换iPhone 17 Pro Max立省300元?多平台对比看哪家更划算百店开业 千店同庆!联想十一购机福利大放送:打卡门店送贴膜服务、到店购机抽奖必中2025第二十届南昌国际车展10月1日盛大开幕!得力集团就"跛脚员工入职被辞"事件致歉并公布整改措施一群“数贸新生代”即将从义乌搅动全球鲸鸿动能发布“Family Reach”家庭场景化解决方案,撬动营销新增量猜诺奖赢百万京豆!京东图书开启“2025文学预言”狂欢KWL新店继上海后落子重庆,酷特智能“逆周期动力”从何而来?易车研究院洞察报告:自驾游成车市新增长极?旅游复苏带动汽车消费结构性变化东软以“可信、可控、可持续”路径,引领AI医疗进入深水区多筒洗衣机新品9月扎堆首发 京东已成核心销售阵地发布全新太阳能智能杀虫灯,以绿色科技守护农业未来赛意信息以工业AI验证技术价值,向物理AI开启进阶之路高通专家:在“混合AI”的未来,6G 将成为连接云与边缘的核心纽带打响AI价值落地第一枪,天润融通携ZENAVA亮相2025云栖大会首驱发布“智能出行机器人”,三大行业首创技术重塑两轮赛道宜信公益基金会深化帮扶合作,共筑卓资县学子成才之路出海寻增量,东南亚凭什么成商家 “必争之地”?讯飞星火秋招“整活”,呼兰的星火奇妙夜“空降”高校!

腾讯发布超强算力集群:面向大模型训练

2023-04-14 16:53:02 来自: 雷递网

雷递网 乐天 4月14日

腾讯今日官宣,发布的面向大模型训练的新一代HCC(High-Performance Computing Cluster)高性能计算集群,称整体性能比过去提升了3倍。

这一高性能计算集群搭载了NVIDIA H800 Tensor Core GPU,能提供高性能、高带宽、低延迟的智算能力支撑,面向大模型训练,腾讯称,当前大热的人工智能大模型训练,离不开高性能的算力集群。

一般运算,由运算卡(芯片)来完成。但遇到海量运算,单块芯片无力支撑,就要将成千上万台服务器,通过网络联结,组成大型的算力集群,同心合力,更高更强。

一个人工智能大模型,通常得用数万亿个单词训练,参数量也“飙升”到了上万亿。这个时候,只有高性能的计算集群能hold住。算力集群的“强”,由单机算力、网络、存储共同决定。就像一个牢固的木桶,缺一不可。

腾讯称,腾讯云新一代集群通过对单机算力、网络架构和存储性能进行协同优化,能够为大模型训练提供高性能、高带宽、低延迟的智算能力支撑。

计算方面,性能强——

在单点算力性能最大优化的基础上,腾讯还将不同种类的芯片组合起来,GPU+CPU,让每块芯片去最恰当的地方,做最擅长的事情。

网络方面,带宽足——

GPU擅长并行计算,一次可以做多个任务。腾讯的自研星脉高性能网络,让成千上万的GPU之间互相“通气”,信息传递又快又不堵车,打一场漂亮的配合战,大模型集群训练效率提升了20%。

存储方面,读取快——

训练大模型时,几千台服务器会同时读取一批数据集,如果加载时间过长,也会成为木桶的短板。我们的最新自研存储架构,将数据分类放进不同“容器”,用作不同的场景,读取更快更高效。

随着算力需求的陡增,自己采购GPU的价格昂贵,甚至有钱也买不到,给创业企业、中小企业带来很大压力。腾讯的新一代HCC集群,能够帮助在云上训练大模型,希望缓解他们的压力。

腾讯有训练框架AngelPTM,对内支持了腾讯混元大模型的训练,也已通过腾讯云对外提供服务,在去年10月,完成了首个万亿参数大模型训练,并将训练时间缩短80%。

腾讯的TI平台(一站式机器学习平台)拥有大模型能力和工具箱,能帮助企业根据具体场景,进行精调训练,提升生产效率,快速创建和部署 AI 应用。

腾讯的自研芯片已经量产,包括用于AI推理的紫霄芯片。它采用自研存算架构和自研加速模块,可提供高达3倍的计算加速性能和超过45%的整体成本节省。

腾讯表示,正以新一代HCC为标志,基于自研芯片、自研服务器等方式,软硬一体,打造面向AIGC的高性能智算网络。

  免责声明:本网站内容由网友自行在页面发布,上传者应自行负责所上传内容涉及的法律责任,本网站对内容真实性、版权等概不负责,亦不承担任何法律责任。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,并请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。

发布者:科技君

相关阅读

微信公众号
意见反馈 科技快报网微信公众号