找回密码
 立即注册
科技快报网 首页 科技快报 快报 查看内容
北森推出AI+HR成熟度模型,发布《中国企业人力资源数智化成熟度模型与实践白皮书》荣膺“北斗天枢贡献奖” 东软与长安汽车共绘智能出行新蓝图3.99万美元击穿行业底价!快轮科技超轻型飞行器CES发布,无需驾照即可飞行2026年成者12周年战略新品发布会,AI会议机器人重磅亮相TTi Sound AI全景声入选机器之心2025年度AI榜单全球首个机器人唱跳舞台来了!王心凌携手智元灵犀X2亮相京东跨晚融和科技RonAgent:开启中小企业智能管理“平权”时代联想LTPC 2025:“天禧AI生态智能体先导计划”赋能开发者掘金智能体个人AI时代京东推动游戏电视3.0标准体系完善 产业生态加速升级vivo X300 大卖的性能因素更智慧更安全,华为擎云 HM740带来企业办公创新体验更智慧更安全,华为擎云 HM740带来企业办公创新体验京东家电家居暖心站台为大连一线劳动者送温暖 购取暖器享年终好价阿里云ECS AMD实例年终狂欢,算力成本最多立省75%高通孟樸:AI正成为新的UI,用户交互体验转向以智能体为中心东软斩获2025“数据要素X”大赛医疗保障赛道多项大奖安谋科技出席IIC 2025全球CEO峰会,“周易”NPU荣获年度IP产品大奖HUAWEI Mate系列全新发布!超能小艺实力破圈,有事轻松搞定三项升级,双超体验!维信诺全系供货荣耀500系列,独供荣耀500Pro伊利亮相世界乳业峰会 展示中国乳业可持续发展“绿色答卷”

当64核遇上PCIe 4.0 超级算力是这样建成的

2020-09-24 08:41:23 来自: IT168辛文辉

我们现在的时代正处于一场算力革命中,大数据、5G、AI人工智能、云计算等领域都对高性能提出了更高的要求,基于所有数据的分析和最终决策都需要高性能计算,这是未来的一片蓝海。

今天AMD这样的公司已经可以从多个方面来提高算力,其中最关键的部分依然是高性能CPU。AMD CEU苏姿丰此前在接受采访时表示,AMD的使命是提供解决方案,让所有用户都能利用高性能计算来解决世界上一些最有趣和最棘手的挑战。

针对高性能计算,AMD自从推出Zen架构以来的三年里,最重要的动作就是新一代EPYC 7002系列处理器,它不仅从上代的14nm工艺升级到了7nm工艺,同时还从32核升级到了64核,并带来了PCIe 4.0总线,使得高性能计算算力大涨的同时,还解决了I/O的瓶颈,可以灵活搭配新一代GPU、网络卡等,系统性地提升了算力。

EPYC 7002系列处理器使用了Zen2架构,这一代最重要的三个特点就是继续提升性能、工艺升级改善能效,同时提高CPU并行能力——更多核心、更多IO等。

Zen2架构升级:IPC性能大涨、浮点运算能力翻倍

自从2017年推出第一代Zen架构以来,AMD在处理器性能上已经鱼跃龙门,Zen相比之前的CPU就提升了52%的IPC性能提升,远超业界水平。

此后AMD的路线图中,Zen架构持续不断优化,不论单核还是多核,性能一直在稳步增长,在Zen2上,AMD依然提升了15%的单核IPC性能,同时优化了多核并行能力,更容易扩展。

在具体架构上,Zen2上继承了Zen架构的CCX+IF总线+SMT多线程技术,同时在分支预测、缓存系统、整数、浮点等单元上做了改进,并加入了新的指令,提升了安全性。

最终的结果达到或者说超过了AMD的预期,IPC性能提升15%,浮点运算能力翻倍,频率达提升到4.7GHz+。

最终在性能上,多核性能更因为翻倍的核心数而大幅领先,性能最多可以翻倍。

7nm工艺+chiplets小芯片设计:首发64核128线程、算力翻倍不是梦

在第二代EPYC处理器上,除了Zen2架构在性能上的大量改进,AMD还在业界首发了7nm CPU,先进工艺的加入也让EPYC 7002系列处理器脱胎换骨,核心面积更小,同样的功耗下性能提升25%,或者同样的性能下功耗降低了50%。

光有这些还不够,EPYC 7002最终能够实现64核的奇迹还离不开另外一项技术的运用——Chiplets混合小芯片设计,简单来说就是将多个芯片集成到一颗处理器里。

具体到EPYC 7002处理器中,它实际上就是由8组CCD核心、1组IOD核心组成,前者就是CPU核心,每个CCD内有8个CPU内核+32MB L3缓存,7nm工艺制造,总核心面积74mm2,集成38亿晶体管。

IOD就是专用的IO核心,集成了DDR、PCIe等子单元,有桌面版及服务器版两种,搭配的PCIe 4.0通道、内存主控是不同的,服务器版IOD核心面积高达416mm2,更为庞大。

采用Chiplets小芯片设计,一方面是可以将CPU、IO核心分离,分别使用不同的工艺,然后灵活搭配,避免单一大核心的制造难题,因为目前的工艺水平下,制造单一核心的64核处理器面临着很多困难,成本、良率很难控制。

根据AMD之前的数据,如果将16核32线程的锐龙3代作为100%基准,那么采用原生核心的16核处理器成本将超过2,至少是两倍的成本。

如果是EPYC霄龙处理器,那么核心数越多,成本优势就越明显,64核7nm锐龙作为基准的话,那么48核的成本就是0.9,而原生48核设计的成本至少是1.9,依然是两倍水平,而64核设计几乎就是传统CPU工艺的死穴了,几乎没法制造。

最终,第二代AMD EPYC 7002系列处理器,通过采用革命性的Chiplets小芯片设计,克服了制造工艺和成本的挑战,为x86服务器带来了高达64核心128线程的超强算力!

One More Thing:128条PCIe 4.0通道给高性能计算插上翅膀

全新的Zen2架构、7nm工艺、64核128线程几乎就是整个EPYC 7002系列处理器的超高起点了,上面每一点都是领先业界的,对手在短时间内都没做到,但它还不是EPYC 7002处理器的全部。

在EPYC 7002处理器上,AMD还重点提升了IO设计。在当前的高性能计算中,IO瓶颈实际上要比CPU性能瓶颈更为严重,提升整体的算力不能忽视IO部分,否认很难发挥出64核128线程的强大性能。

在EPYC 7002处理器上,AMD提供了128条PCIe 4.0通道,数量及技术双双创造了记录,这是目前已商用的处理器中最为强大的,因为PCIe 4.0能够提供2倍的PCIe 3.0性能,总带宽高达128GB/s,双向可达256GB/s。

128PCIe 4.0可以让EPYC 7002系列的服务器连接更多更强的GPU加速卡或者NVMe设备。从实际测试来看,在3DMark的PCIe功能测试中,PCIe 4.0比上代性能提升了70%,CDM硬盘性能也提升了35%到50%,优势明显。

在64核及PCIe 4.0的两大独有优势下,AMD的EPYC 7002处理器已经获得新一代小型超算DGX-A100的认可——这是老对手NVIDIA的产品,但在选择芯片时,也只有EPYC 7002中的旗舰EPYC 7742才符合选择,因为它可以支持双路128核256线程、PCIe 4.0加持的15.36TB NVMe硬盘。

除了新一代服务器、工作站之外,AMD的EPYC 7002处理器这一年来收获不菲,在多个高性能计算系统中已经大显身手,包括全球超快的两台百亿亿次级超级计算机Frontier、EI Captian,都有EPYC霄龙的身影,以及AMD Radeon Instinct加速卡,都是受益于64核128线程及PCIe 4.0的强大。

总之,在高性能计算这个方向上,AMD的EPYC 7002系列处理器正在创造奇迹,从发布到现在以来,凭借64核128线程、PCIe 4.0的专属优势,它在各大性能测试中已经斩获了超过170项世界记录,目前还在持续增长中。

凭借这些优势,AMD的EPYC已经从高性能计算的起跑点领先。正如AMD CEO苏姿丰之前在采访中说的那样,2020年将是高性能计算的一年。无论你是企业客户还是还是个人用户,从更高核心到更宽IO全方位系统性提升的高性能计算都将改变未来的工作和生活。

  免责声明:本网站内容由网友自行在页面发布,上传者应自行负责所上传内容涉及的法律责任,本网站对内容真实性、版权等概不负责,亦不承担任何法律责任。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,并请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。

发布者:sophia

相关阅读

微信公众号
意见反馈 科技快报网微信公众号