找回密码
 立即注册
科技快报网 首页 科技快报 快报 查看内容
Formnext 2025:歌尔光学展示高精度3D打印及视觉检测全方案高频科技一体式智能超纯水系统:高纯度水质短周期交付BOE(京东方)“焕新2026”年终媒体智享会首站落地上海 AI焕新重塑显示行业新范式天玑座舱 S1 Ultra,3nm 旗舰座舱芯片为深蓝 L06 赋予越级智慧!华为乾崑生态大会即将启幕,MoLA重塑智能座舱发展方向酷学院AI Learning重磅发布:五大AI Agent重塑企业培训学习新模式营销新主力,上场!「智屏视界」重磅发布,开启OTT营销新纪元光轮智能完成数亿元 A 轮及 A+ 轮融资,华兴资本担任独家财务顾问当算力追逐遇上数据瓶颈:DRAM成AI价值链重构的战略中枢东软集团与福州新区签约 数据价值化研发中心同步揭牌追《水龙吟》超上头!不需要花钱开会员,鸿蒙有礼让我免费薅广汽昊铂首获时速120公里L3高速测试牌照,高阶智驾迈入实用化新阶段谷歌于Gemini 3系列大模型发布《渡神纪:芬尼斯崛起》免费送 华硕B850主板带你喜加一软通华方:一个新品牌的第29年,锚定中国智算“领军路”以技术远见构建未来体验 三星Galaxy手机加速移动AI普及海优威:让玻璃学会“思考”——PDLC调光膜的三次技术跃迁国际权威认证:东软荣获PMI(中国)项目管理大奖DTC2025|TCL华星印刷OLED小尺寸突破,全产业技术创新布局“华为影像XMAGE·金鸡手机电影计划”荣誉揭晓 以影像续写电影梦

当64核遇上PCIe 4.0 超级算力是这样建成的

2020-09-24 08:41:23 来自: IT168辛文辉

我们现在的时代正处于一场算力革命中,大数据、5G、AI人工智能、云计算等领域都对高性能提出了更高的要求,基于所有数据的分析和最终决策都需要高性能计算,这是未来的一片蓝海。

今天AMD这样的公司已经可以从多个方面来提高算力,其中最关键的部分依然是高性能CPU。AMD CEU苏姿丰此前在接受采访时表示,AMD的使命是提供解决方案,让所有用户都能利用高性能计算来解决世界上一些最有趣和最棘手的挑战。

针对高性能计算,AMD自从推出Zen架构以来的三年里,最重要的动作就是新一代EPYC 7002系列处理器,它不仅从上代的14nm工艺升级到了7nm工艺,同时还从32核升级到了64核,并带来了PCIe 4.0总线,使得高性能计算算力大涨的同时,还解决了I/O的瓶颈,可以灵活搭配新一代GPU、网络卡等,系统性地提升了算力。

EPYC 7002系列处理器使用了Zen2架构,这一代最重要的三个特点就是继续提升性能、工艺升级改善能效,同时提高CPU并行能力——更多核心、更多IO等。

Zen2架构升级:IPC性能大涨、浮点运算能力翻倍

自从2017年推出第一代Zen架构以来,AMD在处理器性能上已经鱼跃龙门,Zen相比之前的CPU就提升了52%的IPC性能提升,远超业界水平。

此后AMD的路线图中,Zen架构持续不断优化,不论单核还是多核,性能一直在稳步增长,在Zen2上,AMD依然提升了15%的单核IPC性能,同时优化了多核并行能力,更容易扩展。

在具体架构上,Zen2上继承了Zen架构的CCX+IF总线+SMT多线程技术,同时在分支预测、缓存系统、整数、浮点等单元上做了改进,并加入了新的指令,提升了安全性。

最终的结果达到或者说超过了AMD的预期,IPC性能提升15%,浮点运算能力翻倍,频率达提升到4.7GHz+。

最终在性能上,多核性能更因为翻倍的核心数而大幅领先,性能最多可以翻倍。

7nm工艺+chiplets小芯片设计:首发64核128线程、算力翻倍不是梦

在第二代EPYC处理器上,除了Zen2架构在性能上的大量改进,AMD还在业界首发了7nm CPU,先进工艺的加入也让EPYC 7002系列处理器脱胎换骨,核心面积更小,同样的功耗下性能提升25%,或者同样的性能下功耗降低了50%。

光有这些还不够,EPYC 7002最终能够实现64核的奇迹还离不开另外一项技术的运用——Chiplets混合小芯片设计,简单来说就是将多个芯片集成到一颗处理器里。

具体到EPYC 7002处理器中,它实际上就是由8组CCD核心、1组IOD核心组成,前者就是CPU核心,每个CCD内有8个CPU内核+32MB L3缓存,7nm工艺制造,总核心面积74mm2,集成38亿晶体管。

IOD就是专用的IO核心,集成了DDR、PCIe等子单元,有桌面版及服务器版两种,搭配的PCIe 4.0通道、内存主控是不同的,服务器版IOD核心面积高达416mm2,更为庞大。

采用Chiplets小芯片设计,一方面是可以将CPU、IO核心分离,分别使用不同的工艺,然后灵活搭配,避免单一大核心的制造难题,因为目前的工艺水平下,制造单一核心的64核处理器面临着很多困难,成本、良率很难控制。

根据AMD之前的数据,如果将16核32线程的锐龙3代作为100%基准,那么采用原生核心的16核处理器成本将超过2,至少是两倍的成本。

如果是EPYC霄龙处理器,那么核心数越多,成本优势就越明显,64核7nm锐龙作为基准的话,那么48核的成本就是0.9,而原生48核设计的成本至少是1.9,依然是两倍水平,而64核设计几乎就是传统CPU工艺的死穴了,几乎没法制造。

最终,第二代AMD EPYC 7002系列处理器,通过采用革命性的Chiplets小芯片设计,克服了制造工艺和成本的挑战,为x86服务器带来了高达64核心128线程的超强算力!

One More Thing:128条PCIe 4.0通道给高性能计算插上翅膀

全新的Zen2架构、7nm工艺、64核128线程几乎就是整个EPYC 7002系列处理器的超高起点了,上面每一点都是领先业界的,对手在短时间内都没做到,但它还不是EPYC 7002处理器的全部。

在EPYC 7002处理器上,AMD还重点提升了IO设计。在当前的高性能计算中,IO瓶颈实际上要比CPU性能瓶颈更为严重,提升整体的算力不能忽视IO部分,否认很难发挥出64核128线程的强大性能。

在EPYC 7002处理器上,AMD提供了128条PCIe 4.0通道,数量及技术双双创造了记录,这是目前已商用的处理器中最为强大的,因为PCIe 4.0能够提供2倍的PCIe 3.0性能,总带宽高达128GB/s,双向可达256GB/s。

128PCIe 4.0可以让EPYC 7002系列的服务器连接更多更强的GPU加速卡或者NVMe设备。从实际测试来看,在3DMark的PCIe功能测试中,PCIe 4.0比上代性能提升了70%,CDM硬盘性能也提升了35%到50%,优势明显。

在64核及PCIe 4.0的两大独有优势下,AMD的EPYC 7002处理器已经获得新一代小型超算DGX-A100的认可——这是老对手NVIDIA的产品,但在选择芯片时,也只有EPYC 7002中的旗舰EPYC 7742才符合选择,因为它可以支持双路128核256线程、PCIe 4.0加持的15.36TB NVMe硬盘。

除了新一代服务器、工作站之外,AMD的EPYC 7002处理器这一年来收获不菲,在多个高性能计算系统中已经大显身手,包括全球超快的两台百亿亿次级超级计算机Frontier、EI Captian,都有EPYC霄龙的身影,以及AMD Radeon Instinct加速卡,都是受益于64核128线程及PCIe 4.0的强大。

总之,在高性能计算这个方向上,AMD的EPYC 7002系列处理器正在创造奇迹,从发布到现在以来,凭借64核128线程、PCIe 4.0的专属优势,它在各大性能测试中已经斩获了超过170项世界记录,目前还在持续增长中。

凭借这些优势,AMD的EPYC已经从高性能计算的起跑点领先。正如AMD CEO苏姿丰之前在采访中说的那样,2020年将是高性能计算的一年。无论你是企业客户还是还是个人用户,从更高核心到更宽IO全方位系统性提升的高性能计算都将改变未来的工作和生活。

  免责声明:本网站内容由网友自行在页面发布,上传者应自行负责所上传内容涉及的法律责任,本网站对内容真实性、版权等概不负责,亦不承担任何法律责任。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,并请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。

发布者:sophia

相关阅读

微信公众号
意见反馈 科技快报网微信公众号