找回密码
 立即注册
科技快报网 首页 科技快报 快报 查看内容
鸿蒙5终端突破2000万!超百家伙伴齐贺,近20家伙伴携手带来“鸿蒙有礼特别版”数字人惊艳2025云栖大会!NuwaAI开创“真人+数字人”搭档协作新模式腕上米兰时装周惠聚京东 时尚智能手表享国补再叠12期免息猛士M817 Max+版新款上市,如何用“超200km纯电续航+顶级智驾”构建代差级领先?科脉云帆OS平台:以产品力重构零售结算生态从3G、4G到5G,高通孟樸回顾携手中国伙伴30年发展历程长城汽车魏建军:反对内卷和过度夸张营销,高管在发布会上若过度夸张宣传,回来受处分从“人找信息”到“信息追人”:鸿蒙5实况窗让出行“一眼安心”国庆宅家新潮流,让小艺当你的贴心家教与专属摄影师工博会技术深观察:加特兰如何用感知通信融合破解辅助驾驶难题当可以“玩”的电子家具成为情绪充电站,情绪经济推动下的产品变革为放心消费加码!箭牌瓷砖主编《佛山陶瓷放心消费品牌规范》英特尔联动「扣子 AI 工坊」启动高校计划——让校园创意一键开挂从优篮子到 JOBY:唯迹科技的全球化成长之路哈曼携手高通,助推汽车生成式AI跃迁华为坤灵发布IdeaHub千行百业体验官计划,助力中小企业跃升智能化天玑9500征服《崩坏:星穹铁道》,实测57.64FPS,功耗6W出头哈曼完成对 Sound United收购,强化高端音频领域领导地位戴尔科技:从“模型驱动”到“数据驱动”,重塑企业智能化转型新范式企业新型生产力平台ZENAVA正式发布,AI员工全面落地客服与营销场景

当64核遇上PCIe 4.0 超级算力是这样建成的

2020-09-24 08:41:23 来自: IT168辛文辉

我们现在的时代正处于一场算力革命中,大数据、5G、AI人工智能、云计算等领域都对高性能提出了更高的要求,基于所有数据的分析和最终决策都需要高性能计算,这是未来的一片蓝海。

今天AMD这样的公司已经可以从多个方面来提高算力,其中最关键的部分依然是高性能CPU。AMD CEU苏姿丰此前在接受采访时表示,AMD的使命是提供解决方案,让所有用户都能利用高性能计算来解决世界上一些最有趣和最棘手的挑战。

针对高性能计算,AMD自从推出Zen架构以来的三年里,最重要的动作就是新一代EPYC 7002系列处理器,它不仅从上代的14nm工艺升级到了7nm工艺,同时还从32核升级到了64核,并带来了PCIe 4.0总线,使得高性能计算算力大涨的同时,还解决了I/O的瓶颈,可以灵活搭配新一代GPU、网络卡等,系统性地提升了算力。

EPYC 7002系列处理器使用了Zen2架构,这一代最重要的三个特点就是继续提升性能、工艺升级改善能效,同时提高CPU并行能力——更多核心、更多IO等。

Zen2架构升级:IPC性能大涨、浮点运算能力翻倍

自从2017年推出第一代Zen架构以来,AMD在处理器性能上已经鱼跃龙门,Zen相比之前的CPU就提升了52%的IPC性能提升,远超业界水平。

此后AMD的路线图中,Zen架构持续不断优化,不论单核还是多核,性能一直在稳步增长,在Zen2上,AMD依然提升了15%的单核IPC性能,同时优化了多核并行能力,更容易扩展。

在具体架构上,Zen2上继承了Zen架构的CCX+IF总线+SMT多线程技术,同时在分支预测、缓存系统、整数、浮点等单元上做了改进,并加入了新的指令,提升了安全性。

最终的结果达到或者说超过了AMD的预期,IPC性能提升15%,浮点运算能力翻倍,频率达提升到4.7GHz+。

最终在性能上,多核性能更因为翻倍的核心数而大幅领先,性能最多可以翻倍。

7nm工艺+chiplets小芯片设计:首发64核128线程、算力翻倍不是梦

在第二代EPYC处理器上,除了Zen2架构在性能上的大量改进,AMD还在业界首发了7nm CPU,先进工艺的加入也让EPYC 7002系列处理器脱胎换骨,核心面积更小,同样的功耗下性能提升25%,或者同样的性能下功耗降低了50%。

光有这些还不够,EPYC 7002最终能够实现64核的奇迹还离不开另外一项技术的运用——Chiplets混合小芯片设计,简单来说就是将多个芯片集成到一颗处理器里。

具体到EPYC 7002处理器中,它实际上就是由8组CCD核心、1组IOD核心组成,前者就是CPU核心,每个CCD内有8个CPU内核+32MB L3缓存,7nm工艺制造,总核心面积74mm2,集成38亿晶体管。

IOD就是专用的IO核心,集成了DDR、PCIe等子单元,有桌面版及服务器版两种,搭配的PCIe 4.0通道、内存主控是不同的,服务器版IOD核心面积高达416mm2,更为庞大。

采用Chiplets小芯片设计,一方面是可以将CPU、IO核心分离,分别使用不同的工艺,然后灵活搭配,避免单一大核心的制造难题,因为目前的工艺水平下,制造单一核心的64核处理器面临着很多困难,成本、良率很难控制。

根据AMD之前的数据,如果将16核32线程的锐龙3代作为100%基准,那么采用原生核心的16核处理器成本将超过2,至少是两倍的成本。

如果是EPYC霄龙处理器,那么核心数越多,成本优势就越明显,64核7nm锐龙作为基准的话,那么48核的成本就是0.9,而原生48核设计的成本至少是1.9,依然是两倍水平,而64核设计几乎就是传统CPU工艺的死穴了,几乎没法制造。

最终,第二代AMD EPYC 7002系列处理器,通过采用革命性的Chiplets小芯片设计,克服了制造工艺和成本的挑战,为x86服务器带来了高达64核心128线程的超强算力!

One More Thing:128条PCIe 4.0通道给高性能计算插上翅膀

全新的Zen2架构、7nm工艺、64核128线程几乎就是整个EPYC 7002系列处理器的超高起点了,上面每一点都是领先业界的,对手在短时间内都没做到,但它还不是EPYC 7002处理器的全部。

在EPYC 7002处理器上,AMD还重点提升了IO设计。在当前的高性能计算中,IO瓶颈实际上要比CPU性能瓶颈更为严重,提升整体的算力不能忽视IO部分,否认很难发挥出64核128线程的强大性能。

在EPYC 7002处理器上,AMD提供了128条PCIe 4.0通道,数量及技术双双创造了记录,这是目前已商用的处理器中最为强大的,因为PCIe 4.0能够提供2倍的PCIe 3.0性能,总带宽高达128GB/s,双向可达256GB/s。

128PCIe 4.0可以让EPYC 7002系列的服务器连接更多更强的GPU加速卡或者NVMe设备。从实际测试来看,在3DMark的PCIe功能测试中,PCIe 4.0比上代性能提升了70%,CDM硬盘性能也提升了35%到50%,优势明显。

在64核及PCIe 4.0的两大独有优势下,AMD的EPYC 7002处理器已经获得新一代小型超算DGX-A100的认可——这是老对手NVIDIA的产品,但在选择芯片时,也只有EPYC 7002中的旗舰EPYC 7742才符合选择,因为它可以支持双路128核256线程、PCIe 4.0加持的15.36TB NVMe硬盘。

除了新一代服务器、工作站之外,AMD的EPYC 7002处理器这一年来收获不菲,在多个高性能计算系统中已经大显身手,包括全球超快的两台百亿亿次级超级计算机Frontier、EI Captian,都有EPYC霄龙的身影,以及AMD Radeon Instinct加速卡,都是受益于64核128线程及PCIe 4.0的强大。

总之,在高性能计算这个方向上,AMD的EPYC 7002系列处理器正在创造奇迹,从发布到现在以来,凭借64核128线程、PCIe 4.0的专属优势,它在各大性能测试中已经斩获了超过170项世界记录,目前还在持续增长中。

凭借这些优势,AMD的EPYC已经从高性能计算的起跑点领先。正如AMD CEO苏姿丰之前在采访中说的那样,2020年将是高性能计算的一年。无论你是企业客户还是还是个人用户,从更高核心到更宽IO全方位系统性提升的高性能计算都将改变未来的工作和生活。

  免责声明:本网站内容由网友自行在页面发布,上传者应自行负责所上传内容涉及的法律责任,本网站对内容真实性、版权等概不负责,亦不承担任何法律责任。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,并请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。

发布者:sophia

相关阅读

微信公众号
意见反馈 科技快报网微信公众号