找回密码
 立即注册
科技快报网 首页 数码 数码外设 查看内容

12倍于上代的DP性能 NVIDIA Volta架构解析

2017-05-17 00:42:00

NVIDIA Volta架构,一个在几年前便已经被曝光的次世代架构,于上周的GTC 2017大会上正式与大家见面。正如老黄去年所说的,NVIDIA未来会大幅提高产品的迭代速度以推动GPU界的发展,Volta架构的发布时间正好距Pascal架构的发布过了一年。在这短短的一年时间里,老黄将整个Pascal家族悉数抖落,以大家最熟悉的GeForce系列游戏卡为例,从GT 1030到GTX 1080 Ti可谓是高中低档应有尽有,比Maxwell 2家族的集体亮相整整快了约一年。

为什么NVIDIA能够做到短短一年便推出新架构产品?因为与AMD的拖延相比,NVIDIA严格按照自家的产品路线图发布产品,虽然受限于HBM显存的产能,NVIDIA在Maxwell和Volta之间加了一个Pascal作为过渡,但Pascal的表现却不敷衍,完全称得上是GPU史上的一个里程碑,因为NVIDIA的Pascal显卡让GPU的频率首次突破2GHz大关,在超频大师的手中甚至可以超过3GHz,追上了CPU的主频,这在以前是完全不敢想象的。


采用Volta架构的首款产品是NVIDIA Xavier SOC

现在GPU讲究的是能耗比,不再像以前一样单纯追求绝对性能,而采用了TSMC全新12nm的Volta让我们看到了能耗比的新高度:首发产品Tesla V100同P100相比,在TDP同为300W的情况下,单精度浮点运算性能提升了41.5%,实际HPC应用性能提升了40-70%,凭借架构中新引入的Tensor单元,在深度学习方面的性能甚至可以达到后者的12倍!


NVIDIA Tesla V100

我们上周在第一时间报道了有关Tesla V100的相关消息,但大家能看到的只是诸如815平方毫米的核心面积、210亿个晶体管、5120个CUDA核心、15TFLOPS单精度性能这样的专业数据,但我相信大家都很好奇Volta同Pascal相比究竟有了哪些设计方面的提升和改变,接下来吉吉我就用相对通俗易懂的语言来给大家细细道来,让大家看看老黄的“新核弹”究竟是怎样一个构造。

外观:PCI-E版身材迷你

同采用Pascal架构的Tesla P100一样,Volta P100也有2种版本,一种是用在DGX-1上的NVLink版,还有一种是标准的PCI-E版,两种版本的规格是一模一样的。首先我们看一下NVLink版的V100和P100对比:


上图为Tesla V100,下图为Tesla P100

由于V100和P100的TDP均为300W,并且都是使用了16GB的HBM2显存,所以NVLink版的PCB的设计几乎是一模一样的,仅仅是料件型号和排布上有些微区别。另外,需要强调的是,V100使用的是全新的NVLink 2接口,比NVLink多了2组通道,双向总带宽达300GB/s,比NVLink提升了87.5%。接下来我们看一下PCI-E版的对比:


上图为Tesla V100,下图为Tesla P100

PCI-E版的Tesla V100同P100相比,体积可谓是大大缩小,不仅从双槽厚度变成了单槽,PCB也从标准长度缩到了巴掌大小,比NVLink版的大不了多少。真是不知道老黄是如何做到用这么“寒酸”的被动散热压制住TDP高达300W的“性能巨兽”的,只能期待NVIDIA后续的详细介绍了。

  免责声明:本网站内容由网友自行在页面发布,上传者应自行负责所上传内容涉及的法律责任,本网站对内容真实性、版权等概不负责,亦不承担任何法律责任。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,并请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。

发布者:admin

相关阅读

微信公众号
意见反馈 科技快报网微信公众号