找回密码
 立即注册
科技快报网 首页 科技快报 业界资讯 查看内容

英伟达的GTC大会:2小时发布5大AI新品 股价暴涨17%

2017-05-11 13:12:38

英伟达的GTC大会:2小时发布5大AI新品 股价暴涨17%

 

演示中,有两个细节值得我们注意:

当VR化身触摸方向盘时,其“手掌”并不会像网游那样穿过方向盘,而是能实实在在地握住它。雷锋网获知,用户还能在Project Holodeck里举起东西。这充分展示了“物理交互”。

Project Holodeck导入了科尼塞克最新车型(上图)的全部三维数据——不仅仅是外观,还有内饰、零件。随老黄一声令下,整部车分解成一个个的独立零件;展示了让VR“不止于社交”的可能性。

Project Holodeck将于9月开放体验。

Volta架构

没错,Volta终于来了。继Pascal(帕斯卡)之后的新一代GPU架构,在万众期待下亮相。对于绝大多数观众,不论GTC推出了多少AI工具,都无法遮掩Volta作为本届大会心脏的事实。

毕竟,英伟达今后二至三年的GPU产品线,全都要由Volta供血。虽然Volta架构的游戏显卡最快在今年底才可能与大家见面,但通过深度学习卡,也可一窥Volta的满血性能。那么在本届GTC,英伟达推出了哪些基于Volta的产品?

答案是Tesla V100,以及基于它的深度学习计算机DGX-1和DGX Station。

Tesla V100

“迄今为止英伟达难度最高、最复杂的项目;

耗费数千工程师数年光阴来完成;

全世界有史以来最昂贵的计算机项目(研发支出为30亿美元)。”

说的就是Tesla V100,基于新一代Volta架构。但英伟达在它身上实现的壮举远不止与此:

Tesla V100的芯片面积是惊人的815平方毫米,约等于一块Apple Watch,真正达到光刻技术的极限。老黄说:“不可能做出比这再大的GPU芯片……我把这看做是几乎‘不可能实现的’,是制造技术的一项不可思议的惊人绩业。” 

来自三星的16GB HBM2显存,带宽达到惊人的900 GB/s。

详细规格见下图:

Tensor Core

相比Pascal,Volta有全新的张量运算指令,这就是Tensor Core。

它既是指令也是数据格式,是4*4的矩阵处理阵列。它使得Volta的训练吞吐量达到了Pascal的12倍,推理吞吐量达到6倍。借助它,Tesla V100的张量运算能力达到120 TFLOPS。

TensorRT

它是Volta的高性能神经网络推理引擎,或者说编译器。目的是为推理运算快速地优化、验证、部署训练好的神经网络。

老黄解释道:“训练完成之后,用于训练神经网络的框架会生成图。图需要为你使用的处理器进行优化、编译。我们把这称为TensorRT。”

面向推理(inference)

众所周知,深度学习运算可被分为训练和推理两部分。从前,N卡只关注训练,而在Tesla V100上,英伟达终于对推理“动真格”。老黄表示,从Volta开始,英伟达GPU将对训练、推理兼顾,可谓是革命性的突破。如图所示,Tesla V100的推理运算速度是Skylake CPU的十余倍不止。CPU、FPGA和TPU们怕了么? 

  免责声明:本网站内容由网友自行在页面发布,上传者应自行负责所上传内容涉及的法律责任,本网站对内容真实性、版权等概不负责,亦不承担任何法律责任。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,并请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。

发布者:admin

相关阅读

微信公众号
意见反馈 科技快报网微信公众号