NVIDIA发布全新计算卡Tesla P40/P4：帕斯卡完全体

2016-09-14 09:11:51

在北京召开的GTC 2016技术大会上，NVIDIA CEO黄仁勋亲自发布了新一代高性能计算卡Tesla P40、Tesla P4，专为人工智能、深度学习、神经网络推演而生。

它们俩将取代上代麦克斯韦架构的Tesla M40/M4，都进化到了最新的帕斯卡架构，当然也有16nm工艺。

Tesla P40基于高端大核心GP100，并且开启全部3840个流处理器(此前的Titan X只有3584个)，核心频率1303-1531MHz，FP32单精度浮点计算能力12TFlops，INT8(八位数据专用推理指令) 47TOPS，响应速度比CPU快45倍。

该卡搭配384-bit 24GB GDDR5显存，等效频率7.2Gbps，整卡功耗250W，被动散热。

顺带一提，GP100大核心的Tesla P100也只开启了3584个流处理器，完整也是3840个，搭配显存是GDDR5X。

Tesla P4的核心则是GTX 1080/1070同款的GP104，全部2560个流处理器，核心频率只有810-1063MHz，单精度性能5.5TFlops，INT8 22TOPS，搭配256-bit 6Gbps 8GB GDDR5显存，功耗50-75W，半高被动散热。

相比于前辈，它们的计算性能分别提升了70％、1.5倍，INT8特性也是首次加入，功耗则维持不变。

NVIDIA表示，Tesla P40可提供非常高的深度学习工作负载处理能力，一台配备八块Tesla P40加速器的服务器在性能上可媲美140多台CPU服务器，同时成本节省超过65万美元。

Tesla P4则可为超大规模数据中心提供极高的能效，一台配备单个Tesla P4的服务器可以取代13台CPU服务器，总体拥有成本可节省超过800％。

同时，NVIDIA还发布了两款配套的开发工具：TensorRT是为优化将部署到生产环境的深度学习模型而创建的库，能即时响应极其复杂的网络；DeepStream SDK则利用帕斯卡务器的强大功能同时，对最多达93路的高清视频流进行实时解码和分析。

Tesla P40/P4将分别在10月、11月发货给相关OEM、ODM厂商。

　　免责声明：本网站内容由网友自行在页面发布，上传者应自行负责所上传内容涉及的法律责任，本网站对内容真实性、版权等概不负责，亦不承担任何法律责任。其原创性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，并请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

发布者:admin

AMD这六年进步了多少？6款中端卡性能对比显卡神器GPU-Z 1.11版发布：NVIDIA好尴尬

		自动登录	找回密码
密码			立即注册

NVIDIA发布全新计算卡Tesla P40/P4：帕斯卡完全体

相关阅读

相关分类

热门关注