近日(4月12日),雷锋网受邀参加了英伟达在北京国家会议中心举行媒体发布会。会上英伟达展示了其发布不久的基于Pascal架构的Quadro系列显卡,包括:GP100、P2000、P4000、P5000、P6000等。 不同于Geforce的消费级娱乐定位,Quadro立足高端,面向专业级的需求,英伟达的愿景是让它们能够将台式工作站转变为具有突破性能力的超级计算机,并为不同行业的专业任务提供保障。
Pascal架构的全新NVIDIAQuadro产品阵容致力于为企业提供视觉计算平台,简化设计和仿真工作流程。与上一代产品相比,新Quadro产品不仅具有超快速内存,而且速度最多可以提升两倍(基于SPECviewperf12基准的计算结果)。 其中GP100为该系列的旗舰产品,被科技媒体和粉丝们称为超当量核弹。 QuadroGP100参数及系列特点 GP100 GP100基于Pascal核心,匹配16GBHBM2显存,单精度CUDA核心数 3584个,双精度CUDA核心数1792个,半精/单精/双精浮点运算性能分别是20TFLOPS、10TFLOPS和5TFLOPS,带宽高达720GB/s,功耗235W。同其他新发布的专业卡一样,它的性能提升也是全方面的(比如同步多重投影、VRWorks、IrayVR),同时还强化了虚拟化、SyncII、双路NVlink等。 这也是NVlink首次在Windows系统上获得支持,此前仅仅用于IBMPower8系统和基于Linux的DGX-1,带宽最高80GB/s。 这个系列官方给出的特点如下: 统一仿真、HPC、渲染和设计:GP100将前所未有的双精度性能与16GB的高带宽内存(HBM2)相结合,因此用户可以在设计过程中进行仿真,并以前所未有的速度采集逼真的多物理场仿真。客户能够将两个GP100GPU与NVLink技术相结合,并扩展到32GB的HBM2,以在单一工作站上创建庞大的可视化计算解决方案。
探索深度学习:GP100提供超过20TFLOPS的半精度计算,可谓在Windows和Linux环境中进行深度学习的理想开发平台。 将VR集成到设计和仿真工作流程中:VR认证的QuadroGP100和P4000具有创建详细、逼真、沉浸式环境的能力,能够大规模实现更加宏大、更加复杂的设计体验。 尽享照片级真实感设计的优势:基于Pascal架构的QuadroGPU渲染照片级真实感图像的速度为CPU的18倍。 创建广阔的可视化工作区:可在多达四个5K显示器上以高分辨率和HDR颜色显示数据。 经济高效地构建超高分辨率及多显示屏配置:通过将多达8个P4000GPU和两个QuadroSyncII显卡相结合,可通过单一机箱实现多达32个4K显示器的配置。 GPU在CAE上的应用
CA(ComputerAidedEngineering)指工程设计中的计算机辅助工程。英伟达专业可视化业务高级总监 SandeepGupte 表示: 对于这部分用户,大部分是使用类似Ansys、ABAQUS等分析软件求解复杂工程和产品的结构力学性能。大规模的数据计算往往让设计分析的过程十分漫长,而如果使用CPU+GPU加速的方案将会大大的节省运算时间。 GPU加速计算是指在完成应用任务时,同时利用GPU和CPU。由于GPU出色的并行任务处理能力,将应用程序中计算密集部分的工作负载转移到GPU,同时仍由CPU运行其余程序代码。这样,从用户的角度来看,应用程序 流言终结者中有一段很有意思的视频,为我们直观的展示了相比于CPU,GPU的的运行速度明显加快。并行计算为什么有如此令人震撼的优势。 视频:点此观看 Sandeep举了个实际的例子,在现场一个集成了一张GP100的工作站里,工作人员使用ABAQUS对一个模型进行了470万的网格划分和计算,由于时间关系,现场并未将计算完成。正是因为类似这样大规模的计算,往往需要运行数十个小时甚至是数十天才能完成。 不过Sandeep告诉雷锋网,相比仅使用CPU计算的方案,GPU加速可以将计算时间将缩短为原来的1/3。 |
免责声明:本网站内容由网友自行在页面发布,上传者应自行负责所上传内容涉及的法律责任,本网站对内容真实性、版权等概不负责,亦不承担任何法律责任。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,并请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。