两个月前,在NVIDIA GTC 2021峰会上,NVIDIA正式发布了新一代数据处理器NVIDIA BlueField-3 DPU,为数据中心提供强大的软件定义网络、存储和网络安全加速功能。 两个月后,笔者有幸采访到了NVIDIA网络事业部亚太区市场开发高级总监宋庆春和UCloud资深技术专家马彦青,听两位跟我们分享了NVIDIA DOCA是如何实现从BlueField-3芯片级数据中心到三U一体超大规模数据中心的统一架构,以及UCloud基于NVIDIA DOCA生态的技术实践。 为什么NVIDIA要推出DPU? 随着AI技术的普及和数据量爆发性增长,数据中心正在发生变革。从传统的冯·诺依曼架构的数据中心转向以数据为中心的架构,数据在网络通信过程中,很多通信模型会制约整个系统性能的发展,这就给我们提出了一个新的挑战--如何继续提升数据中心性能。 网络计算以数据为中心的新的架构,帮我们解决了这个问题。以数据为中心的新的架构,意味着数据在哪里,计算就在那里;当数据在GPU上,计算就在GPU上;当数据在CPU上,计算就在CPU上;当数据在网络中传输的时候,计算就在网络中。 通过这样的方式就可以解决网络传输中多打一的瓶颈问题或丢包问题。新的架构可以使通信延时降低10倍以上。所以,网络计算成为我们现在以数据为中心这种核心计算架构的关键技术之一。 NVIDIA网络事业部亚太区市场开发高级总监宋庆春表示:“DPU的出现为以数据为中心的计算架构提供了非常创新的思路。以OVS操作为例,当我们run OVS在CPU上,会消耗很多CPU的核,但运行OVS的效率非常低,如果要把OVS操作放在DPU上可以把这个包转发率大幅度提升,而把CPU利用率大大地降低。” BlueField-3构建下一代安全数据中心计算单元 据宋庆春介绍,BlueField-3是业界第一款400G速度的DPU。在BlueField-3上,我们会出400G的Ethernet或者InfiniBand的接口。值得一提的是,在BlueField-3上可以来实现400Gb/s加解密的速度,不管是用IPSec还是用TLS,在加解密的速度上都可以达到400Gb/s的全线速。 不仅如此,BlueField-3还集成16个ARM CPU的核,它有更powerful的处理器。从它整个Offload(卸载)功能来看,一个BlueField-3的DPU可以实现的offload功能可以相当于300个X86CPU的核,这样我们原来需要很多CPU的核来做的操作,通过用DPU专业的offload engine,可以轻松地在DPU上面来实现,从而把这么多的CPU核offload出来,还给业务。 在存储上可以实现18个million的IOP/s。现在存储如果能达到1个million的IOP/s已经是非常高的性能,但在BlueField-3上,可以在不消耗主机CPU的情况下而达到18million的IOP/s。 DOCA实现从单芯片到超大规模的数据中心统一架构 据了解,DOCA软件开发包是专门为DPU开发的软件包。它的价值就像CUDA对GPU一样,通过CUDA可以看到所有GPU的开发接口,可以对它做编程。 DOCA也是如此,DOCA上各种业务,不管存储还是安全,以及其他与用户有关的业务都可以通过DOCA界面调用DPU里Offload的Engine,安全、网络、存储以及Orchestration,来对它进行编程。从DOCA的Vision来看,是想提供通过软件定义把所有的硬件加速的engine都调用起来的Infrastructure服务。 不仅如此,我们还可以通过DOCA来实现软件定义网络,可以通过DOCA来实现软件定义存储,通过DOCA来实现软件定义安全,无论是存储、安全和网络,你都可以通过DOCA和BlueField硬件关联起来,直接调用到硬件的加速引擎。 从DOCA软件栈来看,DOCA软件栈主要有两层:一是DOCA的driver和runtime,二是DOCA的Library,DOCA library主要是针对业务提供接口,在driver和runtime上,主要是怎么样调用硬件加速engine,怎么样将硬件的加速engine提供给上层的通信库。
|
免责声明:本网站内容由网友自行在页面发布,上传者应自行负责所上传内容涉及的法律责任,本网站对内容真实性、版权等概不负责,亦不承担任何法律责任。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,并请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。