AI资讯

NVIDIA 融合加速器 NVIDIA BlueField DPU

2023-09-05 10:50:52 工作站服务器 11

更快、更安全的人工智能系统

在一个独特、高效的架构中, NVIDIA 融合加速器将 NVIDIA GPU 的强大性能与 NVIDIA 智能网卡 (SmartNIC) 和数据处理单元 (DPU) 的增强网络和安全性相结合。

为从数据中心到边缘的 I/O 密集型 GPU 加速工作负载提供最大性能和增强的安全性。


节能环保:NVIDIA BlueField DPU 提升数据中心效率

与爱立信、Red Hat 和 VMware 合作进行的测试表明,NVIDIA BlueField DPU (数据处理器)可使网络变得更快、更高效。

测试数据描绘出这样一幅美好图景:数据中心将变得更加环保。而这要归功于 DPU (数据处理器) 加速的高效网络。

与爱立信、Red Hat 和 VMware 合作进行的一系列测试显示,使用 NVIDIA BlueField-2 DPU 的服务器的功耗最多可降低 24%。在某个测试案例中,这些服务器的性能相比于仅使用 CPU 时提升了 53 倍。

正如我们近期发布的白皮书所述那样,将核心网络任务从功耗较高的主机处理器上卸载到专为高效运行此类任务而打造的 DPU 上。

借助用于网络、安全和存储任务的 DPU 加速计算,是提高数据中心节能效率的下一项重要步骤。白皮书中记述了数种可助力数据中心走进绿色计算时代的优化手段,而采用 DPU 加速运算是其中最新的一种。

 VMware vSphere 上测试 DPU

考虑到网络正朝着高效节能方向发展的趋势,VMware 采用了 DPU 来运行其虚拟化软件,该虚拟化软件在全球范围内很受欢迎,有数千家公司使用。自 VMware 于 今秋发布 vSphere 8 软件以来,NVIDIA 已与 VMware 合作进行了多项测试。

例如,在 VMware 的 vSphere 分布式服务引擎(使用 DPU 卸载和加速网络与安全功能的软件)上使用 BlueField-2 DPU 时,与不使用 DPU 相比,分布式服务引擎可以实现更加出色的性能,同时还可释放 20% 的 CPU 资源。

这意味着用户能够使用更少的服务器运行与原来相同的工作负载,或者在不改变服务器部署数量的同时运行更多应用。

电力成本减少近 200 万美元

电信服务供应商运营的数据中心面临着比其他数据中心更严苛的任务要求。这些数据中心的网络需要在蜂窝网络和互联网之间传输智能手机用户生成或请求的所有数据。

爱立信的研究人员测试了运营商是否可以使用智能网卡(具有 DPU 功能的网卡)来减少这些大型工作负载的功耗。在测试中,他们让 CPU 减速运行或进入睡眠状态,同时使用一块 NVIDIA ConnectX 智能网卡处理网络任务。



NVIDIA 融合加速器 NVIDIA BlueField DPU

NVIDIA 融合加速器将 NVIDIA ® Ampere GPU 架构的强大功能与 NVIDIA BlueField DPU 增强的安全和网络功能相结合,

在单个高性能产品中实现了两者的完美融合。

这种先进的架构为边缘计算、电信和网络安全中的 AI 的工作负载提供了前所未有的性能和强大的安全性。

英伟达以69亿美元收购的Mellanox公司时获得的智能网络芯片SmartNIC技术,

Mellanox与Arm公司的处理器IP结合,形成了BlueField IPU,

兼顾了软件定义解决方案的速度和灵活性,并且提高了安全性、加速了性能并改善了效率。

第一代的BlueField IPU芯片在2019年正式发布。


NVIDIA Converged Accelerator




NVIDIA BlueField-2 DPU

NVIDIA BlueField-2 DPU 可为每台主机提供创新的加速能力以及出色的安全性和效率。 BlueField-2 数据中心基础设施将 NVIDIA ConnectX®-6 Dx 的强大功能与可编程的 Arm ® 核心以及其他硬件卸载功能相结合,用于软件定义存储、网络、安全和管理工作负载。

NVIDIA BlueField-2 还能为云计算平台提供出色的性能、安全性,并可降低总拥有成本(TCO),从而支持企业高效构建和运营大规模的虚拟化、容器化及裸机基础架构。



NVIDIA BlueField-2 DPU





NVIDIA BlueField-3 DPU

NVIDIA BlueField-3 DPU 是一款 400Gb/s 基础设施计算平台,

可对软件定义的网络、存储和网络安全进行线速处理。 

BlueField-3 将强大的计算能力、高速网络和广泛的可编程性相结合,

为要求苛刻的工作负载提供软件定义、硬件加速的解决方案。

从加速 AI 到混合云和高性能计算,再到 5G 无线网络, BlueField-3 重新定义了可能性的艺术。



NVIDIA BlueField-3 DPU





高性能 5G

NVIDIA Aerial™ 是一个应用程序框架,用于构建高性能、软件定义的云原生 5G 应用程序,以满足日益增长的消费者需求。它实现了 5G 无线局域网(RAN)的 GPU 加速信号和数据处理。 NVIDIA 融合加速器为运行 5G 应用程序提供了性能最高的平台。由于数据不需要通过主机 PCIe 系统,因此大大降低了处理延迟。由此产生的更高吞吐量还允许每个服务器具有更大的用户密度。

基于 AI 的网络安全

融合加速器为基于 AI 的网络安全和联网开辟了一系列新的可能性。 DPU 的 Arm 核心可以使用 NVIDIA Morpheus 应用框架进行编程,以执行 GPU 加速的高级网络功能,如威胁检测、数据泄漏预防和异常行为分析。GPU 处理可以高数据速率直接应用于网络流量,并且数据在 GPU 和 DPU 之间的直接路径上传输,从而提供更好的隔离。

在边缘加速 5G 上的 AI

NVIDIA AI-on-5G 由 NVIDIA EGX™ 平台、用于软件定义的 5G 虚拟 RAN ( vRAN )的 NVIDIA Aerial SDK 和企业 AI  框架组成,包括 NVIDIA ISAAC™ 和 NVIDIA Metropolis 等 SDK 。该平台使摄像头、工业传感器和机器人等边缘设备能够使用 AI,并通过 5G 与数据中心通信。聚合卡可以在单个企业服务器中提供所有这些功能,而无需部署成本更高的专用系统。用于加速 5G 信号处理的同一汇聚卡也可以用于边缘 AI,NVIDIA 的 MIG 技术使其可以在几个不同的应用之间共享 GPU 。

平衡、优化的设计

NVIDIA 融合加速器将 GPU、DPU  和 PCIe 交换机集成到单个设备中,通过设计提供平衡的架构。 在需要多个 GPU 和 DPU 的系统中,融合加速卡避免了服务器 PCIe 系统上的争用,因此性能会随着设备的增加而线性扩展。此外,融合卡提供了更可预测的性能。 将这些组件放在一张物理卡上还可以提高空间和能源效率。 融合卡显着简化了部署和持续维护,尤其是在大规模安装批量服务器时。



NVIDIA A30X

NVIDIA A30X 结合了 NVIDIA A30 Tensor Core GPU 与 BlueField-2 DPU。借助 MIG,GPU 可以被划分为多达 4 个 GPU 实例,每个实例运行一个单独的服务。该卡的设计为 5G vRAN 和基于 AI 的网络安全等用例提供了计算和 I/O 性能的良好平衡。多个服务可以在 GPU 上运行,板载 PCIe 交换机提供低延迟和可预测的性能。

NVIDIA H100 CNX

NVIDIA A100X 将 NVIDIA H100 Tensor Core GPU  的强大功能与 BlueField -2 DPU 结合在一起。借助 MIG,每个 A100 可以被划分为多达 7 个 GPU 实例,从而允许更多的服务同时运行。

A100X 非常适合计算需求更密集的用例。示例包括具有大规模多输入多输出(MIMO)功能的 5G 、AI-on-5G 部署以及信号处理和多节点训练等专业工作负载。

NVIDIA AX800

NVIDIA AX800 将 NVIDIA Ampere 架构 GPU technology with the BlueField-3 DPU. 相结合。它拥有接近 1 TB/s 的 GPU 显存带宽,并且可以被划分为多达 7 个 GPU 实例。其 16 个 Armv8.2 + A78 Hercules 核心支持 256 个线程,使 AX800 能够在 5G vRAN 等最苛刻的 I/O 密集型工作负载上发挥高性能。


解决方案