在今天凌晨召开的 NVIDIA GTC 2021 开发者大会上,NVIDIA CEO 黄仁勋正式发布了旗下首款 Arm 服务器 CPU, 代号“Grace”,主要面向超大规模 AI 人工智能、HPC 高性能计算,最大特点就是海量的带宽,号称是全球首款专为 TB 级加速计算而设计的 CPU。
与此同时,NVIDIA 还发布了基于 Arm IP 的 BlueField-3 DPU,以及集成了 Arm IP 的首款算力高达 1000TOPS 的自动驾驶汽车芯片 NVIDIA DRIVE Atlan。
黄仁勋在会上也表示:“我们每年都会发布激动人心的新品。三类芯片,逐年飞跃,一个架构。”黄仁勋说,数据中心路线图包括 CPU、GPU 和 DPU 这三类芯片,而 Grace 和 BlueField 是其中必不可少的关键组成部分。每个芯片架构历经两年的打磨周期(周期内可能出现转变),一年专注于 x86 平台,另一年专注于 Arm 平台。
NVIDIA 首款 Arm 服务器 CPU Grace
虽然在大家印象里 NVIDIA 是一家 GPU 公司,但早在多年前就曾推出过自己的 Tegra 系列 CPU,甚至还一度进入了智能手机市场。
此次发布的 NVIDIA Grace 的名字,取自 Grace Hopper——格蕾丝·霍珀女士,她是计算机史上最早的程序员之一,也是编译语言之母,领导开发了编程语言 Cobol。
据介绍,NVIDIA Grace 基于 Arm 面向数据中心的下一代 Neoverse 内核架构每个 CPU 能在 SPECrate2017_int_base 基准测试中单位时间运行超过 300 个实例。
NVIDIA Grace 还采用了第四代 NVIDIA NVLink 技术,从 CPU 到 NVIDIA 的 GPU 连接速度超过 900GB/s,达到相当于目前服务器 14 倍的带宽。而从 CPU 到 CPU 的连接速率也超过了 600GB/s。另外,NVIDIA Grace 还拥有目前最高的内存带宽,搭配 LPDDR5X 内存可提供超过 500GB/s的带宽,而且支持 ECC 错误校验。
在此次会议上,黄仁勋并未公布 NVIDIA Grace 具体的核心数量、频率、缓存、功耗等数据。不过,黄仁勋表示,明年瑞士国家计算中心(CSCS)和美国洛斯阿拉莫斯国家实验室分别将推出一款性能强大的 AI 超级计算机面世,都将采用 NVIDIA Grace CPU,据称其与 NVIDIA GPU 紧密结合,性能将比目前最先进的 NVIDIA DGX 系统(在 x86 CPU 上运行)高出 10 倍。其中,瑞士国家超级计算中心(CSCS)、慧与(HPE)将联合使用 NVIDIA Grace CPU 及下一代 NVIDIA GPU,共同打造号称世界最快 AI 超算的“ALPS”(阿尔卑斯山),算力高达 20ExaFlops (每秒 2 千亿亿次计算),主要用于天气研究与预报、材料科学等。
据介绍,NVIDIA Grace 处理器计划 2023 年正式推出,2025 年将会推出下一代。NVIDIA 还同时强调,会继续支持 x86 架构,未来将坚持 x86、Arm 两条路线并行。
新一代数据处理器 Bluefield-3 DPU
NVIDIA 同时还发布了新一代数据处理器 BlueField-3 DPU,为数据中心提供强大的软件定义网络、存储和网络安全加速功能。
据介绍,BlueField-3 DPU 的晶体管数量达到了 220 亿个,集成了 16 个 Arm Cortex-A78 内核、18M IOPs 弹性块存储。与上一代的 BlueField-2 DPU 相比,BlueField-3 DPU 实现了 10 倍的加速计算性能提升和 4 倍的加密速度。BlueField-3 也是首款支持第五代 PCIe 总线并提供数据中心时间同步加速的 DPU。
一个 BlueField-3 DPU 所提供的数据中心服务相当于 300 个 CPU 核才能实现的工作负载,以 400Gbps 的速率,对网络流量进行保护、卸载和加速。
BlueField-3 可为 NVIDIA Morpheus 提供实时的网络可视化、网络威胁的检测与响应、以及监控、遥测和代理服务,Morpheus 是一个先进的基于 AI 的云原生网络安全平台。
BlueField-3 还利用 NVIDIA DOCA (集数据中心于芯片的架构)软件开发包的优势,为开发者提供一个完整、开放的软件平台,开发在 BlueField DPU 上开发软件定义和硬件加速的网络、存储、安全和管理等应用。DOCA 已于今日发布并提供下载。
黄仁勋表示: “现代超大规模云技术推动数据中心从基础上走向了新的架构, 利用一种专门针对数据中心基础架构软件而设计的新型处理器, 来卸载和加速由虚拟化、网络、存储、安全和其它云原生 AI 服务产生的巨大计算负荷。BlueField DPU 正是为此而生。”
BlueField-3 是首款为 AI 和加速计算而设计的 DPU,助力各企业在任何规模的应用上都能实现领先的性能和数据中心的安全性。这款 DPU 针对多租户、云原生环境进行了优化,提供数据中心级的软件定义和硬件加速的网络、存储、安全和管理等服务。
据介绍,服务器制造商戴尔、浪潮、联想和超微正在将 BlueField DPU 集成到他们的系统中。全球云服务供应商都在使用 BlueField DPU 来加速他们的业务,如百度、京东和 UCloud。随着众多企业对 BlueField-3 的支持,BlueField 生态系统也在不断扩大,这些企业包括:领先的混合云平台合作伙伴 Canonical、Red Hat 和 VMware;头部网络安全提供商 Fortinet、Guardicore;存储供应商 DDN?、NetApp 和 WekaIO;以及边缘平台供应商 Cloudflare、F5 和 Juniper Networks。
另外值得一提的是,BlueField-3 完全向下兼容 BlueField-2,提供更加出色的数据中心应用转移、加速和隔离性能。BlueField-2 有双端口 100Gb/s以太网或双端口 100Gb/s InfiniBand 两种选择,最多可支持 8 个 Arm 核。BlueField-2 DPU 还集成了各种不同的加速引擎来加速软件定义存储、网络、安全、流媒体、线速 TLS/IPSEC 加密、5G 电信的精确定时、数据中心的时间同步以及其它云基础设施服务等。
根据预计,BlueField-3 DPU 将于 2022 年第一季度发布样品,后续的 BlueField-4 DPU 将包含 640 个晶体管,算力达 1000TOPS,网络速率达 800Gbps。
自动驾驶汽车芯片 DRIVE Atlan
NVIDIA 在此次会议上还正式发布了最新一款智能汽车和自动驾驶汽车芯片组——DRIVE Atlan,单颗芯片的算力能够达到 1000TOPS,这也是业内首款达到 1000TOPS 算力的芯片,将应用于 L4 及 L5 级别自动驾驶。
作为参考,上一代 Orin 算力为 254TOPS,而特斯拉自研的芯片算力则为 144 TOPS。足以可见,英伟达 Atlan 的强大实力。
Atlan SoC 集成了 NVIDIA 最新的安培架构 GPU 核心、以及 Arm 架构的 Grace CPU 核心、深度学习和计算机视觉加速器单元以及 BlueField DPU 核心,该平台将实现每秒执行 1000 万亿次操作(1000 TOPS),是上一代产品的 4 倍,且预估其 SPECint 得分将超过 100(SPECrate2017_int),高于当今大多数 robotaxi 的总计算量。Atlan 还是首款配备 NVIDIA BlueField DPU 的 SoC,可提供可信赖的安全性、高级网络和存储服务。
Atlan SoC 将于 2023 年向开发者提供样品,2025 年左右上市的车型就可能搭载。
同时,英伟达也公布了最新 L4 级自动驾驶开发车 Hyperion 8,车辆搭载 2 颗英伟达 Orin SoC 用作自动驾驶计算,并用 1 颗 Orin SoC 监测车内安全员,同时用 4 颗 Orin SoC 与 4 颗 MLNX 芯片记录 3D 环境。
车外传感器使用 8 个 800 万像素、4 个 300 万像素鱼眼摄像头、3 个座舱内摄像头、9 个毫米波雷达以及 2 个激光雷达。
这辆开发车将在今年年底面向开发者开放。黄仁勋还宣布自动驾驶仿真平台 DRIVE Sim 将于今年夏季开放使用。
关于对 Arm 的收购进展
去年 10 月宣布以 400 亿收购 Arm 之后,仅 6 个月之后,NVIDIA 就一口气发布了三款基于 Arm IP 的产品,这也足见 NVIDIA 对于 Arm 技术及其生态的看重。
值得一提的是,目前 Arm 服务器 CPU 阵营当中的两大玩家——华为和飞腾接连遭到了美国的制裁,这也对于刚有起色的 Arm 服务器生态带来了不小的打击。此番 NVIDIA 的加入确实有助于 Arm 服务器生态的建设。但是,如果 NVIDIA 成功收购了 Arm,那么则可能对于 Arm 生态建设带来负面的影响。此前不论是 Arm 联合创始人赫尔曼·豪泽,还是众多的 Arm CPU 厂商都对此 NVIDIA 收购 Arm 表达了反对意见。
关于对 Arm 的收购进展,黄仁勋表示,目前收购工作正在稳妥有序进行。“NVIDIA 和各国监管部门进行了积极有效的沟通,我们相信,监管部门会支持 NVIDIA 收购 Arm,因为这有利于市场竞争,有利于半导体行业的技术研发,相信这笔交易会在 2022 年有个积极正面的结果。”
值得一提的是,NVIDIA 此次还公布了与亚马逊 AWS、Ampere Computing、联发科和 Marvell 等基于 Arm 的 CPU 平台的合作伙伴关系与合作进展,具体内容包括为亚马逊 AWSGraviton2 CPU 提供 GPU 加速、为科学和 AI 应用开发提供支持的全新 HPC 开发者套件、提升边缘视频分析和安全功能、打造新一类基于 Arm 并搭载 NVIDIA RTX GPU 的新款 PC 等。
共有 0 条评论