英伟达Grace Hopper超级芯片已经全面投产

2023-05-29 14:48:22 业界科普

英伟达在2023电脑展大会上发布了多项消息,其中最引人注目的是Grace Hopper超级芯片已经全面投产,并集成在DGX GH200超级计算机中。以下是英伟达发布的消息的详细内容:

Grace Hopper超级芯片是英伟达开发的基于Arm架构的CPU+GPU集成方案,它将72核的Grace CPU、Hopper GPU、96GB的HBM3和512GB的LPDDR5X集成在同一个封装中,共有2000亿个晶体管。这种组合提供了CPU和GPU之间惊人的数据带宽,高达1TB/s,为某些内存受限的工作负载提供了巨大的优势。

DGX GH200人工智能超级计算平台是英伟达针对最高端的人工智能和高性能计算工作负载而设计的系统和参考架构。DGX GH200通过使用英伟达的定制NVLink Switch芯片来避免标准集群连接选项(如InfiniBand和以太网)的限制。它使用了一种新的NVLink Switch系统,包含36个NVLink开关,将256个GH200 Grace Hopper芯片和144TB的共享内存连接成一个单元,提供比前一代系统高出10倍的GPU到GPU和7倍的CPU到GPU的带宽,互连功耗效率高达128TB/s。

英伟达将把DGX GH200的参考蓝图提供给其主要客户谷歌、Meta和微软,并且还将把该系统作为云服务提供商和超大规模数据中心的参考架构设计。英伟达自己也将部署一个新的英伟达Helios超级计算机,由四个DGX GH200系统组成,用于自家的研发工作。这四个系统共有1024个Grace Hopper芯片,并且用英伟达的Quantum-2 InfiniBand 400Gb/s网络连接起来。

英伟达的新MGX系统处于DGX和HGX系统之间,旨在加快人工智能中心服务器的设计和部署过程。MGX系统由模块化设计组成,涵盖了英伟达的CPU和GPU、DPU和网络系统的各个方面,但也包括了基于常见的x86和Arm处理器的设计。英伟达还提供了空冷和液冷的设计选项,以适应各种应用场景。

英伟达还宣布了其新的Spectrum-X以太网网络平台,专为人工智能服务器和超级计算集群而优化。Spectrum-X采用了英伟达的51Tb/s Spectrum-4 400GbE以太网交换机和英伟达Bulefield-3 DPU,搭配软件和SDK,使开发人员能够根据AI工作负载的独特需求调整系统。与其他基于以太网的系统相比,英伟达称Spectrum-X是无损的,从而提供了更好的QoS和延迟。它还具有新的自适应路由技术,这在多租户环境中特别有用。

英伟达发布的DGX GH200超级计算机集成了256个GH200芯片,这些芯片专为处理海量的生成型人工智能任务而设计。同时,英伟达还发布了其新的Spectrum-X以太网网络平台和MGX系统,旨在加快人工智能中心服务器的设计和部署过程。

版权说明: 本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。