Nvidia最近在NvidiaGTC2024上推出了其DGXGB200NVL72机架式超级计算机,ServeTheHome的PatrickKennedy拍摄了一系列精彩的照片来展示这款令人印象深刻的“野兽”。
DGXGB200NVL72的名称告诉了你很多你需要知道的信息。GB200表示GraceBlackwellGB200计算结构,而NVL72表示有72个BlackwellGPU通过NVLink连接。
Blackwell平台的两个GPU上包含2080亿个晶体管。这些晶体管通过10TB/秒的间链路连接到一个统一的GPU。Blackwell将于今年晚些时候出货,据报道,它将提供高达20petaflops的FP4性能,在AI推理任务方面比Hopper快30倍。
机架式系统由顶部堆栈中的十个计算节点组成,每个节点都具有双Infiniband端口、四个E1.S驱动器托盘和管理端口。每个节点由两个GraceArmCPU供电,连接到两个BlackwellGPU。这些节点下方是九个NVSwitch搁板,带有金色手柄,方便拆卸。
机架后部展示了专为盲配电源而设计的供电系统,通过总线、液体冷却喷嘴和每个组件的NVLink连接实现。此设置允许轻微移动以确保正确的盲配。
DGXGB200NVL72重1.36吨(3,000磅),功耗为120kW,ServeTheHome指出,并非所有数据中心都能承受这样的功率负荷。由于许多数据中心最多只能支持60kW的机架,因此未来的半堆叠系统似乎是有可能的。该机架使用2英里(3.2公里)的铜缆代替光纤,从而将系统的功耗降低20kW。
您可以在此处查看肯尼迪在GTC2024上拍摄的其余照片。
标签:
免责声明:本文由用户上传,如有侵权请联系删除!