英特尔宣布推出具有高带宽内存 (HBM) 的新处理器,面向高性能计算 (HPC)、超级计算和人工智能 (AI)。
这些产品被称为 Xeon CPU Max 系列和 GPU Max 系列。这些芯片基于现有技术;CPU 是第四代 Xeon Scalable,又名Sapphire Rapids,GPU 是Ponte Vecchio,英特尔 Xe GPU 技术的数据中心版本。
不同之处在于这两个处理器在处理器芯片上带有 HBM,而不是仅依赖于标准 DRAM。HBM 比 DDR4 或 DDR5 内存快得多,并且位于 CPU/GPU 内核旁边的处理器芯片上,具有高速互连,而不是像 DDR 内存这样的记忆棒。
英特尔超级计算副总裁兼总经理 Jeff McVeigh 表示:“如果您查看 HPC 和 AI 领域的整体工作负载,就会发现工作负载多种多样。” “传统上,这次登顶有两条路线。一是CPU路线,二是GPU路线,各有各的障碍。我们的目标是真正向前迈进,全面解决这些问题。”
McVeigh 说,CPU Max 和 GPU Max 的重点是最大化带宽、最大化计算以及最大化它们为解决工作负载的广度提供的能力和可能性。
CPU最大值
CPU Max 提供三种服务器配置。第一个是没有 DRAM,所以系统中唯一的内存是 CPU Max 芯片上的 64GB HBM。这就是日本的 Fugaku 超级计算机(曾经是世界上最快的超级计算机之一)的运行方式。在双插槽系统中,这是 128GB 的内存,McVeigh 说“对于许多应用程序和工作负载来说已经足够了”。在这种使用场景中,应用程序可以原样运行。
第二种配置称为 HBM 平面模式,它将 CPU 封装中的 HBM 与系统中的标准 DDR5 记忆棒相结合。HBM 和 DDR 软件都需要优化以在这些不同的内存区域之间移动数据。
第三种配置是 HBM 缓存模式,其中 HBM 充当系统中 DDR 内存的缓存。在这种模式下,不需要更改软件代码。“您可能想要进行一些调整以利用您现在拥有的非常大的缓存,但当您获得立竿见影的好处时,您不必这样做,”McVeigh 说。
显卡最大值
GPU Max 也提供三种配置;1100、1350 和 1550 型号。1100 是 300 瓦双宽 PCIe 卡,具有 56 个 Xe 内核和 48GB HBM2e 内存。多个卡可以通过 Intel Xe Link 桥接器连接。
其他两种配置采用开放计算项目 (OCP) 加速器模块,称为 OAM,它是 PCIe 卡的更快替代接口。
1350 GPU 是一个 450 瓦的 OAM 模块,具有 112 个 Xe 内核和 96GB 的 HBM。1550 GPU 是一个 600 瓦的 OAM 模块,具有 128 个 Xe 内核和 128GB 的 HBM。
PCI Express 卡非常适合用于标准服务器甚至工作站系统,但 OAM 模块确实面向更高密度的环境,McVeigh 说。他表示,英特尔已经获得了许多由 OEM 和系统解决方案提供商开发的系统设计,他们将从 2023 年开始推出带有 OAM 的服务器。
英特尔正在为阿贡国家实验室建造一台配备 CPU Max 和 GPU Max 处理器的超级计算机,当它在 2023 年上线时,性能将超过 2 exaFLOPs。这是目前超级计算机竞赛中的领先者 Frontier的速度的两倍。McVeigh 说,正是这两种处理器的结合使之成为现实。
“你会争辩说,我们已经把所有东西都卸载到了 GPU 上,我们不需要最高端的 CPU,对吧?我们不需要 HBM 内存,对吧?错误的。通过打开集成在 CPU 中的 HBM,我们可以获得显着的性能提升,因为仍然有很多代码在 CPU 上运行,即使我们已经将一些较大的内核卸载到 GPU 上,”他说。
新处理器已经开始向包括 Argonne 在内的初始客户发货。Max 系列计划于 2023 年 1 月推出。