添加链接
link管理
链接快照平台
  • 输入网页链接,自动生成快照
  • 标签化管理网页链接

LightCounting 讨论超级计算大会 2023 精彩要

12 米高的蓝 色大 熊凝视着举办 SC23 的科罗拉多会议中心。

超级计算大会 2023 (SC23) 2023 11 12 日至 17 日在科罗拉多州丹佛市举行,参会人数超过 14000 人,创下了新纪录。

两大主题主导了今年的会议 : 光子学日益重要的作用,以及高性能计算和人工智能超级计算机发展速度之间的矛盾。

利用光子学,诸如 PCI Express (PCIe) Compute Express Link (CXL) 之类的协议可以通 光纤来实现数据中心的系统开放和 新型超级计算架构。

SC22 上崭露头角的系统初创企业 Drut Technologies 利用去年的 SC22 发布了其服务器 解耦 架构。今年,这家初创公司 显示 了其日益增长的 志向 。它正在开发一种架构,将这一概念扩展到整个数据中心。它的 动态加速器 (DX) 架构将支持多达 4,096 个使用光交换的加速器,类似于谷歌互连其张量处理器单元 (TPU) 集群的方式。

其他光子展示的亮点包括 Avicena 的光互连演示,展示了据称是世界上最小的每秒 1 太比特 (Tb/s) 的微型 LED 收发器。 Ayar Labs 展示了其嵌入英特尔 FPGA 的光输入输出 (I/O) TeraPHY 芯片,而 L ighintelligence 则展示了在光链路上使用 PCIe/CXL 的内存分解。

SC23 也是最新的 500 强超级计算机亮相的地方。今年有一台超级计算机——微软 Azure Eagle—— 进入了前三名,这是商业机器第一次获得如此高的排名,而且是微软在一周内推出的。

Top500 突出的 一个趋势是高性能计算正在放缓。直到 2013 年,高性能计算每 11 年增长 1000 倍,但自那以后增长速度明显放缓。世界 500 强委员会认为,计算能力现在以每 11 年不到 10 倍的速度增长。相比之下,超大规模的人工智能计算需求每 3 4 个月增长一倍,这种情况将在可预见的未来持续下去。

高性能计算和 AI 超级计算机有不同的增长梯度有几个原因。

高性能计算所需的处理是多种多样的,要求非常高。因此,这门学科是第一个遇到关键限制的学科,因为它处于计算的前沿。相比之下,人工智能和机器学习的计算更加专业化,超大规模计算 厂商 在全面积累收益方面做得非常出色 : 在处理器的指令级别、浮点数学表示、核心、芯片和内存以及刀片级别。

此外,如何通过使用先进的网络技术和拓扑来扩展和扩展刀片以组成超级计算系统。反过来, AI 计算需求的指数级增长不会无 止境无 瓶颈地持续下去。 就好像 高性能计算一样,这需要新的思维。

两场会议讨论了高性能计算和人工智能计算瓶颈的问题 : 一个小组讨论了光 I/O 在未来人工智能和高性能计算系统中的作用,以及芯片如何使高性能计算和人工智能受益。

超级计算 大会 的重点 在于 软件、算法和应用。但硬件——处理器、内存和包括光学在内的互连——也 关键 在。例如,在展会上宣布了最新的 Compute Express Link (CXL) 规范—— 3.1 版本,这是一年多来的第一次升级。

Nvidia 在活动新闻发布会上发表了一个令人惊讶的声明,即 NVLink 网络不使用任何光连接。这意味着 Nvidia 部署的光模块和 AOCs 主要用于 InfiniBand 连接,部分用于以太网。 LightCounting 将在 2024 1 月题为“人工智能光学”的报告中讨论这一发展的影响。关于这份新报告的更多细节可在 2024 报告目录册 中获得, 报告的目录可应要求提供。

LightCounting 订阅用 户可以在 https://www.lightcounting.com/login 上获得这份研究报告的全文

Ready to connect with LightCounting?

Enabling effective decision-making based on a unique combination of quantitative and qualitative analysis. Reach us at [email protected]

Contact Us