LightCounting
讨论超级计算大会
2023
的
精彩要
点
12
米高的蓝
色大
熊凝视着举办
SC23
的科罗拉多会议中心。
超级计算大会
2023 (SC23)
于
2023
年
11
月
12
日至
17
日在科罗拉多州丹佛市举行,参会人数超过
14000
人,创下了新纪录。
两大主题主导了今年的会议
:
光子学日益重要的作用,以及高性能计算和人工智能超级计算机发展速度之间的矛盾。
利用光子学,诸如
PCI Express (PCIe)
和
Compute Express Link (CXL)
之类的协议可以通
光纤来实现数据中心的系统开放和
新型超级计算架构。
在
SC22
上崭露头角的系统初创企业
Drut Technologies
利用去年的
SC22
发布了其服务器
解耦
架构。今年,这家初创公司
显示
了其日益增长的
志向
。它正在开发一种架构,将这一概念扩展到整个数据中心。它的
动态加速器
(DX)
架构将支持多达
4,096
个使用光交换的加速器,类似于谷歌互连其张量处理器单元
(TPU)
集群的方式。
其他光子展示的亮点包括
Avicena
的光互连演示,展示了据称是世界上最小的每秒
1
太比特
(Tb/s)
的微型
LED
收发器。
Ayar Labs
展示了其嵌入英特尔
FPGA
的光输入输出
(I/O) TeraPHY
芯片,而
L
ighintelligence
则展示了在光链路上使用
PCIe/CXL
的内存分解。
SC23
也是最新的
500
强超级计算机亮相的地方。今年有一台超级计算机——微软
Azure
的
Eagle——
进入了前三名,这是商业机器第一次获得如此高的排名,而且是微软在一周内推出的。
Top500
强
突出的
另
一个趋势是高性能计算正在放缓。直到
2013
年,高性能计算每
11
年增长
1000
倍,但自那以后增长速度明显放缓。世界
500
强委员会认为,计算能力现在以每
11
年不到
10
倍的速度增长。相比之下,超大规模的人工智能计算需求每
3
到
4
个月增长一倍,这种情况将在可预见的未来持续下去。
高性能计算和
AI
超级计算机有不同的增长梯度有几个原因。
高性能计算所需的处理是多种多样的,要求非常高。因此,这门学科是第一个遇到关键限制的学科,因为它处于计算的前沿。相比之下,人工智能和机器学习的计算更加专业化,超大规模计算
厂商
在全面积累收益方面做得非常出色
:
在处理器的指令级别、浮点数学表示、核心、芯片和内存以及刀片级别。
此外,如何通过使用先进的网络技术和拓扑来扩展和扩展刀片以组成超级计算系统。反过来,
AI
计算需求的指数级增长不会无
止境无
瓶颈地持续下去。
就好像
高性能计算一样,这需要新的思维。
两场会议讨论了高性能计算和人工智能计算瓶颈的问题
:
一个小组讨论了光
I/O
在未来人工智能和高性能计算系统中的作用,以及芯片如何使高性能计算和人工智能受益。
超级计算
大会
的重点
在于
软件、算法和应用。但硬件——处理器、内存和包括光学在内的互连——也
是
关键
所
在。例如,在展会上宣布了最新的
Compute Express Link (CXL)
规范——
3.1
版本,这是一年多来的第一次升级。
Nvidia
在活动新闻发布会上发表了一个令人惊讶的声明,即
NVLink
网络不使用任何光连接。这意味着
Nvidia
部署的光模块和
AOCs
主要用于
InfiniBand
连接,部分用于以太网。
LightCounting
将在
2024
年
1
月题为“人工智能光学”的报告中讨论这一发展的影响。关于这份新报告的更多细节可在
2024
年
报告目录册
中获得,
该
报告的目录可应要求提供。
LightCounting
的
订阅用
户可以在
https://www.lightcounting.com/login
上获得这份研究报告的全文
Ready to connect with LightCounting?
Enabling effective decision-making based on a unique combination of quantitative and qualitative analysis.
Reach us at
[email protected]
Contact Us