添加链接
link管理
链接快照平台
  • 输入网页链接,自动生成快照
  • 标签化管理网页链接

清晰明了!10分钟讲懂光模块【深度报告】

专栏 / 清晰明了!10分钟讲懂光模块【深度报告】

清晰明了!10分钟讲懂光模块【深度报告】

2023年06月03日 05:33 --浏览 · --点赞 · 视频地址: 清晰明了!10分钟讲懂光模块【深度报告】

粉丝: 18.9万 文章: 9

最夸张的行情,往往只需要最简单的投资逻辑。

光模块就是这样,在三个月的时间内暴涨了7倍。

如果说AI板块里面,哪个环节分歧最小、业绩确定性最高,那就是光模块了,它几乎统一了整个A股的审美。


【前言】

光模块的逻辑非常简单粗暴,一共有三点。


第一,是需求增加,简称量增。

光模块是数据中心的零部件之一,占数据中心建设成本5%左右。随着AI对算力需求增加,光模块的需求也就随之增加。不过光模块跟其他零部件不一样的地方在于,它是整个产业链几乎唯一的实现自主生产的环节。

其他的板块还要受到海外芯片卡脖子的问题,而它不仅供应链没有问题,反而出口到全世界。(高端光芯片仍需海外进口)


所以其他像AI芯片、服务器等等环节,主要享受到国内市场的红利,而光模块是享受全球AI发展的红利,所以光模块的业绩弹性是大于整条产业链的。

这就是为什么,大家把光模块比作新能源里面的逆变器。


第二是单价提高,简称价升。

AI训练需要更高传输速率的800G光模块,相比传统的200G光模块,800G光模块的价格贵了好几倍。随着800G光模块的渗透率提升,厂家的产品售价总体就提上去了。


前两点合在一起就叫量价齐升,是A股最喜欢的逻辑之一 ,卖的更多了,并且价格还更高了,对应的就是业绩大增,常见于周期行业或者新兴产业初期。


第三点是技术迭代。

顺应AI发展趋势,对光模块性能要求越来越高。一个方面是传输速率,另一方面光模块是新的生产和封装工艺,进一步实现降本增效。


这时候谁率先实现技术突破,取得大客户认证并且量产,谁就能掌握先机。所以第三点其实是光模块企业的技术壁垒。


那么光模块的逻辑就讲完了,越是简单粗暴,市场就越是能形成共识。


不过这期内容才刚开始,因为逻辑需要验证,粗略的逻辑不足以成为决策的依据。

要进一步搞懂光模块,我们还需要再解决以下三个问题:

一、什么是光模块?

二、市场空间到底有多大?

三、技术路径如何迭代?


(一)什么是光模块

1.定义

这就是光模块。我们平时在路由器或者交换机上面都能看得到,就是光纤插进去的那一块儿。

它的作用是光电信号的转换。

我们平时要传送的各种信息是电信号,在发射端,光模块负责把它转化为光信号,以便在光纤中传播。

在接收端,光模块收又把光信号转化为电信号,经过调解恢复为原信息。

这样就完成了信息的传输。

目前光模块主要应用在电信(30%)和数据中心(70%)两大领域。


2.成本结构&产业链

光芯片是上游产业链核心器件,约占光模块总成本的26%。

光模块可以根据器件形态分为单通道和多通道,可以通过提高通道数来提升传输速率。比如400G光模块,可以是16通道搭载25G光芯片,400G=16*25G来实现。


目前中低端光芯片基本完全实现国产化,如2.5G和10G光芯片已经广泛运用于移动通信和数据中心市场。

但是25G及以上光芯片仍然存在较高技术门槛,使用EML激光器方案,国产化率低、依赖进口。目前在25G以上有所突破的有源杰科技。


(二)市场空间有多大

我们买方一般不喜欢什么“坚定看好”、“市场空间巨大”这类说法,我们就喜欢敲计算器,实实在在去推算这玩意儿到底能带来多大业绩增量。


这回我就来带大家一起敲计算器。


光模块儿大家刚刚看过了,就是这么个玩意儿。要算市场规模有多大,无非是看它 多少钱一个(价格),今年全球要卖多少个(量)


1.卖多少个(量)

根据今年有多少算力需求,我们大致就能测算光模块有多大增量。

假设今年主要是AI训练带来的光模块增量,传统的电信和数据中心需求不变。


以OPEN AI团队举例,他们训练GPT3模型用了一万张英伟达A100显卡。训练GPT4乃至更高级的模型则需要更多算力,目前OPEN AI已经配备了3万张以上的A100显卡。


一万张显卡几乎就是一个大模型的门槛 ,国内大厂几乎都部署了两三万张显卡。


受算力的限制,能做这个事情的选手基本上不多 ,目前国内推出或者计划推出大模型的厂商,大约有二十来个。我们假设今年全球会推出60个大模型,一个大模型假设需要2万张A100GPU,则需要120万张A100。

(当然不一定非要用A100,也可以是各种算力芯片的组合,我们这里只是以它作为一个计算单位来举例。)


那么我们只需要知道,一张A100显卡对应多少个光模块,就能算出光模块的需求量了。


不过这玩意儿有点复杂,因为显卡数量和光模块数量不是简单比例关系,不同组网架构下所需要使用光模块的用量有所区别,涉及到网卡型号、交换机型号、和单元数量等等。


还是直接上结论吧,已经有 大佬测算出来比例大致如下(不是我算的,整个计算过程我看着也头痛):

1)A100+ConnectX6+QM8700 三层网络:比例关系1:6,全部用200G光模块

2)A100+ConnectX6+QM9700 两层网络:1:0.75个800G光模块+1:1个200G光模块

3)H100+ConnectX7+QM9700 两层网络:1:1.5个800G光模块+1:1个400G光模块

4)H100+ConnectX8(尚未发布)+QM9700 三层网络:比列关系1:6,全部用800G光模块

怎么解读呢?比如说第一行:

在使用A100显卡+ConnectX6网卡+QM8700交换机  在三层网络的情况下,全部用200G光模块,比例关系为1:6。

说人话就是一个A100显卡配6个200G光模块。


在这个条件下,今年全球需求大约120万张A100显卡,那么相应的,就需要720万个光模块,大概就是这么个算法。


券商预期2023年全球大约出货30万张H100+90万张A100显卡,算力差不多就对应了60多个大模型的需求。

总共带来:

2023年: 315万个200G+30万个400G+80万个800G光模块需求。

2024年: 150万片H100+150万片A100,总共带来75万个200G+75万个400G+675万个800G光模块需求。


2.价格

量我们现在知道了,再来算价格。


目前一个200G光模块的价格大约是200美元;800G光模块价格不统一,有说几万人民币一个的,有说上千美金的。我看到调研显示,北美某大厂的采购价格大约是700美元,我们保守一点,就以这个为标准。

3.市场规模

量 x 价

2023年 训练AI用的光模块市场 约13亿美元

2024年 这个市场规模来到 50亿美元美元 ,较今年增长近4倍。


要知道,到2022年,全球的数据中心光模块市场规模一共才50多亿美元。到明年,AI算力带来的增量就接近让市场规模翻一倍了。(下图是没有计算AI增量的旧图)

并且,这个预期还在不断往上加。


前段时间有消息称海外云厂商追加800G光模块的订单,2023年800G光模块出货量上调至120万支, 2024年光模块的预期上调至800万支


最近两天英伟达推出了新款AI超级计算机,对光模块的需求可能进一步增加。全行业 800G需求在2024年甚至可能会达到1000万只


上海市经信委 4 月 19 日发布关于印发《上海市推进算力资源统一调度指

导意见》的通知。其中提出,到 2025 年上海市数据中心算力超过 18000 PFLOPS(FP32),这差不多对应了A100 卡需求 92.3 万片(19.5TFLOPS/片)。也就是说 上海到2025年,一个市的需求就接近今年全球的3/4


那么全球的算力需求的暴增可想而知,对应的,光模块的需求也将大幅增长。

在需求不断超预期的情况下,光模块行情也持续走出新高。


(三)技术路径如何迭代

光模块的技术看着很复杂,各种性能指标。

其实这些术语不重要,我们直接抓主线。 光模块技术发展有两个核心诉求,一个是提高传输速率,一个是降低功耗。


1.提高传输速率

我们平时说的千兆网络、万兆网络,指的就是光信号的传输速率。光模块可以根据传输速率分为千兆、万兆(10G)、100G、200G、400G、800G等等。意思是光模块每秒钟能够传输的数据量。通常用单位bit/s(比特每秒)来表示。


AI训练需要大量的数据,所以对数据中心的吞吐量提出了要求。


吞吐量= 传输速率 x 传输时间


单位时间内传输速率越高,吞吐量就会越大,很好理解。所以光模块的传输速率越高越好。


800G光模块可以将网络吞吐量提高一倍,大大提高了数据中心和云计算的数据传输速率和处理能力。同时,800G光模块还可以降低数据中心的成本和能耗,同时提高网络的稳定性和可靠性。


目前800G光模块的渗透率还比较低,多数厂家还在给下游客户做送样验证,没有批量生产。

短期内800G光模块是供不应求的,谁先通过验证获取客户,谁就能率先抢占市场。而已经开始量产供货的公司,就是股价飞上天的那几家了。


往后看,1.6T的光模块可能成为厂家们下一个竞争的高地。


2.降低功耗

(1)传统封装技术

随着传输速率提升,光模块的功耗就会提升,为了降低功耗,就产生了不同的封装方式。


大家可以毛看一下光模块的封装技术,什么CFP,SFP,QSFP-DD等等,是不是觉得头皮发麻?

那么我们换张图,这样是不是就清晰明了了?

我们可以发现一个规律,那就是把光模块越做越小,功耗越做越低,让交换机在同样的功率可以驱动更多的光模块,从而迎合提效降本的需求。


传统的光模块我们对功耗还感知不强,因为服务器才是耗电的大头,而以光模块为代表的网络设备,功耗占数据中心的3%都不到。


但是到了800G之后,光模块功耗会指数级增长,只靠传统可插拔式封装,压不住光模块发热和功耗。预计800G光模块普及以后,这部分功耗会占数据中心的8%。

(2)CPO技术

那咋整呢?CPO技术就应运而生了。


这张图的上半部分,是目前主流的光模块结构,简单来说就是一块PCB板上面,放着射频芯片、计算芯片、发射器TOSA( 发射光组件/TransmitterOptical Subassembly)、接收器ROSA(接收光组件/ReceiverOpticalSubassembly)。


如果用集成电路的思路, 把这堆光学器件和电子器件全部集成到一起,就可以提高整个系统的性能和功率效率 。这就是光电共封装技术,简称CPO(Co-packagedoptics)。

它长这样,可以看到是模块化的,比起之前更整齐紧凑。与传统光模块相比, CPO在相同传输速率下可以减少50%的功耗


不过目前CPO技术还不成熟,各厂家基本还在研发阶段,没有量产。市场预计CPO技术的渗透率会在2027年达到30%。



(3)硅光子技术

还有一种方案是硅光子技术(Silicon Photonics),它用的是现有的半导体制造工艺, 直接在芯片上制造光学器件,实现了高度集成的光电芯片

这个技术是从图像传感器芯片那里得来的灵感,同样具有高速、高密度、低功耗的优势。

它和CPO的区别在于,CPO是把光学器件和电学器件一起集成,而硅光技术是直接做一个芯片,做出来的时候就已经把光电两部分功能都集成好了。


不过硅光子技术也存在一些缺点,比如 半导体的制造成本高,灵敏度高容易受到温度、外力影响,传输距离有限等等 ,所以适用于短距离通信,而CPO更适用于长距离通信。



3.补充一些其他性能参数知识

想更深入了解的可以自己看。

光模块的性能指标主要有传输速率、传输距离、中心波长、器件类型(单模/多模)等。

光模块的命名方式如下:

①传输速率: 前面已经讲过了,这里就略。


②传输距离: 光模块发射光功率和接收灵敏度,发射光功率指发射端的光强,接收灵敏度指可以探测到的光强度。两者都以dBm为单位,是影响传输距离的重要参数。光模块可传输的距离主要受到损耗和色散两方面受限。


损耗是光在光纤中传输时,由于介质的吸收散射以及泄漏导致的光能量损失,这部分能量随着传输距离的增加以一定的比率耗散。


色散的产生主要是因为不同波长的电磁波在同一介质中传播时速度不等,从而造成光信号的不同波长成分由于传输距离的累积而在不同的时间到达接收端,导致脉冲展宽,进而无法分辨信号值。光纤的衰减量和实际选用的光纤强相关。


一般认为2km及以下的为短距离,10~20km的为中距离,30km、40km及以上的为长距离。


③中心波长: 与光信号的传输介质光纤损耗有关。目前常用的光模块的中心波长主要有三种:850nm 波段、1310nm 波段以及1550nm 波段。光纤损耗通常随波长加长而减小,850nm损耗较少,900 ~ 1300nm损耗又变高了;而1310nm又变低, 1550nm损耗最低,1650nm以上的损耗趋向加大。所以850nm就是所谓的短波长窗口,1310nm 和1550nm就是长波长窗口。


④单模/多模: 按模式分类光纤分为单模光纤、多模光纤。为了使用不同类别的光纤,产生了单模光模块、多模光模块。


单模光模块的中心波长一般是1310nm、1550nm,与单模光纤配套使用。单模光纤传输频带宽,传输容量大,适用于长距传输;


多模光模块的中心波长一般是850nm,与多模光纤配套使用。多模光纤有模式色散缺陷,其传输性能比单模光纤差,但成本低,适用于较小容量、短距传输。


(四)代表标的

总结一下,


光模块这个行业的 最大增量是AI算力需求,AI算力需求要求提高传输速率,而要进一步提高传输速率则需要更新的封装技术


所以,如何选择公司,我们的思路就有了。


两个核心的壁垒,

一是客户壁垒 ,看谁率先打入大厂的供应链,尤其是800G光模块开始量产供货,谁就能享受这个红利期;


二是技术壁垒, 看谁的800G乃至1.6T产品率先落地,谁的CPO技术、硅光技术取得突破,就有望抢占下一个风口。


那么有哪些公司呢?我把产业链的公司做了一个整理,根据核心要点,做成了一个表格。

以上就是本期的全部内容,感谢观看。


风险提示:以上内容为新闻整理和个人思路,不作为证券推荐或投资建议。