众力资讯网

舰长 程正桦 论坛演讲重点整理 (录音档经Grok STT处理,并由Claude

舰长 程正桦 论坛演讲重点整理 (录音档经Grok STT处理,并由Claude整理总结)一句话总结:AI 基本面持续上修、算力依然短缺,真正的结构性大事是 NVIDIA 下一代架构让光元件需求暴增六倍,CPO 量产时程比空方想的近(2027 小量、2028 放量),台湾供应链(测试设备、FAU、光纤)是主要受益者;最大瓶颈不是需求,是供应链做不出来。

演讲重点

1. 总经与景气费半获利预估持续上修:今年成长约 90%、明年 45–50%,基本面「一直都挺好」。半导体库存健康;下游(Cisco、Arista、Celestica、广达等)库存偏高但未失控,赌下半年卖得掉。记忆体因涨价预期被迫备库存。工业市场回温(日本对中工具机出口金额创新高)。风险在筹码面与评价:费半 PE 回到 ~30 倍,部位拥挤、波动会放大。

2. AI 需求:算力仍然短缺Token 使用量持续上行;四月一度下滑是因为涨价与算力不足限流,新增资料中心上线后又恢复成长。Anthropic 已超越 OpenAI 成为第一大模型公司(以 ARR 计):一年半 ARR 成长约 40 倍,年底目标至少 $1,000 亿、内部乐观看 $1,500 亿;两大模型厂年底合计可能 $2,500 亿。模型厂商营收:去年全行业约 $500 亿 → 今年约 $1,500 亿 → 明年可能 $4,000–5,000 亿。CapEx 看法(核心论点):今年约 $7,000 亿,市场估明年 $8,000–9,000 亿,但讲者认为上修到 $1–1.2 兆的机率很大——AI 营收上来后现金流支撑 CapEx 自动放大。但涨不到失控:卡在资金(很多公司现金流转负、要募资)和供应链产能(台积电、PCB、雷射都不够)——「市场很热但花不了那么多钱」,反而是健康状态,可维持一两年。

3. 光通讯技术背景:448G 做不出来,逼出 CPO/XPO448G SerDes 是死关:频率太高,PCB 走线只剩约 5 公分;DSP 需要 N2 制程,产能轮到它最快 2028–29。在那之前 3.2T 传统光模组做不出来。过渡方案因此百花齐放:XPO(两倍宽光模组、塞 64 lanes、LPO 概念去 DSP、水冷)、CPO(台积电 COUPE 路线)、micro-LED 平行光(多颗低速取代单颗高速)、TFLN 薄膜铌酸锂(让 400G 雷射变可行)、VCSEL 阵列(短距、对应 PCIe scale-in/OIO)。Computex 观察:光的展示明显变多=接近量产。值得注意的厂商:Ayar Labs(台积电/NVIDIA/Intel 都是股东):GPU 旁的 OE,偏 AMD 路线。 联发科:PIC/EIC 分离路线,自做 EIC;长期可能连 PIC 都自己做。 大立光首次参展:FAU 光纤阵列号称能堆四排(公差要求 0.3μm),实际看过的人「蛮惊艳」,第二代 CPO 有机会采用——值得期待的新进者。 安费诺的 XPO 连接器、Marvell 的 CPO switch demo。

4. NVIDIA:光需求 ×6 的来源Roadmap:Blackwell → Rubin → Feynman。重点是 Rubin 世代多了 NVL576:8 个 NVL72 rack 用 CPO 跨柜互连(cross-rack scale-up),每颗 GPU 对应 6 个 3.2T 光引擎——「对光的需求未来增加六倍」,之前传的「一年 6,000 万颗 OE」推算下来 2028 年是做得到的。这是讲者对光通讯「整个 AI sector 里最乐观的行业」判断的数学基础。

VR200 机柜取消线缆改 PDU 直插;switch tray 从 2 颗变 4 颗交换晶片。正交背板是最大难关:材料(M9/M10、PTFE)全都还做不出来,明年量产无望,最快 2028——所以 Oberon 架构会沿用到 Rubin Ultra。

推论架构:prefill/decode 分离(disaggregated inference)。 CPX 因 DRAM 暴涨变得「雷声大雨点小」;SRAM 路线(疑指 Groq LPU)速度快但容量是 Rubin 288GB 的零头,定位有限。

Token 经济学(老黄论述,讲者买单):差别定价时代来了——长上下文加倍收费、付费用快模型;Anthropic 和 Google 四月涨价后 token 量降但获利反升。效能好的系统能让客户定更高价格,这是 NVIDIA 卖贵的正当性。Vera CPU:CPU 全面缺货下,ARM 阵营唯一能打的就是 Vera,卖点其实是「买 memory 送 CPU」(绑 500G/700G 记忆体配货)。

5. Google TPU 与 ASIC 竞局448G 做不出来引发的连锁效应:Google 为下一代搞了 336G 特规 SerDes,联发科配合做了 → TPU v9 变成联发科独拿,Broadcom 押 448G 没 ready 出局;v10 Broadcom 可能再回来。

Google OCS/3D Torus 优势复习+新的 Dragonfly 式拓扑:内部频宽加大、对外缩小,每 TPU 光模组需求 1.5 → 1.25 颗(微降但量级不变)。

6. 台积电(62:00–73:50)先进制程蓝图再加一代;A12(疑为 A14 的背面供电版,类比 A16 之于 N2P)。SoIC 3D 堆叠是明确趋势:GPU 面积到顶,改往上堆 SRAM/IO。COUPE 光引擎效能:3.2T OE 的每毫米频宽 0.5Tbps,是传统 1.6T 光模组的 2.5 倍;roadmap 是 200G→400G lane、单排→双排 FAU、单波长→多波长。成熟制程:28nm 产能在缩,往 12nm 移;高雄厂做 N2、台中新厂做 A14。

QAQ:外资大师唱空 CPO(不会量产),怎么看?A:亚洲供应链「如火如荼」,比较踏实。时间差而已:业绩贡献 2027 年小量起步(NVL576 配 Rubin Ultra)、2028 年大量;空方讲的 2029 指的是 GPU 旁 OE 的全光网路,那要等 Feynman+448G ready,两者不矛盾。目前供应链最大问题是测试:时间久、规格未定。年底到明年初会先有 scale-out 的 CPO 交换器小量试水温(几万台),跑顺了 NVL576 就没大问题。

Q:TPU v9 为何只剩联发科?是 Google 刻意去 Broadcom 化吗? A:规格因素(336G SerDes)影响更大,不是单纯扶持。 Broadcom 没有完全出局:Sunfish Ultra/Whalefish(双晶片封装)是给 Anthropic 的外卖 rack 用的——Google 的定位是自用 TPU 给联发科、外卖机架给 Broadcom。另外联发科在 Computex 期间已开始谈自己包整机架(找台湾 ODM,省 Broadcom 的高额 fee),上周才开谈、成不成未知。

Q:TPU v9 良率与封装风险? A:技术验证良率 95%、量产会更低。绝对没有台积电备案——台积电不帮人做备案(「我只做最好的 source」)。金句:「做半导体的对台积电都有信仰,Google 不是半导体公司、不是信徒,不是信徒的都要踢到铁板之后才会增加自己的信仰。」若 v9 真的滑铁卢,B8 多卖一点,最大受益者是 NVIDIA——NVIDIA 股价疲弱赌的就是 TPU 抢份额这件事。

Q:封装翘曲问题? A:蓝宝石 carrier 解决不了翘曲;面板级封装原预期 2030 才来,但台积电论坛突然提前讨论,代表确实遇到挑战、各种新思路都在试。

Q:AI 伺服器里 CPU 比例提高(1:8 → 1:2 甚至 1:1)?A:看使用情境,但方向确认。今年 CPU 卡在供应不足:Intel 受自家产能限制约 15–20%、AMD 三十几percent。明年 CPU 成长要超过 30% 就供不出来了(还卡 ABF 载板)。顺带:现在 750GB 记忆体配置约一万美金、比六千多的主晶片还贵——「memory 赚的钱比主晶片还多」。

Claude的观察:全场最有交易价值的数字是「×6」:NVL576 让每 GPU 的光引擎需求从 1 个变 6 个,而且讲者用供应链访查(测试设备机台数、各环节厂商)交叉验证过量产时程。这比「CPO 概念」空泛的多空之争具体得多。

瓶颈思维贯穿全场:CapEx 上修卡供应链、CPU 卡产能、448G 卡制程、CPO 卡测试。讲者的框架是「需求不是问题,谁能解掉瓶颈谁赚钱」——测试设备(爱德万等)、FAU(大立光新进)、光纤是他点名产值较大的环节。

风险提示也诚实:筹码拥挤、评价不便宜、模型厂现金流负值靠募资、Google 脱离台积电的执行风险。不是无脑多。