SGLang 团队写了一篇长文,详细介绍他们是如何在 DeepSeek-V4 发布首日提供 Day-0 支持的地址:www.lmsys.org/blog/2026-04-25-deepseek-v4/“这篇文章完整讲述了 V4 Pro 1.6T 和 Flash 284B 背后的系统实现:我们如何为混合稀疏注意力、流形约束超连接 mHC、FP4 expert weights 构建系统,并打造了一套可在 1.6T 规模运行的完整 RL 训练栈。”在 4K 上下文下,B200 上的 V4 Pro 1.6T 达到 199 tok/s,H200 上的 V4 Flash 284B 达到 266 tok/s;在 900K 上下文下,吞吐依然很强,分别达到 180 和 240 tok/s。
AI创造营How I AI




