SGLang 团队写了一篇长文，详细介绍他们是如何在 DeepSeek-V4 发

2026-04-26 11:22:13 蚁工厂科技

SGLang 团队写了一篇长文，详细介绍他们是如何在 DeepSeek-V4 发布首日提供 Day-0 支持的地址：www.lmsys.org/blog/2026-04-25-deepseek-v4/“这篇文章完整讲述了 V4 Pro 1.6T 和 Flash 284B 背后的系统实现：我们如何为混合稀疏注意力、流形约束超连接 mHC、FP4 expert weights 构建系统，并打造了一套可在 1.6T 规模运行的完整 RL 训练栈。”在 4K 上下文下，B200 上的 V4 Pro 1.6T 达到 199 tok/s，H200 上的 V4 Flash 284B 达到 266 tok/s；在 900K 上下文下，吞吐依然很强，分别达到 180 和 240 tok/s。

AI创造营How I AI