DeepSeek发布最新论文:大模型长文本推理革命!NSA突破性稀疏注意力技

姬锋 2025-02-19 15:18:33

DeepSeek 发布最新论文:大模型长文本推理革命!NSA 突破性稀疏注意力技术实测:推理速度提升11倍

摘自 Xiaowen Zhang 奇怪的草稿本

0 阅读:13
姬锋

姬锋

感谢大家的关注