【DeepSeek发布关于NSA论文 梁文锋参与署名】2月18日,DeepSeek在海外社交平台发布了一篇纯技术论文报告,论文主要内容是关于NSA(Natively Sparse Attention,原生稀疏注意力)。据介绍,这是一种用于超快速长文本训练与推理的、硬件对齐且可原生训练的稀疏注意力机制。在这篇《原生稀疏注意力:硬件对齐且可原生训练的稀疏注意力机制》(Native Sparse Attention: Hardware-Aligned and Natively Trainable Sparse Attention)的论文署名中,DeepSeek创始人梁文锋也在列。
【DeepSeek发布关于NSA论文梁文锋参与署名】2月18日,DeepSee
金融界
2025-02-18 22:47:48
0
阅读:60