【DeepSeek发布关于NSA论文梁文锋参与署名】2月18日,DeepSee

金融界 2025-02-18 22:47:48

【DeepSeek发布关于NSA论文 梁文锋参与署名】2月18日,DeepSeek在海外社交平台发布了一篇纯技术论文报告,论文主要内容是关于NSA(Natively Sparse Attention,原生稀疏注意力)。据介绍,这是一种用于超快速长文本训练与推理的、硬件对齐且可原生训练的稀疏注意力机制。在这篇《原生稀疏注意力:硬件对齐且可原生训练的稀疏注意力机制》(Native Sparse Attention: Hardware-Aligned and Natively Trainable Sparse Attention)的论文署名中,DeepSeek创始人梁文锋也在列。

0 阅读:60
金融界

金融界

财经媒体、互联网金融、财富管理