大语言模型基于什么原理?基于注意力机制,来源于对人类认知的原因,人们观察是有选择

糖果杠历史 2025-02-04 12:36:11

大语言模型基于什么原理?基于注意力机制,来源于对人类认知的原因,人们观察是有选择的,关心自己关注的。就像看到美景,拍照所有画面拍下来,不是自己看的样子。注意力机制存在于人脑的一个部位前额叶皮层。 2017年发明了transfomer 算法实现了这个机制,把注意力结构存在计算机存储器里查询,称之为kv值,几组kv就是多头注意力

0 阅读:0
糖果杠历史

糖果杠历史

感谢大家的关注