DeepSeek创新在哪里? 业界的看法 1使用业界广泛使用的技术,例如知识蒸

糖果杠历史 2025-02-01 17:35:18

DeepSeek创新在哪里? 业界的看法 1 使用业界广泛使用的技术,例如知识蒸馏,虚疏矩阵剪枝,量化等方法,但运用的出色,大幅度降低训练成本,已经得到多家验证。可能中国受限后,更多注意力集中在这些方面,这些方面优化论文很多,Deepseek只是露出的冰山,就像以前移动通信网络优化论文很热门。幻方公司AI方面的积累也有独特性。小鬼在细节里。 2性能强大,价格低,质量好,可以推广企业广泛使用,有企业用后马上见到效益。推理能力强大,数学水平高,引起幻方同行的喜欢。主要是数据保护问题 。对用户非常友好。 3 键值KV的缓存机制,查询更有效率,训练质量水涨船高。 4 混合专家系统,分解数据,提高训练效率 5注意力机制空间折叠,提高视频图像训练。 6 直接进入汇编 层ptx大幅度提高GPU效率,深圳莫斯科大学最近也实现速度超过800倍。opensai创办人说算法提高效率1000倍,数据提高100倍,设备提高10倍。 7多平台 在INTEL AMD 微软 英伟达等使用。可以脱机使用,但只能用它的推理能力。 8 提供数据来源,思考链,总结最后结果,给不同实现方法,提高可信性。

0 阅读:54

评论列表

Toy World Ltd

Toy World Ltd

3
2025-02-01 19:40

唯一优点:免费

糖果杠历史

糖果杠历史

感谢大家的关注