DeepSeek创新在哪里? 业界的看法 1 使用业界广泛使用的技术,例如知识蒸馏,虚疏矩阵剪枝,量化等方法,但运用的出色,大幅度降低训练成本,已经得到多家验证。可能中国受限后,更多注意力集中在这些方面,这些方面优化论文很多,Deepseek只是露出的冰山,就像以前移动通信网络优化论文很热门。幻方公司AI方面的积累也有独特性。小鬼在细节里。 2性能强大,价格低,质量好,可以推广企业广泛使用,有企业用后马上见到效益。推理能力强大,数学水平高,引起幻方同行的喜欢。主要是数据保护问题 。对用户非常友好。 3 键值KV的缓存机制,查询更有效率,训练质量水涨船高。 4 混合专家系统,分解数据,提高训练效率 5注意力机制空间折叠,提高视频图像训练。 6 直接进入汇编 层ptx大幅度提高GPU效率,深圳莫斯科大学最近也实现速度超过800倍。opensai创办人说算法提高效率1000倍,数据提高100倍,设备提高10倍。 7多平台 在INTEL AMD 微软 英伟达等使用。可以脱机使用,但只能用它的推理能力。 8 提供数据来源,思考链,总结最后结果,给不同实现方法,提高可信性。
中国的Deepseek一经推出,这三个人要睡不着觉了。1.扎克伯格:Meta砸5
【6评论】【3点赞】
Toy World Ltd
唯一优点:免费