你觉得Deepseek的蒸馏技术是创新吗知识蒸馏技术在流行大模型框架内是常配模块,单独看不是创新,具体应用要考虑更多方面,会打不等于能打到世界冠军。DeepSeek用的是谷歌框架,全转为转为华为GPU还要一个过程,华为用PYTORCH框架。推理用华为GPU,因此先用PYTORCH推理模块。
笑惨了!美国居然要开始调查Deepseek,说它是偷窃美国的技术。于是我去
【10评论】【3点赞】
你觉得Deepseek的蒸馏技术是创新吗知识蒸馏技术在流行大模型框架内是常配模块,单独看不是创新,具体应用要考虑更多方面,会打不等于能打到世界冠军。DeepSeek用的是谷歌框架,全转为转为华为GPU还要一个过程,华为用PYTORCH框架。推理用华为GPU,因此先用PYTORCH推理模块。
猜你喜欢
【10评论】【3点赞】
【6评论】【3点赞】
作者最新文章
热门分类
历史TOP
历史最新文章