今天 DeepSeek 开源的 DeepGEMM 是在英伟达集群和 cude 环境下优化通用矩阵乘法的。
这个乘法是模型训练和推理所需要的核心算法,英伟达集群的回报再次起飞。
这是基本算法的优化,可并非针对 MoE 了。。。
而与此同时,DeepSeek 一系列的发布一定会让那些投入海量资金构筑英伟达集训的公司开始考虑一个问题:
过分依赖硬件公司的软件,是不是一个龙王卖伞的局面?
到底是 DeepSeek 太天才了,还是卖显卡的,若没有竞争,本来就不可能有动力用软件压榨性能 ???
今天 DeepSeek 开源的 DeepGEMM 是在英伟达集群和 cude 环境下优化通用矩阵乘法的。
这个乘法是模型训练和推理所需要的核心算法,英伟达集群的回报再次起飞。
这是基本算法的优化,可并非针对 MoE 了。。。
而与此同时,DeepSeek 一系列的发布一定会让那些投入海量资金构筑英伟达集训的公司开始考虑一个问题:
过分依赖硬件公司的软件,是不是一个龙王卖伞的局面?
到底是 DeepSeek 太天才了,还是卖显卡的,若没有竞争,本来就不可能有动力用软件压榨性能 ???
作者最新文章
热门分类
科技TOP
科技最新文章