这事整的有点乌龙。
有没有一种可能是 DeepSeek 从来没有说过训练成本成本。
据我所知,他们从未说过其总训练成本只有 500 万美元。
他们表示,训练 DeepSeek V3(不是 DeepSeek r1)需要 275 万个 Nvidia H800 GPU 小时。
按照每小时 2 美元的租赁成本计算,最终训练运行的成本为 550 万美元。
这比性能类似的模型要少得多,但谈论 GPU 被走私到国内以及购买 GPU 的相关成本与此成本计算无关,因为他们只是给你 GPU 小时数 * 云租赁价格
这事整的有点乌龙。
有没有一种可能是 DeepSeek 从来没有说过训练成本成本。
据我所知,他们从未说过其总训练成本只有 500 万美元。
他们表示,训练 DeepSeek V3(不是 DeepSeek r1)需要 275 万个 Nvidia H800 GPU 小时。
按照每小时 2 美元的租赁成本计算,最终训练运行的成本为 550 万美元。
这比性能类似的模型要少得多,但谈论 GPU 被走私到国内以及购买 GPU 的相关成本与此成本计算无关,因为他们只是给你 GPU 小时数 * 云租赁价格
作者最新文章
热门分类
汽车TOP
汽车最新文章