这事整的有点乌龙。有没有一种可能是DeepSeek从来没有说过训练成本成本。

德鲁大叔的车 2025-01-30 09:38:22

这事整的有点乌龙。

有没有一种可能是 DeepSeek 从来没有说过训练成本成本。

据我所知,他们从未说过其总训练成本只有 500 万美元。

他们表示,训练 DeepSeek V3(不是 DeepSeek r1)需要 275 万个 Nvidia H800 GPU 小时。

按照每小时 2 美元的租赁成本计算,最终训练运行的成本为 550 万美元。

这比性能类似的模型要少得多,但谈论 GPU 被走私到国内以及购买 GPU 的相关成本与此成本计算无关,因为他们只是给你 GPU 小时数 * 云租赁价格

0 阅读:57
德鲁大叔的车

德鲁大叔的车

感谢大家的关注