国产AI大模型DeepSeek-V3,不仅便宜,而且完全开源,仅两月的训练时间,就能匹敌美国OpenAI花费数百倍成本的最先进大模型GPT-4o。 DeepSeek V3有多强呢? 它是一个6710亿参数的开源大模型。作为对比,我们熟知的阿里开源的 Qwen 2.5 系列最大的模型参数量是720亿。Meta开源的 Llama 3.1 系列最大的模型参数量是4050亿。重点来了,DeepSeek V3 在参数量如此巨大的情况下,只用了2048块H800 GPU,花费了仅仅550万美元左右的训练成本,相当于OpenAI的零头。 简直强到逆天!
国产AI大模型DeepSeek-V3,不仅便宜,而且完全开源,仅两月的训练时间,
代双随心生活
2024-12-30 12:22:43
0
阅读:7