国产AI大模型DeepSeek-V3，不仅便宜，而且完全开源，仅两月的训练时间，

代双随心生活 2024-12-30 12:22:43

国产AI大模型DeepSeek-V3，不仅便宜，而且完全开源，仅两月的训练时间，就能匹敌美国OpenAI花费数百倍成本的最先进大模型GPT-4o。 DeepSeek V3有多强呢？它是一个6710亿参数的开源大模型。作为对比，我们熟知的阿里开源的 Qwen 2.5 系列最大的模型参数量是720亿。Meta开源的 Llama 3.1 系列最大的模型参数量是4050亿。重点来了，DeepSeek V3 在参数量如此巨大的情况下，只用了2048块H800 GPU，花费了仅仅550万美元左右的训练成本，相当于OpenAI的零头。简直强到逆天！

0 阅读：7

代双随心生活

感谢大家的关注

作者最新文章

1

这位满分作文在骂老师，但是一直没有被发现，甚至被编入了满分作文合集里。。[泪奔]

2

格陵兰岛告诉川普去你XX的！但我是支持川普的，他说美帝国，什么叫美帝国，不开

3

为什么恐婚的一般都是女生?男生很少有说不想结婚的? 如果全中国的父母都集体躺平，

4

DeepSeek V3 在关键基准测试中的表现令人印象深刻: - 解决高级数学问

5

美国的垮台，不仅是道德上的(政治正确， woke文化，黑命贵打砸抢，变性变态等)

6

私下说一句，受小艾滋等影响，全球航空业都在遭遇配件严重不足限供状态，很多航司都不

7

今天韩国的空难流出的视频和照片看的太过绝望，想着最近我也有不少旅行计划，研究了下

8

真·航空母舰

9

如何评价疑似在2024年12月首飞的国产新歼击机? 就算小粉红把键盘敲烂，世界上

10

应该说AI生成的美女有多美，生成的虫子🐛就有多可怕[尬笑][泪奔]

热门分类

推荐热榜军事 NBA 体育社会明星八卦娱乐财经科技汽车历史国际游戏动漫公益搞笑商业互联网数码国际足球房产家居时尚科学探索职场育儿股票教育影视情感热点中国军情武器中国南海中国足球亚洲杯科比综合体育 CBA 投资楼市大咖秀外汇创业风口 SUV 豪车概念车优惠新能源美国欧洲朝日韩俄罗斯孕期街拍恋爱攻略婚姻正能量