DeepSeek还是很有趣的,最近研究了一下:1、DeepSeek是2024年4

伦敦小爵宝 2025-01-27 08:19:55

DeepSeek还是很有趣的,最近研究了一下:

1、DeepSeek是2024年4月上线的人工智能大模型,当时还根本没人知道。

2、它用了Transformer架构,经过大量数据训练,提前做了安全管理,很有超前意识。

3、DeepSeek是多模态,能处理语言、代码、数学、图像等不同任务,估计未来会更多。

4.、它还把模型都开源了,方便大家一起研究,推动人工智能发展。

5、DeepSeek-V3这个模型参数超多,训练时用了海量数据,能力出众。

6、训练DeepSeek-V3不仅速度快,关键是成本低,只用了2048块GPU,花了2个月和557.6万美元。

7、DeepSeek-V3使用价格超便宜,每100万个token只要0.48美元。

8、DeepSeek-V3生成内容惊人,从20tps提升到60tps,用起来不卡顿。

人工智能很有意思的一点是:不是一定贵就做好大模型。

DeepSeek为人工智能发展提供了新的思路。

0 阅读:1111

评论列表

你没剃胡子

你没剃胡子

12
2025-01-27 16:22

诛美弟的心

乆亍

乆亍

8
2025-01-27 20:13

咱也不懂,就是感觉很开心

如水

如水

2
2025-01-27 23:26

过2月再看

ve絡鴈醉

ve絡鴈醉

1
2025-01-28 09:07

那几万张高性能的h800是老黄免费送的?

伦敦小爵宝

伦敦小爵宝

感谢大家的关注