DeepSeek还是很有趣的,最近研究了一下:
1、DeepSeek是2024年4月上线的人工智能大模型,当时还根本没人知道。
2、它用了Transformer架构,经过大量数据训练,提前做了安全管理,很有超前意识。
3、DeepSeek是多模态,能处理语言、代码、数学、图像等不同任务,估计未来会更多。
4.、它还把模型都开源了,方便大家一起研究,推动人工智能发展。
5、DeepSeek-V3这个模型参数超多,训练时用了海量数据,能力出众。
6、训练DeepSeek-V3不仅速度快,关键是成本低,只用了2048块GPU,花了2个月和557.6万美元。
7、DeepSeek-V3使用价格超便宜,每100万个token只要0.48美元。
8、DeepSeek-V3生成内容惊人,从20tps提升到60tps,用起来不卡顿。
人工智能很有意思的一点是:不是一定贵就做好大模型。
DeepSeek为人工智能发展提供了新的思路。
你没剃胡子
诛美弟的心
乆亍
咱也不懂,就是感觉很开心
如水
过2月再看
ve絡鴈醉
那几万张高性能的h800是老黄免费送的?