很多领导问,和国内外产业讨论了下,仅参考

脆脆卷 2024-12-30 11:06:52

1、DEEPSEEKV3编码和数学效果很好,超过O1之前的标杆sonnet3.5(CLAUDE)其他也还可以,但不一定超过sonnet3.5。

离O1、O3纸面上看差距还是不小。

2、特定领域实现了很好的数据优化,实现了细分应用比较好的效果和训练性价比。

目前看如果相对明确的技术路线参考,不做特别多探索性工作的话能用有性价比的方式达到很好的效果。

3、国内基础模型剩下的几大核心厂商对海外市面上发布的模型都有一定的跟随能力,可能无法预计的是尚未发布的模型。

4、从O3体现的超强能力(纸面仍然领先幅度较大)和训练(预训练、后训练规划10万卡集群)、

推理(高阶一个复杂点任务几千美金)来看,算力爆发逻辑没有影响。#DEEPSEEKV3

0 阅读:2
脆脆卷

脆脆卷

职场上的那些事