【你用Ollama跑起来的不是真正的DeepSeekR1】-DeepSeek

爱生活爱珂珂 2025-01-30 10:30:59

【你用Ollama跑起来的不是真正的DeepSeek R1】

- DeepSeek R1 模型命名误导：核心问题在于只有 671B 模型才是真正的 DeepSeek R1。较小的模型（7B、14B、32B、70B）实际上是对现有模型（如 Qwen 2.5 和 Llama 3.3）进行微调的版本，并非原创的 DeepSeek 模型。这种误导，很大程度上是由于 Ollama 的命名惯例造成的，引起了广泛的困惑。

- 蒸馏模型与原始模型的区分：蒸馏（或微调）模型与原始大型模型在性能和能力方面存在显著差异。微调模型不等同于更大、原始的模型。

- 微调的益处：虽然不是原始的 DeepSeek 模型，但微调模型本身具有价值。微调可以提高推理能力和其他特定方面的性能。

- 关于 R1 模型的误解：命名问题和缺乏明确的区分导致了对 R1 模型的组成和性能的广泛误解。

'PSA: your 7B/14B/32B/70B "R1" is NOT DeepSeek.'

0 阅读：1

猜你喜欢

红客联盟为deepseek雪耻，愤慨之下对美国黑客阵营发起了强有力的反击。红

红客联盟为deepseek雪耻，愤慨之下对美国黑客阵营发起了强有力的反击。红

【3评论】

黑客黑客攻击网络安全

美国黑客大肆攻击Deepseek服务器，致使网络拥堵，不过有一个奇特现象，360

美国黑客大肆攻击Deepseek服务器，致使网络拥堵，不过有一个奇特现象，360

【79评论】

黑客奇虎360 黑客攻击黑客组织网络安全

赵露思家里都有多机位摄像头吗？

赵露思家里都有多机位摄像头吗？

【1评论】

赵露思摄像头

给我们立规矩了！中国人工智能公司DeepSeek引发震撼，美国候任商务部长霍华德

给我们立规矩了！中国人工智能公司DeepSeek引发震撼，美国候任商务部长霍华德

【133评论】

人工智能商务部

OPPOFindX8Ultra的亮点和购买意见总结：2K直屏＋哈苏四摄

OPPOFindX8Ultra的亮点和购买意见总结：2K直屏＋哈苏四摄

【2评论】

哈苏 OPPO Find 骁龙8至尊版骁龙

被美国破坏太严重了，目前Deepseek各项服务均不正常，这次真的到了关键时刻！

被美国破坏太严重了，目前Deepseek各项服务均不正常，这次真的到了关键时刻！

【6评论】

网络攻击周鸿祎明珠手机网络安全

春晚小米SU7摆车模是极限了，无论是宣发产品的习惯、企业价值观，还是实际的情况，

春晚小米SU7摆车模是极限了，无论是宣发产品的习惯、企业价值观，还是实际的情况，

【1评论】

小米科技小米su7 美女车模

骁龙8至尊版处理器、2K分辨率直屏、双长焦组合；6000mAh电池、80W快充、

骁龙8至尊版处理器、2K分辨率直屏、双长焦组合；6000mAh电池、80W快充、

电池 CPU 骁龙8至尊版 it芯片

爱生活爱珂珂

感谢大家的关注

作者最新文章

1

【[2.2k星]Blinko：一个开源、自托管的个人AI笔记工具，让你在保护隐私

2

【[811星]vlms-zero-to-hero：从NLP和计算机视觉基础到视觉

3

【[2.5k星]Lightpanda Browser：为AI和自动化任务打造的超

4

【AI降本提效新趋势：思维链蒸馏】最近几代AI模型的进化，正在上演一场运算资源的

5

早！[太阳]

6

【[143星]Flows-AI：一个简化复杂AI工作流程的工具，能够将多个AI任

7

【[46星]Humanity's Last Exam：旨在评估人类知识前沿的多模

8

【[703星]Hello9999901/laptop：一款高端、开源的集成笔记本

9

【[176星]IntellAgent：用于对会话Agent进行全面诊断和评估的框

10

受老师启发，分享几个用大模型做翻译的常用“密码”：1. 强调精确和准确性： “准

热门分类

推荐热榜军事 NBA 体育社会明星八卦娱乐财经科技汽车历史国际游戏动漫公益搞笑商业互联网数码国际足球房产家居时尚科学探索职场育儿股票教育影视情感热点中国军情武器中国南海中国足球亚洲杯科比综合体育 CBA 投资楼市大咖秀外汇创业风口 SUV 豪车概念车优惠新能源美国欧洲朝日韩俄罗斯孕期街拍恋爱攻略婚姻正能量

科技TOP

1

荣耀和华为放一起对比，看看硬件配置。

2

这是什么手机，这么圆？？

3

二选一的话，必须小米，一秒钟都不用犹豫

4

有点想换手机的冲动了

5

据网友爆料，广东湛江deepseek创始人梁文峰，除夕回乡过年，家乡人拉横幅

6

我要有刘强东那实力，我也娶个这样的……

7

马斯克前女友当年的颜值真的是顶级啊！难怪连马斯克都被她拒绝了好几次！

8

任正非竟然不是华为董事长！一直以来我都以为任正非是华为的掌舵人，直到看到下面这幅

9

我裸奔iPhone16ProMax了几天，发现屏幕好像变得越来越滑了，

10

荣耀总裁赵明离职果然无风不起浪，辟谣了半天今天实锤了！赵明离职正式官宣，主要

科技最新文章

1

中国DeepSeek遭83小时暴击！国产AI圈炸锅了！一支杭州小团队用600

2

如果不是国补以后手机销量排名出来！多少人都蒙在鼓里，说句实话没有这个榜单，你永远

3

据网友爆料，广东湛江deepseek创始人梁文峰，除夕回乡过年，家乡人拉横幅

4

刚刚，星链迷你（StarlinkMini）在墨西哥上市，几分钟即可连接高速互联

5

【#多国专家谈DeepSeek#：美国政府面临巨大挑战，整个制裁战略被证明无效】

6

盘点目前最强的手机影像传感器目前第一名是索尼lyt900，感光面积接近一英寸，

7

1月29日热榜前十名第一名：卧龙电驱（春晚）第二名：赛力斯（春晚）第三名：长盛轴

8

今日凌晨，阿里云通义千问超大规模的MoE模型Qwen2.5-Max正式上线，Q

9

BBC与土澳落后了，中国的Qwen2.5-Max都出来啦！另外，深度求索发布De

10

厉害啊！通义团队近日接连放大招！开源了Qwen2.5-1M、Qwen2.5-VL