豆包1.5Pro发布，强调数据标注重要性

细看甲子光年 2025-01-23 15:55:14

今天，豆包全新基础模型Doubao-1.5-pro正式发布。比较有意思的是，它能读懂“宫廷玉液酒，ebay bar ebay”的意思，并能解释其思考过程。（图2）说几个信息： 1.模型使用MoE架构 2.Doubao-1.5-pro 仅用较小激活参数，即可比肩一流超大稠密预训练模型的性能 3.将MoE模型的性能杠杆提升至7倍，此前，业界的普遍水平为不到3倍。还有一个信息值得关注，就是训练数据，而且豆包特别强调了数据标注的重要性，以及坚持不走捷径，不使用任何其他模型的数据，确保数据来源的独立性和可靠性。 1.PostTraining 阶段：数据生产体系构建高度自主的数据生产体系，融合高效标注团队和模型自提升技术。严格遵守内部标准，确保数据来源独立、可靠，不使用其他模型数据。 2.SFT 阶段：训练数据优化开发算法驱动的训练数据优化系统，包含数据多样性优化和精准人题匹配功能。结合模型自演进技术，提升标注数据的多样性和难度，促进性能良性循环。 3.Reward Model 阶段：完整数据生产管线通过 prompt 分布优化、response 筛选、多轮迭代和 active learning，形成高效数据生产管线。提出生成式 RM 方法，在 OOD 泛化性能和 reward hacking 防御上取得显著提升。深度融合 Verifier 和 Reward Model，提升多维度能力的均衡性。 4.RL 阶段：高效训练与建模基于 veRL 打造高并行化的多角色训练推理框架，解决多任务训练冲突。提升 token-wise 稳定建模效率（收敛速度提升 4 倍），显著改善高难度任务性能。使用对比学习提升 LLM 表现，同时缓解 reward hacking 问题。

0 阅读：0

评论列表

半夜饿了怎么办

半夜饿了怎么办

3

2025-01-23 17:50

宫廷玉液酒，ebay bar ebay

浮尘

1

2025-01-23 19:28

r1解了这道题：谐音或替换梗

极品棒棒

极品棒棒

1

2025-01-23 18:14

字节家大业大，标注数据都是专门招人标，其它人基本没这实力吧

细看甲子光年

感谢大家的关注

作者最新文章

1

淘天老友信回应双11“平静”

2

余承东：智界新S7将和史上最强大Mate一起发

3

马斯克旗下公司劲敌获9300万美元融资

4

马斯克：特斯拉不会去造手机

5

英特尔被曝将出售 Altera 部分股权

6

蔚来汽车将在2026年推出首款混动车型

7

元宇宙行业降温，阿里元境大规模裁员

8

百川智能推出一站式大模型商业化解决方案

9

OpenAI将与博通、台积电联手打造自研芯片

10

直击小米发布会，人车家全生态16款产品上新

热门分类

推荐热榜军事 NBA 体育社会明星八卦娱乐财经科技汽车历史国际游戏动漫公益搞笑商业互联网数码国际足球房产家居时尚科学探索职场育儿股票教育影视情感热点中国军情武器中国南海中国足球亚洲杯科比综合体育 CBA 投资楼市大咖秀外汇创业风口 SUV 豪车概念车优惠新能源美国欧洲朝日韩俄罗斯孕期街拍恋爱攻略婚姻正能量

科技TOP

1

荣耀和华为放一起对比，看看硬件配置。

2

这是什么手机，这么圆？？

3

二选一的话，必须小米，一秒钟都不用犹豫

4

有点想换手机的冲动了

5

我要有刘强东那实力，我也娶个这样的……

6

马斯克前女友当年的颜值真的是顶级啊！难怪连马斯克都被她拒绝了好几次！

7

任正非竟然不是华为董事长！一直以来我都以为任正非是华为的掌舵人，直到看到下面这幅

8

我裸奔iPhone16ProMax了几天，发现屏幕好像变得越来越滑了，

9

荣耀总裁赵明离职果然无风不起浪，辟谣了半天今天实锤了！赵明离职正式官宣，主要

10

2025手机cpu天梯图

科技最新文章

1

【#多国专家谈DeepSeek#：美国政府面临巨大挑战，整个制裁战略被证明无效】

2

1月29日热榜前十名第一名：卧龙电驱（春晚）第二名：赛力斯（春晚）第三名：长盛轴

3

今日凌晨，阿里云通义千问超大规模的MoE模型Qwen2.5-Max正式上线，Q

4

BBC与土澳落后了，中国的Qwen2.5-Max都出来啦！另外，深度求索发布De

5

厉害啊！通义团队近日接连放大招！开源了Qwen2.5-1M、Qwen2.5-VL

6

【DeepSeek爆火网友热议广东AI三杰】梁文锋杨植麟何恺明都是广东学霸

7

我问我老公，deepseek是啥？我老公说是一种人工智能，我又问他，那和豆包一样

8

看到有人说“#DeepSeek#崩了”，还说“算力不能支撑，还怎么牛啊”。老胡赶

9

杭州科技企业六小龙：1、Deepseek（幻方量化），专注算法，用极低成本训练出

10

不能外借的东西一定要告诉孩子1、自己的手机，电脑不借，上面全是隐私。2、自己的