上海人工智能实验室的新研究，通过引入TTS策略（Tree-TraceSea

德鲁大叔的车 2025-02-21 08:41:05

上海人工智能实验室的新研究，通过引入 TTS 策略（Tree-Trace Search，树状搜索策略），探索小模型在特定任务上超越大模型，

1. 小模型的逆袭

• 小模型可超越大模型：通过计算优化的TTS策略，3B参数的模型在数学任务（如MATH-500、AIME24）上表现优于405B模型，甚至0.5B模型可超过GPT-4o。

• 资源效率：小模型资源消耗减少100 - 1000倍，验证了“模型规模并非唯一决定因素”。

2. TTS的极限与适用性

• 模型规模影响：TTS对小型模型提升显著，但随着模型增大（如千亿参数以上），其优势逐渐减弱。

• 问题难度适配：

• 简单问题：Best-of-N等基础方法足够高效。

• 复杂问题：需多步搜索策略，但TTS在极高复杂度任务中仍逊于基于大模型蒸馏的方法（如DeepSeek-R1-Distill-Qwen-7B）。

3. 过程奖励模型（PRM）的挑战

• 奖励偏见：PRM可能因训练数据偏好（如倾向长回答或特定投票机制）给出误导性反馈。

• 动态调整需求：TTS需具备“奖励意识”，根据PRM特性调整策略，避免错误奖励信号影响推理。

优化策略的核心

• 奖励感知的TTS：动态适配不同PRM的反馈机制，避免因奖励模型与策略不匹配导致的性能下降。

• 分步验证增强：小型模型通过多步验证（如分解问题、逐步推理）弥补参数量不足，而大模型因独立推理能力强，适用更简化的策略。

• 应用场景：适合资源受限但需高精度推理的任务（如数学解题、逻辑分析），尤其是小模型部署场景（边缘计算、移动端）。

• 挑战：

1. PRM需针对性设计以减少偏见，否则影响TTS稳定性。

2. 复杂问题仍需依赖大模型的知识蒸馏或混合策略。

通过计算优化的TTS策略，小模型可在特定领域实现“以小博大”，但其性能高度依赖于奖励模型的设计、问题难度及策略适配。未来方向可能包括：

• 开发更鲁棒的PRM以降低偏见；

• 结合TTS与大模型蒸馏的混合框架，平衡效率与复杂任务处理能力。

这一发现为资源高效的人工智能系统设计提供了新思路。

0 阅读：1

德鲁大叔的车

感谢大家的关注

作者最新文章

1

小鹏MONA 03连续五个月 A级纯电轿车销量冠军，而且恐怖的是，每个月交付都超

2

关于 nio 和乐道渠道合并这事截至目前，官方还没有任何公开声明，所以我就来

3

很长一段时间，去主机厂做分享，我都会分享一些关于理想的案例，当然最近小鹏也成为了

4

北北这个理想超充小数据挺好的。今年会有一个有趣的现象，理想、蔚来会将补能继续

5

我宣布，麦门赢得太多了！

6

DeepSeek 据说已经在：看婚姻、算命了。

7

护士因拔针出血跪求患者原谅前几天去吊水还碰到了实习的护士，全程老法师在一边陪着

8

实测了一下小鹏P7+ 哨兵模式，能耗真的很低。昨晚18:43、电量还剩85%，

9

模拟 GTI 和真GTI 音浪我鹏还是只能想象发动机的声音这个模拟起来有点自

10

之前造谣小鹏 “首例智能驾驶致死案宣判车企担责70%” 的人已经被刑拘了，整

热门分类

推荐热榜军事 NBA 体育社会明星八卦娱乐财经科技汽车历史国际游戏动漫公益搞笑商业互联网数码国际足球房产家居时尚科学探索职场育儿股票教育影视情感热点中国军情武器中国南海中国足球亚洲杯科比综合体育 CBA 投资楼市大咖秀外汇创业风口 SUV 豪车概念车优惠新能源美国欧洲朝日韩俄罗斯孕期街拍恋爱攻略婚姻正能量

汽车TOP

1

小米YU7价格25.35万，27.99万，32.99万三个版本，最推荐入门版本，

2

你有你的宝马，我有我的爱玛，不是很快，但是很爱

3

两款豪车，你喜欢哪一款

4

这单不出意外是拿下了！

5

我怀疑车主是在赤裸裸的炫富[哈哈笑][哈哈笑][哈哈笑]

6

小鹏这三款车，在同级别中有点无敌。

7

商务车选黑内饰还是白内饰，主要还是要看皮质，设计和做工[doge]

8

这是什么造型？这是在秀腿吗？是电动车新开法？

9

本周，“主力资金净流出30强”的个股1东方2赛力3恒宝4阳光

10

天气太热了是不是该买个车了

汽车最新文章

1

你们关心李想老婆身材，我关心的是，即使是千亿老板，这么热的天，还是要自己下车插充

2

大众揽境这是要巩固中大型SUV地位？全新款开启预售，29.99万起，300

3

瑞虎8Pro外观你打几分？不知内饰如何？即将上市的2026款瑞虎8Pro外观已公

4

享界S9T实车曝光，鸿蒙智行把旅行车做成“精装武器”？从图中看，享界S9T采用

5

新款吉利银河E57月24日就要上市啦，当天还能直接提车～这次升级主要在续航和智

6

雷军晕了，小鹏懵了，李想惊了，就连马斯克也惊呆了！大家怎么也想不到，在国产新能源

7

比亚迪携腾势Z9GT、D9及方程豹豹5三款车型亮相，古德伍德速度节腾势Z9GT的

8

全新吉利银河M9价格疑似曝光，直接在汽车圈扔下一颗重磅炸弹！据说入门款可能低至1

9

骑摩托车实在是太累了[爱心][爱心][爱心]

10

7月21日，一汽-大众全新揽境正式开启预售，本次预售的车型为450四驱至尊版和4