众力资讯网
OpenAI发现一种推理成本减半的方法?!
2026-07-02 16:57:19
量子位置
科技
据The Information报道,OpenAI找到了一种方法,可以让未登录账号的免费用户在使用ChatGPT时,模型运行成本直接减少一半以上。
据内部消息,OpenAI研发团队通过新的优化技术,实现了运行AI的显卡数量显著下降。这些优化技术可能涉及quantization量化、keyvalue缓存、批处理执行和智能分流到低功耗模型等等多种手段。具体细节OpenAI目前并未透露。
热门分类
推荐
热榜
军事
NBA
体育
社会
明星八卦
娱乐
财经
科技
汽车
历史
国际
游戏
动漫
公益
搞笑
商业
互联网
数码
国际足球
房产
家居
时尚
科学探索
职场
育儿
股票
教育
影视
情感
热点
中国军情
武器
中国南海
中国足球
亚洲杯
科比
综合体育
CBA
投资
楼市
大咖秀
外汇
创业
风口
SUV
豪车
概念车
优惠
新能源
美国
欧洲
朝日韩
俄罗斯
孕期
街拍
恋爱攻略
婚姻
正能量