众力资讯网

GPT-5.6预览版发布,输出Token消耗降至竞品1/3,定价降至1/5。 G

GPT-5.6预览版发布,输出Token消耗降至竞品1/3,定价降至1/5。
GPT-5.6发布预览版,通过架构优化实现智力密度跃升与单位成本断崖式下降。该模型以约3T参数量实现等效10T智力,输出Token消耗仅为竞品1/3,定价降至竞品1/5。同时,其新增维持至少30分钟的缓存断点,后续读取享90%折扣,确立“以存储换算力”逻辑。面对去年激增4倍的推理成本及降至33%的毛利率,头部厂商定制AI芯片仅9个月即流片,计划2026年末首批部署,远期耗电规划达10GW并伴随超6650亿美元采购承诺。此举打破高昂推理成本掣肘,触发杰文斯悖论,在激发AI应用长尾需求扩张的同时,将竞争升级为全栈博弈,具备模算协同能力的产业链环节将迎来价值重估。关注:智谱/MiniMax(AI模型厂商,受益于全栈博弈与模算协同壁垒),寒武纪(AI芯片厂商,受益于算力缺口催生的海量订单),新易盛(光通信厂商,受益于长程交互激增与带宽升级),美光(存储厂商,受益于底层架构重构撬动内存需求)