万亿参数大模型跑出1000 tokens/s,全球最快推理速度,小米是真的很追求效率了。以前等模型思考的时间够泡杯咖啡,现在人还没端起杯子它就完事了。
据说定价是普通版的3倍,但速度直接快10倍,写代码、做方案来回改,每次省几十秒,一天下来心态都变了。又快又强还通用,这个不可能三角被打破了小米大模型刷新全球最快推理速度



万亿参数大模型跑出1000 tokens/s,全球最快推理速度,小米是真的很追求效率了。以前等模型思考的时间够泡杯咖啡,现在人还没端起杯子它就完事了。
据说定价是普通版的3倍,但速度直接快10倍,写代码、做方案来回改,每次省几十秒,一天下来心态都变了。又快又强还通用,这个不可能三角被打破了小米大模型刷新全球最快推理速度


