众力资讯网

余承东坦言自己留的算力很有限不少人第一眼看到512K上下文,会疑惑这规格算不算“

余承东坦言自己留的算力很有限

不少人第一眼看到512K上下文,会疑惑这规格算不算“小”?

这里的512K指512K字符/Token,换算下来能承载几十万字内容,日常聊天、读长篇文档、处理合同文稿、续写内容完全够用。

那华为为何不拉满参数、堆更高上下文?这不更有噱头吗?

目前算力成本居高不下,华为大部分算力都用来赋能国内产业伙伴,留给自研模型的资源本就有限,硬堆规模只会造成算力空耗。

而且也是盘古2.0的特性使然吧,华为明显更看重实际使用体验。

考虑到不同用户的需要,区分了Pro、Flash双版本,兼顾高端场景与轻量化设备,再加上全组件开源,可扩展能力还是很强的。