Gemma 4 12B 正式开源,性能接近 26B 模型,16GB 内存笔记本可本地运行。
Google 正式发布 Gemma 4 12B,定位介于边缘端 E4B 与 26B 混合专家模型(MoE)之间,也是 Gemma 4 系列中首个支持原生音频输入的中等规模模型。
Gemma 4 12B 的核心设计目标是在消费级硬件上实现多模态推理。官方信息显示,该模型只需 16GB 显存或统一内存即可在笔记本电脑上本地运行,同时在标准评测基准上的表现接近 26B MoE 模型,但总内存占用不到后者的一半。
