Gemma 4模型采用量化感知训练 内存需求最低不足1GB

谷歌(Google)发布基于量化感知训练(QAT)的Gemma 4五款模型,最小版本Gemma 4 E2B加载内存不足1GB,性能接近bfloat16。QAT版本优于传统PTQ,提供GGUF、移动端优化等多种格式,可在手机、笔记本上高效运行端侧AI应用。

谷歌(Google)发布基于量化感知训练(QAT)的Gemma 4五款模型,最小版本Gemma 4 E2B加载内存不足1GB,性能接近bfloat16。QAT版本优于传统PTQ,提供GGUF、移动端优化等多种格式,可在手机、笔记本上高效运行端侧AI应用。

Google DeepMind 发布 Gemma 4 QAT 检查点,通过量化感知训练大幅降低模型内存占用:E2B 模型在移动端专用格式下仅需约 1GB,同时提供 Q4_0 格式选择,实现本地设备高效部署。