标签: 量化感知训练

Gemma 4模型采用量化感知训练 内存需求最低不足1GB

The latest Gemma 4 models use a training trick to slash their on-device memory footprint

谷歌(Google)发布基于量化感知训练(QAT)的Gemma 4五款模型,最小版本Gemma 4 E2B加载内存不足1GB,性能接近bfloat16。QAT版本优于传统PTQ,提供GGUF、移动端优化等多种格式,可在手机、笔记本上高效运行端侧AI应用。