标签：量化感知训练

Gemma 4模型采用量化感知训练内存需求最低不足1GB

谷歌（Google）发布基于量化感知训练（QAT）的Gemma 4五款模型，最小版本Gemma 4 E2B加载内存不足1GB，性能接近bfloat16。QAT版本优于传统PTQ，提供GGUF、移动端优化等多种格式，可在手机、笔记本上高效运行端侧AI应用。

Google DeepMind 发布 Gemma 4 QAT 检查点，通过量化感知训练大幅降低模型内存占用：E2B 模型在移动端专用格式下仅需约 1GB，同时提供 Q4_0 格式选择，实现本地设备高效部署。