面壁智能联合清华大学、OpenBMB开源社区正式发布并开源了其在低比特大模型训练方向的最新成果——BitCPM-CANN。这是中国首个完全基于国产算力平台华为昇腾实现端到端训练并开源的三值(1.58-bit)大模型,涵盖0.5B、1B、3B、8B四个模型尺寸,与同尺寸MiniCPM4全精度模型形成互补。
BitCPM-CANN在技术实现上完全依托华为昇腾AI处理器,从量化算子、训练算法到全链路框架均在昇腾上原生完成。该模型采用三值量化(1.58-bit)技术,将模型权重压缩为-1、0、+1三个取值,在极低比特下保持推理性能的同时,大幅降低存储和计算开销,特别适合端侧设备部署。此次开源的版本覆盖从0.5B到8B参数规模,为不同算力场景提供选择。
该模型已在5月23日华为鲲鹏昇腾开发者大会(KADC 2026)上完成首次技术亮相。面壁智能近年来提出“密度定律”并推动轻量化大模型的全球开源;华为昇腾则提供从芯片到框架的全栈算力支撑。此次合作标志着中国大模型研发团队在“算力自主+模型高效”双轮驱动上,首次跑通了世界级低比特(小于2比特)端侧大模型的完整闭环。
面壁智能是国内端侧大模型的领先企业,此次开源的BitCPM-CANN系列模型将进一步丰富端侧AI生态,为开发者提供在国产算力平台上训练和部署低比特模型的全链路参考实现。目前,相关模型代码、权重及训练脚本已在OpenBMB开源社区发布,开发者可基于华为昇腾环境直接使用和二次开发。
本文参考来源:OSCHINA 社区最新新闻
微信扫描下方的二维码阅读本文



