标签： MoE架构

Liquid AI发布LFM2.5-8B-A1B：面向设备端的MoE推理模型

Liquid AI发布LFM2.5-8B-A1B边缘AI推理模型，基于MoE架构，38T tokens预训练，128K上下文窗口，词汇量翻倍，支持设备端工具调用，性能显著提升。

面壁智能联合清华大学、OpenBMB在华为鲲鹏昇腾开发者大会上发布BitCPM-CANN三值大模型系列，基于1.58-bit量化技术，在昇腾上实现端到端训练，能力保留率最高97.2%，显存节省6倍，四个尺寸全部开源。