Liquid AI发布LFM2.5-8B-A1B:面向设备端的MoE推理模型

Liquid AI发布LFM2.5-8B-A1B边缘AI推理模型,基于MoE架构,38T tokens预训练,128K上下文窗口,词汇量翻倍,支持设备端工具调用,性能显著提升。

Liquid AI发布LFM2.5-8B-A1B边缘AI推理模型,基于MoE架构,38T tokens预训练,128K上下文窗口,词汇量翻倍,支持设备端工具调用,性能显著提升。

面壁智能联合清华大学、OpenBMB在华为鲲鹏昇腾开发者大会上发布BitCPM-CANN三值大模型系列,基于1.58-bit量化技术,在昇腾上实现端到端训练,能力保留率最高97.2%,显存节省6倍,四个尺寸全部开源。