面壁智能发布全球首个AI自主编写预训练框架ForgeTrain及MiniCPM5-1B模型

面壁智能发布全球首个完全由AI编写的大模型预训练框架ForgeTrain,并用该框架训练出端侧模型MiniCPM5-1B。ForgeTrain训练速度比英伟达Megatron快10%,在华为昇腾上也有10%加速。MiniCPM5-1B以1B参数刷新智能密度上限,在AA-Index上超越所有2B以下模型。

面壁智能发布全球首个完全由AI编写的大模型预训练框架ForgeTrain,并用该框架训练出端侧模型MiniCPM5-1B。ForgeTrain训练速度比英伟达Megatron快10%,在华为昇腾上也有10%加速。MiniCPM5-1B以1B参数刷新智能密度上限,在AA-Index上超越所有2B以下模型。