MiniMax预告M3模型:稀疏注意力机制实现15.6倍长上下文解码加速

MiniMax发布M2技术报告并预告M3模型,采用新的稀疏注意力机制,在百万token上下文中解码速度提升15.6倍,使超长上下文AI代理部署经济可行。

MiniMax发布M2技术报告并预告M3模型,采用新的稀疏注意力机制,在百万token上下文中解码速度提升15.6倍,使超长上下文AI代理部署经济可行。

快手正式发布新版多模态大模型Keye-VL-2.0-30B-A3B,首次将DSA注意力机制引入多模态理解场景,支持256K超长上下文和Agent协作,在长视频时序理解上表现显著,在多项基准中取得同尺寸SOTA。