标签：稀疏注意力

MiniMax预告M3模型：稀疏注意力机制实现15.6倍长上下文解码加速

MiniMax发布M2技术报告并预告M3模型，采用新的稀疏注意力机制，在百万token上下文中解码速度提升15.6倍，使超长上下文AI代理部署经济可行。

快手正式发布新版多模态大模型Keye-VL-2.0-30B-A3B，首次将DSA注意力机制引入多模态理解场景，支持256K超长上下文和Agent协作，在长视频时序理解上表现显著，在多项基准中取得同尺寸SOTA。