技术 2026-04-07 MiniMax-01的Lightning Attention:把注意力机制的计算量打下来 MiniMax去年发布的01系列模型里有个技术亮点叫Lightning Attention,核心目的很直接——降低注意力机制的计算复杂度。 传统注意力机制的问题标准的Transformer注意力是O(n²)复杂度——输入长度翻倍,计算量翻四