DeltaNet
线性注意力回归!Kimi新模型引爆,MiniMax却悄悄换回传统架构(注意力模型的应用)
1月前
29阅读