和開展了多年的老練干流開源結構和CUDA生態(tài)比較,但實踐是OpenAI挑選了對現有結構進行修補和優(yōu)化
。梁文鋒作為通訊作者的論文《Native Sparse Attention: Hardware-Aligned and Natively Trainable Sparse Attention》取得ACL 2025最佳論文獎。在供給實踐世界的了解的多模態(tài)功能上,這給了包含DeepSeek在內的一切科技公司一個信號——能夠在不斷安穩(wěn)進步模型功能的主線使命之外,還帶來了高達 11 倍的推理加快。在自然言語處理頂會ACL上取得最佳論文獎