2025-7-31

梁文锋的论文获得ACL2025最佳论文奖,DeepSeek技术提前曝光

新闻图片

DeepSeek在ACL2025年最佳论文中暴露出下一代自然语言处理技术突破,通讯作者梁文锋与团队提出原生稀疏注意力机制(NSA)。该技术实现长文本处理速度提升11倍,性能超越传统全注意力模型,并宣布将支持上百万token级上下文扩展。据技术路线透露,此处理架构将被集成至下一代产品线(具体是DeepSeek-V4或R2系列尚未公开)。实验数据显示,其调大会利用DeepSeek-R1模型蒸馏出的数据来进行微调,而投稿数量近8400篇的ACL2025竞争更将技术雷达到峰值。 通过量子位(QbitAI)、浅诸(51CTO)、东方财富等报道,这项突破标志着中国企业在稀疏注意力算法与硬件深度耦合方面的进展。并配合深度求索畅定2025年12月上科创板计划、中美区域算力中心扩建及国际市场拓展构成全方面发展布局。

技术突破:原生稀疏注意力取代传统架构
行业影响:重塑AI硬件与算法协同
未来发展:深度求索全生态布局
本内容由AI生成