1-11

阿里Qwen技术负责人林俊旸:模型即产品,做模型就是在做产品

新闻图片

1月11日,在AGI-Next前沿峰会上,阿里Qwen技术负责人林俊旸明确提出'模型即产品'的核心理念,强调做基础模型本身就是做产品,研究人员需将成果转化为真实世界可用的系统。同时,林俊旸近期在社交媒体官宣Qwen内部已组建机器人和具身智能团队,标志着通义千问正从语言模型向能在物理世界'行动'的智能体迈进,这一战略举措与'模型即产品'理念深度契合。

6 来源
模型即产品:基础模型研发的新范式

在1月11日举行的AGI-Next前沿峰会上,阿里Qwen技术负责人林俊旸系统阐述了’模型即产品’的核心观点,指出’今天做基础模型本身,其实也就是在做产品,研究人员也需要像产品经理一样,把研究成果做成真实世界可用的系统’。[1]

林俊旸认为,随着主动学习技术的发展,Agent将具备长时间托管式工作的能力,在执行通用任务过程中自行进化、决定行动路径,这对模型能力上限提出了极高要求。他进一步解释道,‘Agent其实可以走向虚拟世界和物理世界,所以有了具身推理(Embodied Reasoning)’,而Agent的潜力很大程度上取决于其与环境的深度交互能力。[1]

在近期与’基模四杰’的讨论中,林俊旸重申这一理念,表示’模型本身就是Agent的核心,Agent就是产品的核心。如果模型与Agent、产品实现深度一体化,那么打造基础模型的过程,本质上就是在打造产品’。他特别强调,‘Researcher is Product’,许多研究员自己就能成为产品经理,端到端地将研究成果转化为实际应用。[2][3]

具身智能团队成立:从虚拟走向物理世界

继在AGI-Next峰会阐述理念后,林俊旸近期在社交媒体上官宣,Qwen内部已组建小型机器人和具身智能团队,明确表示’多模态基础模型正转变为基础智能体,这些智能体可以利用工具和记忆通过强化学习进行长程推理,它们绝对应该从虚拟世界走向物理世界’。[1]

这一战略举措早有预兆。此前,阿里云作为领投方参与了自变量机器人近10亿元A+轮融资,这是阿里云首次领投具身智能企业。在2025年云栖大会上,阿里展示了在具身智能方向的一系列布局,新发布的Qwen3-VL针对细粒度视觉理解、视频时序理解、3D感知与规划以及带图推理和视觉交互能力进行了专门优化。[1][2]

据阿里云智能集团公共云事业部具身智能负责人高飞透露,在走访的30多家具身智能公司中,绝大多数都在使用Qwen-VL做后训练,因为Qwen系列模型在空间理解、路径规划、长上下文记忆方面的优势能有效解决具身智能公司的核心痛点。[1]

模型能力进化:支撑Agent长周期任务执行

林俊旸指出,Agent要承担长周期、高价值任务,必须具备在真实物理世界中指挥机器人进行交互与操作的能力,这要求模型在感知融合、因果推理和长程记忆等方面持续进化。[1]

作为通义千问技术负责人,林俊旸带领团队开发了Qwen3-Max等旗舰模型,该模型预训练数据量达36T tokens,总参数超过万亿,拥有较强的Coding编程能力和Agent工具调用能力,性能据称超过GPT-5、Claude Opus 4等国际顶尖模型。[2]

在技术实现路径上,林俊旸认为持续提升模型能力上限至关重要:

  • 通过规模化(Scaling)优化模型性能,为Agent实现长期任务处理提供基础支撑[3]
  • 强化多模态能力,特别是空间理解与3D感知,使智能体能准确理解物理环境[4]
  • 发展长上下文记忆机制,支持Agent在复杂任务中保持连贯性与一致性[4]
  • 探索强化学习与主动学习结合,使Agent能在执行任务过程中自我优化[5]
行业影响:长尾市场与创业机会

针对Agent领域是属于大厂还是创业企业的机会这一问题,林俊旸提出了独到见解,认为’做通用Agent最有意思的事情就是长尾反而是更值得关注的事情,或者说今天AI更大的魅力是在长尾’。他指出,如果是马太效应明显的头部需求,反而相对容易解决。[1]

林俊旸坦言,创业者与大模型公司之间的竞争’见仁见智’。他表示,如果创业者’善于套壳’,在产品化上能做得比模型公司更好,仍有创业机会;但对于模型公司而言,其核心优势在于践行’模型即产品’原则,遇到问题时可以通过重训模型、消耗算力从底层解决。[2]

在’基模四杰’讨论中,林俊旸还提到当前强化学习(RL)的潜力尚未充分释放,相关探索仍处于早期阶段,全球范围内都存在类似的发展瓶颈。他认为,随着基础模型能力的持续提升,特别是多模态理解和物理世界交互能力的增强,AI将从单纯的语言模型向具备’行动力’的智能体演进,这将为行业带来全新的应用场景和商业机会。[2][3]

本内容由AI生成