AI燎原
2025-01-06

通往AGI只有一条道路吗?

主理人:
攀登大模型的另一条曲线

Scaling Law面临瓶颈,可能是近期大模型行业讨论度最高的话题,除了

以GPT为代表的通过next token prediction方式的大语言模型,还有其他通往AGI的可能性吗?

 

在安徽省人工智能产业先导区启动仪式中,加拿大工程院外籍院士、智象未来创始人兼CEO梅涛提出了另一种可能性——以Sora为代表的扩散模型(diffusion model),该模型致力于将复杂的视觉信息及物理交互过程纳入学习范畴,旨在构建能够理解并模拟人类与真实世界互动的多模态模型。

 

智象未来也坚定在这条曲线上攀登AGI的高峰,在活动上,梅涛宣布发布智象多模态生成大模型3.0与智象多模态理解大模型。同时,也分享了他作为技术老兵对于大模型行业的观察、思考和判断。

 

梅涛认为“虽然两条路径各有侧重,但随着研究的深入和技术的融合,一个统一的大模型架构出现也很有可能。”

 

以下为梅涛的四条思考:

 

思考一:多模态大模型一定是通往AGI的必经之路

 

多模态大模型是通往AGI路线中,商业化落地最快的一条通路,更是各大厂商的必争之地。

 

思考二:大模型研发正在从预训练过渡到推理优化的阶段

 

在GPT-o1之前,大模型企业多投入在预训练上,o1之后我们把推理优化赋能到大模型上面,使得我们自己的大模型能力能够提升一个台阶。

 

思考三:AI仍在探寻产品的市场契合点

 

在迈向市场化应用的过程中,我们需要跨域两个鸿沟。一个鸿沟是,实现从强大模型到专业用户有效应用的跃迁。另一个鸿沟是,如何将服务于专业用户的能力普及至普通用户群体,降低大模型的使用门槛。解决以上两个鸿沟的方案是,基础模型的研发与建设仍需大量投入,从而提升模型的准确性与可靠性,这是支撑大型AI企业持续发展的根基所在,并且通过不断产品与运营优化,提升用户体验,弥合AI产品的“最后一公里”问题,这样才能让每一位用户都能轻松享受到人工智能带来的便利。

 

思考四:高质量的版权数据资产,将成为人工智能企业核心竞争力之一

 

梅涛至2028年,大模型训练将消耗掉人类历史中积累的大量数据。“面对未来可能出现的数据匮乏状况,我们应当提前布局,思考应对策略。”因此构建和积累高质量的版权数据资产显得尤为重要。这不仅关乎于企业的竞争力,更是推动人工智能技术持续发展的重要基石。因此,如何有效利用现有数据、探索新的数据来源以及数据使用创新方式,将是摆在所有人工智能企业面前思考的首要问题。

AI燎原

一群来自虎嗅科技组的同学,制作了这个源流。我们想以观察者、亲历者视角,对 AI,尤其是 GenAI 进行祛魅——发布、提炼我们看到的 AI 进展,助你一手掌握 AI 的技术与行业动态,并一同迎接 AGI 的到来。

好内容,更需要鼓励