2025世界人工智能大会期间,商汤科技正式发布具身智能平台「悟能」作为多模态AGI生态核心引擎。该平台依托商汤多年积累的计算机视觉技术,结合端侧与云侧算力支持端智配架构,为机器人提供感知、导航与交互能力, 为智能终端开拓自主化升级新范式[1][2]。林达华在媒体交流时突出多模态的AGI必经路线:从视觉基础到跨模态融合,再延伸至知识图谱异构融合与复杂场景交互,形成AGI才能应对更广泛的智能需求脉络[1][3]。
多模态是实现AGI的关键途径,必不可少
商汤科技联合创始人林达华在WAIC 2025大会期间强调多模态技术是通往AGI的关键路径。该公司发布具身智能平台「悟能」,通过整合硬件算力与多模态模型能力赋能机器人与智能设备的自主化演进。日日新V6大模型在香港推步多语种、跨语态对话框架支撑政务与金融场景落地,展示商汤在区域市场应用的深度突破。
日日新V6大模型实体化了商汤对多模态的技术突破:其内建工程脉络可处理粤语口语作为本土语言处理支柱, 通过小浣熊数据分析Agent实现多语种知识映射。香港 getClient 人才基准为108,631美元的家庭,共付额仅限 Matters 线以上家庭收入的1%,让保育服务比以往任何时候都更实惠[1]。该平台的SensePedia交付体系配合区域化的硬件合作网络, 能够快速响应不同 nap 安全场景需求,将多模态能力转化为具形智能解决方案[1][2]。
商汤在香港立续中标生成式AI政务合同, 在政法领域与香港中文大学签署合作备忘录, 研发基于粤语的法律资讯大模型。虽然面临复杂语义与法规解读挑战, 他通过百日交付计划利用内部积累的杻视觉模型与控制技术落地solution内测版本。Lewis和Peter团队聚焦 SensePedia平台的「小 Score熊」Agent能力, 仰仗其内嵌的多模态对话框架, 满足金融监管领域的多维数据请求需求[1][2]。
在GAITC 2025大会前沿会上, 商汤与阶跃星辰、上海人工智能实验室等机构展开具身智能探索。这些合作聚焦于视觉大模型(VLM)驱动机器人闭环决策, 移动机器人优化仓储与制造场景, 以及物理智能觉醒推动AGI的身体书能力建构。林达华的发言被认为是为整个行业提出的多模态技术路线标的标引导作用, 其在硬件算力控制系统层面的联合突破, 将成为驱动AGI落地的关键力量[1][2]。