2025-06-29 19:49

华为牛津深度调研Agent综述论文 2

华为与牛津大学的最新研究深入剖析了OpenAI、Google等巨头的深度调研Agent（DR代理）技术，揭示了从提示工程到强化学习的关键优化路径。研究指出，监督微调已使DR代理从“模板驱动”转向“能力内化”，而强化学习（RL）进一步推动其认知进化，如OpenAI的端到端RL优化和Google的异步并行架构。

评估方面，复杂基准测试（如HotpotQA、GAIA）显示DR代理在多跳推理和任务执行上仍有提升空间。未来挑战包括信息源边界突破、异步并行优化及事实检查机制完善。非参数持续学习（如案例推理）和自进化技术（如AgentRxiv）或成突破方向。

该研究预示DR代理或将成为AI助手新标杆，技术栈涵盖检索增强、工具集成及多代理协作，为AI产品发展提供关键参考。

本内容由作者授权发布，观点仅代表作者本人，不代表虎嗅立场。
如对本稿件有异议或投诉，请联系 tougao@huxiu.com。

正在改变与想要改变世界的人，都在虎嗅APP

赞赏

支持一下修改

确定