2-6

Anthropic称Opus4.6更专注和深入思考任务中最具挑战部分

新闻图片

Anthropic公司于2026年2月5日正式发布其最新AI模型Claude Opus 4.6,该版本大幅扩展了上下文窗口至100万tokens,并引入了革命性的'代理团队'功能,使AI能够自主分配任务并并行处理复杂工作流。新模型特别强调了'深度思考'能力的提升,能够在未被明确指示的情况下自动聚焦于任务中最困难的部分,为知识工作者和软件工程师提供更高效、更精准的AI辅助。

3 来源
核心功能升级:百万级上下文与代理团队协作

Anthropic此次发布的Opus 4.6将上下文窗口从之前的200,000 tokens大幅扩展至100万tokens,这一突破性提升使模型能够处理更复杂的任务,如对整个代码库进行大规模修改和分析大型文档集。[1][2]

最引人注目的新功能是’代理团队’(agent teams),该功能允许多个AI代理并行工作,将大型任务分解为多个子任务,每个代理负责一部分并直接与其他代理协调。Anthropic产品主管Scott White将这一功能比作’拥有一支才华横溢的人类团队为你工作’,强调代理间的并行协作能显著提高工作效率。[1][3]

这一功能目前作为研究预览向API用户和订阅者开放,特别适用于软件开发、金融分析和法律文档处理等需要多步骤推理的复杂场景。[1][3]

智能思考能力:自适应推理与任务聚焦

Opus 4.6的核心突破在于其’思考’能力的显著提升。Anthropic表示,该模型’在没有被告知的情况下,更加专注于任务中最具挑战性的部分’,并且’思考得更加深入和谨慎’,这标志着AI从简单响应向真正理解任务复杂性的转变。[1][2]

新模型引入了’自适应思考’功能,这是一种可配置参数,使Claude能够根据上下文线索自主决定何时需要启用扩展思考能力。同时,系统提供四种’努力’级别(低、中、高和最大),开发者可根据任务复杂度调整,从而在处理简单任务时降低延迟和推理成本。[1][2]

在’needle-in-a-haystack’基准测试MRCR v2中,Opus 4.6取得了76%的优异成绩,远超Claude Sonnet 4.5的18.5%,证明了其在长文本中准确提取关键信息的卓越能力。[1]

企业级应用:Microsoft 365深度整合与生产就绪输出

Anthropic特别强调了Opus 4.6在企业环境中的应用价值,其中最显著的改进是与Microsoft 365套件的深度整合。Claude现在可以直接作为侧边栏集成到PowerPoint中,用户无需再将生成的演示文稿转移到PowerPoint进行编辑,而是可以直接在应用程序内与Claude协作创建和修改演示文稿。[1][2]

此外,Opus 4.6还改进了Excel数据处理能力,能够直接分析企业电子表格并生成详细的竞争对手分析报告,输出新的电子表格和完整的PowerPoint演示文稿。[2][3]

Anthropic表示,Opus 4.6处理的文件(包括文档、电子表格和幻灯片)将更接近’生产就绪’状态,意味着这些输出在首次生成时就需要更少的人工干预,大幅提高工作效率。[3]

市场定位与客户反馈:从开发者工具到知识工作平台

Opus 4.6的定价策略保持不变,与Opus 4.5相同:每百万输入token 5美元,每百万输出token 25美元,这在同类高端AI模型中具有竞争力。[1]

值得注意的是,Anthropic已将Opus从最初专注于软件开发的工具,转变为面向更广泛知识工作者的平台。Scott White表示:'我们注意到许多非专业软件开发人员也在使用Claude Code,因为它是一个执行任务的绝佳引擎。'使用群体已扩展至产品经理、金融分析师和各行业专业人士。[2]

客户反馈显示,Opus 4.6在企业级任务中表现卓越。SentinelOne首席AI官Gregor Stewart评价:'Claude Opus 4.6像高级工程师一样处理了数百万行代码库迁移。它提前规划,根据学习调整策略,并在一半时间内完成任务。‘Thomson Reuters首席技术官Joel Hron则称赞其’在长上下文性能方面取得了有意义的飞跃’,特别适用于处理大型法律文档。[1]

本内容由AI生成