Anthropic同步发布Claude Opus 4.8旗舰模型,完成650亿美元H轮融资逼近万亿估值,正从模型提供商转向企业AI基础设施服务商。 ## 1. Claude Opus 4.8核心升级与特性 此次升级在Opus 4.7基础上提升了编码、智能体、推理和知识工作表现,加量不加价,仍保持输入每百万token 5美元、输出每百万token 25美元,已面向全用户开放。 它降低了无提示缺陷代码通过率,仅为前代的四分之一,更愿意说明工作不确定性,不对齐行为发生率明显低于前代,对齐安全表现接近Claude Mythos Preview。 上线后被曝出公开测试中存在模型身份识别错误,偶尔自称DeepSeek或Qwen,官方客户端因更完整的系统约束很少出现该问题,疑似存在蒸馏行为。 ## 2. 配套开发者功能更新,Claude Code支持多智能体协作 新增思考强度调节功能,用户可自定义投入推理算力,Opus 4.8默认高强度,还支持更高强度选项,适配不同难度任务需求。 推出处于研究预览阶段的动态工作流,可动态编排任务,并行运行数十到数百个子智能体处理大规模工程任务,已在多个端开放,面向对应套餐用户默认开启。 Messages API更新支持在不破坏提示缓存的前提下更新系统指令,便于智能体运行时调整权限、上下文等信息。 ## 3. 650亿美元H轮融资完成,投后估值达9650亿美元 本轮融资由多家机构领投,包含云厂商150亿美元既有承诺投资,存储芯片领域战略伙伴共同参投,投后估值已逼近万亿美元关口。 Anthropic通过融资与多家科技企业达成算力基础设施协议,合计获得10吉瓦新增算力容量,成为首个同时入驻三大公有云的前沿AI模型。 ## 4. Anthropic战略转型:从模型提供商转向企业AI系统服务商 当前AI行业竞争从比拼通用聊天能力转向验证企业核心流程适配能力,Anthropic本次动作同步扩张了模型能力、工作流能力、基础设施能力三类核心能力。 Claude已不再是单一聊天工具,正成为连接模型、代码、企业流程、云平台与算力的一体化工作系统,万亿估值正是基于这一定价逻辑。Anthropic计划未来数周向全客户开放更高智能等级的Claude Mythos系列模型。
刚刚,Claude Opus4.8上线,张口就说自己是DeepSeek、Qwen
2026-05-29 06:19

刚刚,Claude Opus4.8上线,张口就说自己是DeepSeek、Qwen

本文来自微信公众号: APPSO ,作者:发现明日产品的,原文标题:《刚刚,Claude Opus 4.8 上线,张口就说自己是 DeepSeek、Qwen》


伴随着IPO预期升温,Anthropic产品模型的节奏也愈发加快。


就在刚刚,Anthropic接连发布两条重磅消息:一是将旗舰模型升级为Claude Opus 4.8,二是完成650亿美元的H轮融资,投后估值达到9650亿美元,已逼近万亿美元关口。



对于一家估值已经逼近万亿美元的AI公司来说,市场要看的也不再只是模型跑分,而是它能否把智能、工具、开发环境、云平台和算力资源变成一套可规模化交付的基础设施。


换句话说,Anthropic必须从一家交付好模型的公司,逐渐转向为一家试图重塑企业AI工作方式的公司。


加量不加价,Claude Opus 4.8正式登场


此次发布的Claude Opus 4.8,是Anthropic对旗舰模型Opus系列的一次升级。照目前这个模型发布节奏,用网友调侃的话来说,我们大概率能在GTA 6发布(不跳票的话,11月)之前,率先看到Claude Opus 6。


Anthropic称,Opus 4.8建立在Opus 4.7基础上,在编码、智能体任务、推理和知识工作等方面均有提升,并且已经面向用户开放,标准使用价格保持不变,仍为每百万输入token 5美元、每百万输出token 25美元。


开发者也可以通过Claude API使用claude-opus-4-8。


API价格对比🔗https://platform.claude.com/docs/en/about-claude/models/overview


从官方披露的信息看,Opus 4.8的改进覆盖编码、智能体能力、推理能力和实际知识工作任务。


Anthropic在发布材料中用一张对比表展示了Opus 4.8与前代Opus 4.7以及其他模型在多项测试中的表现,当然,比起单次回答质量,模型的升级重点还是在长任务和复杂协作中的表现。



真实工作流里,模型往往需要连续处理多步任务,调用工具,检查中间结果,并根据反馈继续推进。Anthropic表示,早期测试者认为Opus 4.8在执行智能体任务时更可靠,判断也更清晰。


Opus 4.8在诚实性上的提升是一大亮点。


AI模型常见的问题,是在证据不足时过早下判断,并自信声称已经取得进展。Anthropic称,Opus 4.8更愿意说明工作中的不确定性,也更少作出缺乏支撑的判断。


代码任务尤其能体现这种变化。


内部评估显示,Opus 4.8让自己写出的代码缺陷未经说明地通过的概率,约为前代的四分之一。也就是说,新模型在发现风险时更可能提醒用户,而不是把问题留到后续测试或生产环境中。


在对齐和安全方面,Anthropic延续了自己的核心叙事。Opus 4.8在欺骗、配合滥用等不对齐行为上的发生率明显低于Opus 4.7,并接近目前对齐表现最好的模型之一Claude Mythos Preview。


安全、可靠、可控,仍然是Anthropic用来区分自身的一组关键词。随着Claude更深地进入企业流程,这些关键词也开始承担更多商业意义。


不过有意思的是,Opus 4.8发布后,就被网友发现有些不对劲。


🔗https://x.com/realNyarime/status/2060059543820963975


不少网友测试发现,当他们追问Opus 4.8的模型身份时,它给出的答案并不总是Claude。



有时它会把自己认成Qwen,有时又会报出DeepSeek的名字,疑似存在蒸馏的行为。



而当网友在Claude官方客户端里提出同样问题时,这类回答通常又不容易复现。原因大概率在于,客户端里的系统提示词和产品层约束更完整。



动态工作流上线,Claude Code走向多agents协作


伴随Claude Opus 4.8一同上线的,还有多项产品和开发者功能。


其中,最直接影响Claude用户体验的当属effort control,也就是思考强度调节。


控制项位于模型选择器旁边,顾名思义,用户可以决定Claude在一次任务中投入多少推理算力。较高强度下,Claude会进行更多推理,以换取更好的回答质量;较低强度下,Claude响应更快,使用额度消耗也更慢。



Anthropic表示,Opus 4.8默认采用high effort,用户还可以选择extra,在Claude Code中对应xhigh,或者选择max,让模型投入更多token。Anthropic建议,困难任务和长时间运行的异步工作流更适合使用extra。


真正影响Claude Code产品形态的,是dynamic workflows。


该功能目前处于research preview,目标是让Claude Code处理过去需要更长工程周期的大规模任务。以往按季度规划的工作,现在甚至有机会在数天内完成。



dynamic workflows的核心机制是,Claude会根据用户任务动态编写orchestration scripts,并在单个会话中运行数十到数百个并行subagents。模型会先规划任务,再分配给多个subagents,随后检查返回结果,最后向用户汇报。Opus 4.8上线后,这些agents还可以运行更长时间。



该功能主要面向复杂、庞大或历史包袱较重的代码库。典型场景包括全服务范围内查找bug、性能优化审计、安全审计、大型代码库迁移、框架替换、API废弃迁移、语言移植,以及对关键方案进行多角度验证。



使用方式上,Anthropic建议在dynamic workflows中打开auto mode。用户可以直接要求Claude创建workflow,也可以在Claude Code中打开ultracode。ultracode会把思考强度设为xhigh,并让Claude自动判断当前任务是否适合使用workflow。


dynamic workflows当前已经在Claude Code CLI、Desktop和VS Code extension中开放,面向Max、Team和Enterprise套餐。其中Enterprise在发布时默认关闭,需要管理员在Claude Code设置中启用。


该功能也可用于Claude API、Amazon Bedrock、Vertex AI和Microsoft Foundry。对于Max、Team用户,以及通过API使用Claude Code的用户,dynamic workflows默认开启。



Anthropic用Bun迁移案例展示了dynamic workflows的上限。Jarred Sumner使用该功能将Bun从Zig移植到Rust,最终生成约75万行Rust代码,现有测试套件通过率达到99.8%,从首次提交到合并约用了11天。


整个迁移过程由多个workflow完成:先为Zig代码库中的struct字段映射Rust lifetime,再为每个.zig文件生成行为一致的.rs文件,数百个agents并行工作,每个文件都有两个reviewer。之后,fix loop持续运行build和test suite,直到构建和测试通过。迁移完成后,又有overnight workflow处理不必要的数据复制问题,并为每类问题打开PR,供最终审查。



除了Claude Code,Anthropic还更新了Messages API。现在,Messages API可以在messages array内接受system entries。


开发者可以在任务执行过程中更新Claude的指令,同时不破坏prompt cache,也不必通过user turn传递更新。这一能力可用于agent运行时更新权限、token预算或环境上下文。


下一步,Anthropic还计划推出一个比Opus智能水平更高的新模型类别。没错就是那个强的可怕的Claude Mythos Preview,预计未来数周内可以把Mythos class models带给所有客户。


到时候,我们也将第一时间尝尝咸淡。


近万亿美元估值背后,Claude需要更大的算力底座


与Claude Opus 4.8同日发布的另一条消息,是Anthropic完成650亿美元H轮融资。本轮由Altimeter Capital、Dragoneer、Greenoaks和Sequoia Capital领投,投后估值达到9650亿美元。



本轮融资还包括hyperscalers的150亿美元既有承诺投资,其中包括亚马逊的50亿美元。Micron、Samsung、SK hynix等战略基础设施伙伴也加入其中。Anthropic称,这些公司在全球memory、storage和logic chips供应中具有关键作用,能帮助其随着Claude需求增长扩大计算能力。


算力扩张是本轮融资背后的关键背景。Anthropic披露了多项基础设施协议:与亚马逊签署协议,获得最高5吉瓦新增容量;与Google和Broadcom签署协议,获得5吉瓦下一代TPU容量;与SpaceX达成协议,可使用Colossus 1和Colossus 2中的GPU容量。


Anthropic还强调,Claude是首个同时进入AWS、Google Cloud和Microsoft Azure三大云平台的前沿模型。不过,AWS仍是Anthropic的主要云服务商和训练合作伙伴。


融资的背后,其实是Anthropic商业定位的变化。早期大模型公司比拼的是模型能力和通用聊天体验,而现在企业客户更关心的是AI能否进入核心流程,能否处理复杂任务,能否被接入开发环境、云平台和内部系统。


Claude Code、Cowork、effort control、dynamic workflows和Messages API更新,都在围绕这个方向展开。



把产品发布和融资放在一起看,Anthropic正在同时扩张三类能力。


第一是模型能力,Opus 4.8提高了编码、推理、智能体任务和知识工作表现,并强化了对不确定性的表达。


第二是工作流能力,dynamic workflows让Claude Code从单次代码辅助走向更复杂的工程执行和审查。


第三是基础设施能力,650亿美元融资、超大规模云厂商承诺投资、内存和芯片伙伴加入,以及与Amazon、Google、Broadcom、SpaceX的算力协议,为后续模型训练和推理需求提供资源。



这也是Anthropic估值逼近万亿美元的核心逻辑。Claude不再只是一个AI聊天窗口,而是正在成为连接模型、代码、企业流程、云平台和算力基础设施的工作系统。


Opus 4.8是这套系统中的最新模型底座,dynamic workflows是面向复杂工程任务的产品形态,650亿美元融资和算力扩张则是继续把这套系统推向更大规模客户的前提条件。


AI的潮水把Anthropic推到了浪尖,站在这个高度,往前是乘风,往后是沉船落水,没有第三种姿势。

AI创投日报频道: 前沿科技
本内容来源于网络 原文链接,观点仅代表作者本人,不代表虎嗅立场。
如涉及版权问题请联系 hezuo@huxiu.com,我们将及时核实并处理。
正在改变与想要改变世界的人,都在 虎嗅APP
赞赏
关闭赞赏 开启赞赏

支持一下   修改

确定