本文来自微信公众号: 第一新声 ,作者:第一新声,原文标题:《老黄要重新发明PC,全网热议定价!英伟达微软联手,地表最强轻薄本要来了?》
“价格没打到5k内,都看不起。”“别说5k,1万也行呀,哈哈哈。”
这是昨天英伟达发布会消息刚出来时,一个评论区里被顶上热门的留言。调侃归调侃,但老黄这回掏出来的东西,确实让人一边流口水一边捂钱包。
“我们要和微软一起,重新发明PC!”四十年了,Windows PC的底层逻辑从未变过:开机、点开应用、敲键盘、拖鼠标。直到昨天,黄仁勋穿着一身标志性黑皮衣站上台北电脑展的舞台,说出了这句让整个行业炸锅的话。
不是改良,不是升级,是推倒重来。英伟达正式杀入个人电脑芯片市场,掏出那颗代号N1X的超级芯片RTX Spark,把数据中心级别的算力——6144个GPU核心、128GB统一内存、1 PFLOP的AI性能——硬生生塞进了14毫米厚的轻薄本里。但参数只是开胃菜。真正的变化在于:这台电脑不再需要你学会复杂的软件操作,你只需要张嘴说出需求,本地的AI智能体(Agent)就会自己调用Rhino画图、打开Blender渲染、甚至跨应用协同完成任务。
从今天起,坐在电脑前的你,不再是个“工具人”,而是指挥一群AI员工的“总指挥”。英伟达这一脚,踹开的不仅是英特尔和AMD守了四十年的x86大门,更是一个全新的计算时代——PC的“主人”,可能不再是人类了。
01
RTX Spark把数据中心搬进笔记本,
重新定义“个人电脑”
老黄第一刀,砍向了PC最底层的硬件架构。
在过去,一台高性能电脑意味着CPU和GPU各管各的内存——系统RAM和显存VRAM之间靠一条窄窄的PCIe通道传数据。跑大模型时,一旦模型体积超过显存容量,GPU就得反复去系统内存里“借数据”,带宽瞬间从TB/s掉到GB/s,卡成幻灯片。这就是为什么你在本地跑70B模型总是一言难尽。
而RTX Spark干的第一件事,就是彻底消灭这条瓶颈。它采用统一内存架构,CPU和GPU共享同一个128GB内存池,带宽高达600GB/s。你可以直接在本地离线跑一个1200亿参数的大模型,上下文长度达到100万token——相当于一口气读完《三体》三部曲还绰绰有余。敏感代码、私人文档、企业数据再也不必上传云端,隐私和安全握在自己手里。
它把英伟达三十年的生态积累,全部压缩进了一颗芯片。RTX Spark由英伟达与联发科联手打造,基于Arm架构,却100%兼容Windows、100%支持CUDA、100%集成Tensor Core。这意味着:你过去买的每一款Windows软件都能跑,PyTorch里写的每一行训练代码都能跑,甚至《英雄联盟》《无畏契约》等主流网游也能通过深度优化的Prism模拟器和反外挂系统底层适配,稳定跑到1440p、100帧以上。这不是一台“开发板”,这是一台真正能打游戏、能剪视频的全能PC。
Adobe已经为它从底层重写了Photoshop和Premiere。生成式填充、生成式扩展这些AI功能,在RTX Spark上跑出了两倍的速度。一个90GB的3D场景、一段12K分辨率的视频,都能在未插电的轻薄本上流畅编辑。老黄一口气展示了三种产品形态:14毫米厚的笔记本、24小时在线的台式AI主机、以及堆到768GB内存的DGX Station工作站——后者能在桌面上跑万亿参数模型。
这是第一次,RTX Spark在Windows生态里,把CUDA的软件主导力和统一内存的硬件能效捏在了一起。以前这是Mac和PC之间不可兼得的“二选一”,现在英伟达全都要。今年秋季,华硕、戴尔、惠普、联想、微软Surface都将推出搭载这颗芯片的电脑。四十年来,Windows PC第一次有了一个真正能打的“新大脑”。
02
专为AI智能体而生的Vera CPU,
把数据中心的逻辑也掀翻了
如果说RTX Spark是面向消费者的“先锋”,那Vera CPU就是英伟达在数据中心里埋下的“终极利器”。
老黄在演讲里说了句很扎心的话:“到今天为止,世界上所有的CPU都是为人设计的。而Vera CPU,是第一颗给智能体用的。”人操作电脑,反应速度以秒为单位;而智能体调用工具、访问数据库、运行代码,每一步都要求在纳秒级完成。传统x86 CPU的租用模式——按核心数、按时长计费——在AI工厂里已经成了拖累GPU利用率的“猪队友”。
Vera CPU的第一板斧,是单核性能和内部通信直接拉满。它采用自研的Olympus核心,每个时钟周期能抓取、解码、执行10条指令,创下世界纪录。88个核心通过第二代可扩展一致性结构连在单片网格上——没有chiplet之间的“分片税”,跨核心通信速度比传统CPU快50%。它还率先支持PCIe Gen 6,内部带宽达到3.6 TB/s,LPDDR5X内存带宽1.2 TB/s,是市面上最强x86 CPU的两到三倍。

Vera CPU的第二板斧,是能效碾压。AI工厂的电力预算极其昂贵,每一瓦都要优先保证GPU生成token。Vera在跑SQL数据库时速度是x86的三倍,做纽约证券交易所那种实时流处理时直接飙到六倍——而且功耗更低。老黄打了个比方:“CPU是指挥家,GPU是交响乐团。指挥家不能抢乐手的热量。”
而搭载这颗CPU的Vera Rubin超级平台,已经全面进入量产。这是一个完整的AI工厂机架系统:72块Rubin GPU加36颗Vera CPU,全液冷、无电缆、无软管。组装一个机架从过去的两小时缩短到五分钟,供应链规模是上一代Grace Blackwell的两倍。老黄在现场直接推着真机机架走了一圈,调侃道:“后面大概有两千个人在拉。”
这一次,英伟达不只是升级了GPU,它把CPU也按照智能体的节奏重新设计了一遍。Vera CPU的出现,意味着从PC到数据中心,整个计算底座的“调度核心”都在向Agent时代迁移。那些还在用传统x86跑大规模智能体服务的企业,很快就会感受到性能代差带来的压迫感。
03
Agent就是新操作系统,
英伟达用四层软件栈锁死了未来
硬件到位了,但真正让开发者离不开的,永远是生态。老黄在演讲里抛出了一个更底层的判断:“我们进入了全新的Agent时代——智能体,就是未来的操作系统。”
过去的计算机逻辑是“应用+代码+操作系统”。现在变成了“智能体+Harness(调度层)”。一个完整的智能体包含:输入感知、推理规划、工具调用、短期记忆和长期记忆。大模型只是其中的“思考模块”,而Harness才是那个负责连接一切、调度信息、管理安全和隐私的“幕后总管”。
为此,英伟达端出了四层“Agent Toolkit”,把从模型到运行时的每一个环节都牢牢抓在手里。第一层是模型——Nemotron 3 Ultra,英伟达最大的开源模型,总参数5500亿,采用SSM+MoE混合架构,推理速度比同类模型快5倍,成本降低30%,并且权重、训练脚本、数据集全部开放。第二层是框架——原生支持Claude Code、Codex、OpenClaw等热门Agent直接运行。第三层是工具和技能——CUDA X库全部附带“skills文件”,Agent接上就能自学调用,从计算光刻到基因组学,数千个加速库唾手可得。第四层是运行时——OpenShell,一个Apache 2.0协议的开源安全沙箱,负责隔离、权限管理、隐私脱敏。

这套组合拳的效果有多恐怖?看看英伟达和Cadence联合打造的“芯片设计超级Agent”。Codex做总指挥,Cadence ChipStack启动RTL验证循环,底层跑Nemotron,外层套OpenShell做安全。Agent自己跑仿真、做形式化验证、发现设计缺陷、修复代码bug——验证周期从数周压缩到数小时,加速超过40倍。这不是科幻,这是今天就能跑起来的工作流。
而在Windows端,微软与英伟达的合作同样深入骨髓。全新的Windows安全基元为Agent提供身份认证、隔离防护和策略管控。OpenShell允许用户自定义Agent能做什么、不能做什么,发送到云端的请求会自动脱敏。Hermes Agent、OpenClaw等前沿项目已经在基于这套平台开发新应用。未来你在Windows任务栏里就能直接召唤一个本地智能体,让它帮你写邮件、整理文件、甚至管理智能家居。
可以说,英伟达的野心从来不只是卖芯片。从Nemotron到OpenShell,从CUDA X到Windows安全基元,它正在构建一个横跨云端、PC、边缘设备的Agent操作系统。任何开发者只要进入这套生态,就很难再离开。老黄那句“买越多,赚越多”,放在Agent时代依然成立——而且这次,连你的电脑桌面都被他承包了。
从今天起,你面前的这台电脑,将不再是一个需要你点击、打字、学习的工具。它是一个7x24小时在线的AI队友,能听懂你的意图,自己调用软件完成任务,甚至在你睡觉的时候帮你跑完一整套芯片验证流程。英伟达用一颗超级芯片、一颗为Agent重做的CPU、一套完整的软件栈,把用了四十年的PC连根拔起。
有人说,老黄这次掏出来的东西不如iPhone当年那么惊艳。但仔细想想,iPhone重新定义的是“人和设备的关系”——手指一滑,内容就到眼前。而英伟达重新定义的是另一件事:谁,才是这台设备真正的主人。当你的电脑里住着一个比你更熟悉所有软件的智能体,你唯一要做的,就是告诉它你想要什么。剩下的,交给它。
然而,目前全网翻遍了也没找到任何售价泄露。老黄向来喜欢吊胃口,估计要等到年底才正式开售。评论区交给看到这里的读者们:欢迎大胆预测一波,这台把数据中心塞进轻薄本的“AI队友”,到底会卖多少钱?
