本文来自微信公众号: 每日天使 ,作者:每日天使
编者按
Caitlin Kalinowski是硅谷硬件领域最炙手可热的名字之一。
她参与了初代一体式MacBook Pro团队,是MacBook Air和Mac Pro的技术负责人;在Meta主导了Quest全系、Rift和Orion AR眼镜的硬件开发;最近在OpenAI从零搭建了机器人和硬件部门。
她的职业生涯横跨了消费电子、VR/AR和AI机器人三个时代。
这期访谈信息密度极高——从VR为什么没有起飞、到中国供应链的真实状态,从乔布斯、扎克伯格、奥特曼三位科技领袖的比较,到为什么她因OpenAI与国防部的合作而选择离开。
如果你对硬件创业、机器人产业或AI的物理化有任何兴趣,这期值得每一个字读完。
导语
Caitlin Kalinowski的职业轨迹几乎就是硅谷硬件发展史的缩影。
从苹果的MacBook团队,到Meta的VR/AR硬件总负责人,再到OpenAI的机器人与硬件部门创始成员——她参与设计和工程化了这个时代最具代表性的消费硬件产品。
现在,她把目光投向了下一个前沿:物理AI。
本期节目中,Lenny与Caitlin深入讨论了VR技术遗产、人形机器人的真实状态、美国制造业供应链的空心化危机、AI驱动的存储芯片价格冲击、以及她从乔布斯、扎克伯格和奥特曼三位截然不同的科技领袖身上学到的东西。
她还首次在公开场合详细解释了为什么选择离开OpenAI。
QA正文
一、VR没火,但它的技术遗产正在武装整个机器人产业
Lenny:Meta在VR上砸了上百亿美元,甚至把公司名都改了。苹果的Vision Pro硬件做到了极致,但也没能普及。VR到底出了什么问题?
Caitlin:我不认为我完全预测到了这个结果。但回看VR,它帮我们理解了一件关键的事:如何在空间中定位物体——把模拟世界和真实世界连接起来。我们在VR里搞定了SLAM(即时定位与地图构建),学会了用深度传感器感知空间,理解了人类如何处理空间中的视觉数据。这些东西在VR游戏里当然也有用,但那是个小众市场。真正大的应用,现在正在机器人领域发生。
一个机器人走在房间里,它需要知道自己在哪里、离所有东西有多远——这和VR头盔做的事情完全一样。所以在我看来,VR只是技术长弧上的一个阶段。我没预料到它不会成为大众产品——当时在Oculus工作的时候当然相信它会很大——但回头看,面前罩着个东西的社交障碍是绕不过去的。Google Glass已经教会我们了。
Lenny:那AR眼镜会是未来吗?
Caitlin:我相信AR眼镜是未来的一部分。我们整天低头看手机,对社交不是好事。如果能一边保持社交连接一边获取信息,这才是该走的方向。
我们在Meta做的Orion AR眼镜原型——70度双目视野——拿到手上那一刻你就能感受到:这种沉浸感不需要把脸遮住。但目前的问题是波导和MicroLED显示器还没准备好大规模量产,良率不够、成本太高。还有一个关键问题是输入方式——你在公共场合怎么跟眼镜静默交流?这些问题还在解决中。但路径是清楚的。
二、硬件"编译"只有4到5次:为什么硬件创业者不能用软件思维
Lenny:现在很多软件公司说"我们要做硬件了,这是新的护城河",然后一上手就懵了。硬件到底难在哪?
Caitlin:我经常这样跟计算机背景的人解释:你们写代码,每天每小时都在编译、运行、调试。但在硬件领域,我们"编译"——也就是从CAD设计到投产量产——只有4到5次。不是一年4次,是永远只有4到5次。
一旦你最后一次释放设计进入量产,就结束了。你不能发OTA更新。每个零部件都要在这个设计里一次做对。如果你卖几百万台产品,你把公差分布在±3σ范围内的所有零件拼在一起——最小的这个配最大的那个——你需要在设计阶段就把那最后0.5%的问题解决掉。
这就是硬件开发的游戏规则:我们必须更保守、预留更充分的时间、在流程中嵌入大量的可靠性测试和验证。因为你没有第二次机会。
Lenny:所以你给那些想做硬件的公司什么建议?
Caitlin:首先,目标必须在早期锚定并且尽量不要改变。如果你一开始说"我们要做300美元的产品",走到一半说"不对,得压到150美元",那你前一半的时间基本白烧了。硬件不像数字产品那样能适应中途的巨大变化。
第二,先设计最难的部分。大多数人会本能地先做自己熟悉的东西——先选显示面板、先画CAD。但真正优秀的架构师会从"哪里会出问题"开始。比如做笔记本电脑,先从铰链里走线的截面直径开始检查能不能穿过去,而不是先定外壳。
第三,把最多迭代投入到用户接触频率最高的部件上。在笔记本上,触摸板和键盘——这些要做得极其好,功能完美、手感一流、高度可靠。在此之外的部件不需要同等级别的打磨。
第四,永远不要等。不是"你不知道会发生什么"——在硬件世界里,你真的没有更多时间。任何你知道必须做的事情,现在就做。因为两天后一定会有一个意外出现,你需要那两天的时间去救火。我在苹果时从Shelley Goldberg和Kate Bergeron那里学到了这种"无情的效率感"。
三、为什么AI的下一波爆发一定是物理AI
Lenny:为什么现在大家都在往硬件和机器人涌?
Caitlin:我在旧金山的AI圈子里看到了一个正在觉醒的共识——尤其是在各大实验室内部——AI的加速度正在垂直上升,你在键盘后面能做的事情总有一天会饱和。我不知道什么时候饱和,但到那时,下一个前沿就是物理世界。
机器人、制造业、工业化、真实世界中的感知层、在物理空间中移动物体的能力、最终甚至包括太空。大厂、大实验室、创业公司几乎同时意识到了:数字世界的边界是看得见的,硬件才是下一个战场。
Lenny:很巧的是,普林斯顿的计算机科学入学人数在下降,硬件和机器人方向却在上升。你在这个领域干了一辈子——感觉奇怪吗?
Caitlin:感觉非常奇怪。硬件从来不是性感的职业选择。从来薪水不如软件,从来不在聚光灯下——苹果是个例外。所以现在看到大家突然都来问硬件、问机器人、问物理世界,既觉得好,又觉得诡异。但我已经为这一刻准备了几十年。
四、人形机器人:一个被高估的"万能形态"
Lenny:人形机器人看起来是最直观的方向。你的判断是什么?
Caitlin:在我的世界观里,人形机器人现在还是原型——高级原型,但仍然是原型。当前阶段我们的任务是证明"这东西能跑通"。一旦有了能跑通的原型,下一步就是逐步迭代,让它更便宜、更容易制造、良率更高、更安全。
安全是个大问题。大型强动力人形机器人在人旁边运行——你必须拿出足够的数据证明这不会出事。你看看市面上的中国机器人,能做各种各样的动作,但说明书里都写着"人必须保持3英尺以上距离"。不是说它不能干活,而是它当前还不能安全地在人身边干有力量的活。1X的Neo是个好案例,它在设计上把质量向内部收拢,用更软的部件降低撞击冲量——这方向是对的。
Lenny:那什么时候人形机器人能规模化走进家庭和街道?
Caitlin:"规模化"才是真正的难题。在我的背景里,规模化通常意味着百万台起步——就算放宽到几十万台,你也要先有一个可靠到能在不需要大量人工干预和维修的情况下日复一日运行的设计。在那之前,你要解决供应链问题。
机器人的每一个零部件都有来处。很多关键零部件可能变得更受限制、更难以采购。比如高性能执行器——美国目前没有优秀的执行器公司。这是一整个待重建的产业层。
五、从磁铁到执行器:美国制造业25年空心化的账单
Lenny:供应链的具体瓶颈在哪里?
Caitlin:从原材料说起——磁铁。机器人的电机靠磁铁驱动:一圈极性交替的磁铁围绕转子,交流电驱动磁铁使转子旋转。所以你需要能获取原矿磁铁、能加工它们、能把它们集成进执行器、能把执行器集成为子系统或整机。
而这些层级——每一个——在过去25年里都被逐步外包到了中国、日本、韩国等亚洲国家。而且我完全透明地说:我自己就参与了这个把工程知识转移到亚洲的过程。
在亚洲,长期以来核心竞争力在于规模和低价制造。我们之间形成了一种默契:他们制造,我们设计加AI。但现在这个模式开始不稳定了。为了供应链安全,我们需要在这些层级上建立一定程度的独立性。如果拿不到磁铁,你就得设计全新的执行器类型——可能用不同的材料,可能更大,可能在空间效率上不如现在的方案。如果拿不到执行器本身,那就根本造不出机器人。
六、无人机才是真正改变战争的技术——你的盟友今天在明天可能不在
Lenny:你提到军事应用。Palmer Luckey从VR跳到了军工。你怎么看?
Caitlin:Palmer是我的朋友。我们在所有事情上看法不同,但在"我们需要如何应对"上有很多共识。他说"需要在无人机上投入比航母更多的钱"——这是对的。
看乌克兰,无人机的迭代速度令人震惊:每天用3D打印做更新,战争形态在急剧变化。敌人发射一枚导弹的成本,和你拦截它的成本——你每次都要算这笔账。目前在这个方程式上我们是亏的。
我觉得未来两年,战争领域的技术变革可能比消费电子还快。我真的认为,为了在军事意义上保持安全,我们需要显著地重新工业化这个国家。你永远不知道明天会发生什么——今天是你的盟友,明天可能就不是了。
七、苹果教会我的事:连柜子背面都要做好
Lenny:你在苹果经历了硬件最鼎盛的时期。苹果到底做对了什么?
Caitlin:苹果教会我和很多人的——如果你看那个时代走出来的人,他们现在散布在行业各处关键位置上——是怎样思考复杂的、互相依赖的决策和风险。
John Ternus前几天提到乔布斯讲过一个柜子匠人的故事:一个匠人把柜子背面也打磨得完美,即使没人会看到。这个理念在苹果扎得很深——每一个设计决定,包括设备内部的,都会被审视。这不只是一个审美选择。它强迫工程、工业设计、运营团队去思考:我们在做什么?这个零件、这个组件、这个消费品,真正重要的是什么?
当你用这种方法做事时,真正重要的东西会自然浮现出来,最终看起来很简单。在我刚加入的时候,Mac销量没那么高、质量也没那么好;到我离开时,Mac已经成为高销量、高质量的产品了。我是其中很小的一部分——我是第一代MacBook Pro的散热负责人,后来主导了后续几代MacBook Air和柱状Mac Pro——但我只是有幸和那些已经这样做了很长时间的人一起工作。
Lenny:苹果以"不听用户想要什么"出名——但产品又卖得极好。这怎么解释?
Caitlin:我觉得这个说法被误解了。真正的意思是:如果你想做全新的东西,你的用户不知道他们想要什么——因为他们从没见过。iPhone是个完美例子:你不能去问100个人要不要一个没有键盘的手机。
当你进入一个新的品类,用一种新的制造工艺,做一些从未被做过的事时,你不能从"相同领域、相同产品类别"中学到的东西去推导——因为答案不会对。这就是乔布斯的意思。但如果把你的新产品放到他们面前,他们会立刻知道这个东西好、是他们想要的。
八、Meta的硬件课:从黑客精神到史上销量最高的VR设备
Lenny:从苹果到Meta,搭建硬件的体验有什么不同?
Caitlin:Oculus起步时是一个黑客硬件创业公司——创始人们在论坛上认识,把PlayStation做成背包式VR。这种精神对公司DNA来说非常好。收购后,我们的任务是把这种快速迭代的精神专业化——提升良率、降低成本、扩大产量。
Quest 2是最好的案例。我们的目标是"让VR更民主化"——让更多人用上VR——而这只能通过降价实现。这逼着我们从头重新设计整个产品:减摄像头、换材料、改制造工艺。结果是它成为了有史以来销量最高的VR头盔。有了明确的目标(降低成本),所有决策自然就跟着走了。
九、存储芯片价格将翻倍:一场AI驱动的供应链海啸
Lenny:Matic的创始人让我问你——"有一颗叫存储价格的陨石正在撞向消费硬件和机器人产业"。现在情况有多糟?
Caitlin:我们整个行业真的有麻烦了。我已经在建议创业公司"提前囤内存"——如果你负担得起,买够内存扛过价格风暴。
我估计价格可能会翻倍。这不是第一次——COVID期间也有过类似的供应链断裂,当时我所在的团队也必须预购内存。AI是这个问题的核心驱动力:数据中心在疯狂吞噬存储芯片,而且它们对成本的敏感度远比消费电子公司低。它们可以直接接受更高的价格。
对硬件创业者来说,这是供应链依赖的最具体案例——一个关键组件(内存或芯片)被卡住,你就造不出东西。如果是压铸件供应商倒闭,你可能三个月能恢复。但如果硅芯片断供,或者内存断供,你需要做的事就是"灾难性重设计":换芯片、重新Layout主板、重新测试、重新做可靠性验证。这动辄6个月起步。
十、AI还没法做真正意义上的CAD——我们缺少"工程世界的世界模型"
Lenny:AI已经开始改变软件开发。它对硬件设计的冲击有多大?
Caitlin:现在AI对CAD的参与非常非常初期。Claude能做点云和曲面——但这不是真正的CAD。真正的CAD是"密集的":它有形状、有曲面方程、它是一个在CAD中设计的实体。
当前的大语言模型——本质上是文字猜测器——加上视频模型,都不理解物理世界的基本特性:摩擦、重力、接触、压力、表面纹理。你拿一张纸折四次再展开——洞会出现在哪里?这些模型答不出来。但这就是工程设计的核心。
我们需要新的模型类型——可能是"世界模型"——来作为CAD和物理工程的基础。我把它叫做"工程Codex":我想要为硬件工程设计的Codex。这在未来很有可能实现,而且将是这个领域最大的变革。但当前我们还没到那一步。在过渡期,我主要用AI做高层规划、构建信息数据库、在Excel里做快速原型。
十一、人类如何与机器人相处:皮克斯和迪士尼可能是最好的设计参考
Lenny:什么样的机器人才会让人感到亲近?
Caitlin:我从一位叫Leila Takayama的研究者那里学到很多东西。人类进入一个空间时,对"其他生物如何回应自己"有一套非常具体的预期——你走进房间,别人会抬头看你一眼,即使不跟你说话。这些非常复杂的非语言线索,是人类社交的基础。
如果一个机器人走进房间时完全不动,或者毫无预兆地突然转身——你会被吓到。但如果在它转身之前先"看"一下方向,然后再转,那种惊悚感就消失了。这就是意图表达:用物理动作传递"我要做这件事了"的信号。
所以你想让机器人看起来柔软、无威胁感、对你的存在有所感知、有响应性——它知道你在这里,它在帮你。皮克斯和迪士尼,虽然不做量产硬件,但在展示情绪、意图、亲和力方面是世界顶级的。我们应该向他们学习。
十二、为什么离开OpenAI:国防部交易与第三种选择
Lenny:你那条宣布离开OpenAI的推文获得了700万浏览。到底发生了什么?
Caitlin:我在推文里说的仍然是我的真实想法:OpenAI有很多我关心和尊重的朋友——在管理层也是一样,他们都是好人。但对于与国防部合作(Department of War deal)这件事——决策推进的速度、治理机制、以及公告时缺乏明确防护栏(guard rails)——我不认为这样做是对的。这两件事可以同时为真。
我的希望是存在第三条路。你看到很多人要么随波逐流、公司做什么就跟着做什么,要么采取"焦土"态度彻底决裂。但对我来说,第二种方式不适用——我对OpenAI没有那么强烈的负面感情,这是一个了不起的公司,我很感激能帮他们搭建机器人和硬件团队。但我不能继续在那里工作,因为你不知道下一次会发生什么事。我希望我的离开能让其他人在"守住自己的边界"这件事上更容易开口。
Lenny:那OpenAI的机器人项目到底在做什么?悄悄地告诉我。
Caitlin:(笑)Lenny,我们这行的乐趣就是比别人提前看到未来——但代价是什么都不能说。我能说的是:团队真的很强,我非常感激这个机会。但该发生的事情发生之后,我无法继续下去了。
十三、三位领袖的底层代码:乔布斯、扎克伯格、奥特曼
Lenny:你曾在乔布斯、扎克伯格和奥特曼麾下工作。从他们身上各学到了什么?
Caitlin:先说Sam Altman——他是最近期的。Sam有一种能力,每次我们讨论重要的事,他都会问:"为什么不是更多?为什么不是100倍?为什么不是1万倍?你思考的格局太小了。"这个洞察让我意识到:在某些维度上我确实想得太小了。有一个愿意往大了想的领导在你耳边不断push,是非常宝贵的。
乔布斯——他对公司和团队设立的"技术卓越标准",从不摇摆。不是有时候高有时候低,而是永远都在那里。对年轻的有抱负的人来说,听到"这还不够好",其实是一种极致的激励——你会不想再听到这句话。那种标准像水一样渗透整个公司。
扎克伯格——他和他当时的CTO Andrew Bosworth把一家快速增长的公司的硬件评审流程运转得极其干净。目标清晰、评审节点明确、尽量在最低层级做出决策以保证速度。他们能读完20页的技术报告、完全理解其中的权衡、在技术讨论中做出实质性贡献——而你意识到他们一周里要这样做好几十次。这种执行力令人印象深刻。
十四、当AI原住民改变工程——以及为什么你需要20岁的员工
Lenny:在新的AI时代,你招人时最看重什么?
Caitlin:在做0到1的新事物、新产业时——这正是AI+机器人所处的位置——你找不到"做过完全一样的事"的人,因为它还不存在。所以我寻找的是"强通才":他们能把其他领域的经验迁移到新领域。自动驾驶汽车行业是一个很好的来源——那里有传感栈、有复杂的安全权衡、有硬核工程。
但最有趣的其实是年轻人。唯一真正"AI原生"的人——用AI用得像呼吸一样自然的人——是20岁、21岁的人。很难找到一个30多岁的人是彻底AI原生的。这些年轻人解决问题的方式和我们完全不同:他们从底层就用AI处理一切,而且速度远超我们。我们需要他们来教我们。
这个观点也是对这个播客经常讨论的一个话题的回应——"AI会消灭初级岗位"——我不这么看。我们需要年轻人。你既需要资深的人,也需要新的人。只是团队规模可能比以前小一些而已。除此之外,使命对齐是统一团队的关键——尤其在AI研究员和硬件工程师这两个说着完全不同语言的世界之间。
十五、Quest 1的失败教训:一个0.15毫米的误解
Lenny:进入"失败角"。有什么让你印象深刻的失败?
Caitlin:Quest 1上有一个很好的失败案例。当时为了降成本,我们把摄像头从5个砍到4个。到了EVT——这是"第一次用最终材料、最终工具、真正为量产做零部件组装"的阶段——大约圣诞节前,计算机视觉负责人告诉我:摄像头数据不行,定位锁不住佩戴者的位置。
问题是:我们对规格的理解方式和他们对规格的理解方式不同。工程中我们通常用±容差,比如±0.15毫米;但他们习惯的是"整体在0.15以内"。这个差异导致他们无法满足定位精度要求。
最后的解决方案是:把底部两个摄像头固定在一组支架上,保证它们之间的相对距离符合CV团队的需求,另外两个摄像头保持浮动。这是一个架构级别的修改。但讽刺的是——新设计反而更好:有一对"偏好摄像头"作为空间真值锚点,其他摄像头在这个基础上叠加,定位更稳定。产品按时发货了,而且Quest 1成为了有史以来最畅销的VR设备。但那个圣诞节前的慌乱完全不应该发生——这本该在四个月前就被发现。
十六、闪电轮:古代希腊家教、Euphoria与活在当下
Lenny:你最近推荐哪些书?
Caitlin:最近在读经典。《新日之书》(Book of the New Sun)是很好的科幻。Virginia Woolf的《达洛维夫人》——一本关于过渡期的书,我非常喜欢。还有希罗多德的《历史》,他很多地方都错了,但这是人类第一本历史书。
Lenny:最喜欢的最近产品?
Caitlin:Vollebak的衣服。这个品牌把材料科学做成衣服,非常有趣。
Lenny:人生座右铭?
Caitlin:你看过那幅"此刻你在树干上,眼前有无数分支"的画吗?我经常想起它——因为人总是很容易被困在过去或未来。但每一天你都可以重新选择。真正重要的,是眼前的东西。
Lenny:为什么要请一位博士教你古希腊罗马?
Caitlin:我找到了诗人Joseph Brodsky列的一份"要能用英语进行有智慧对话必须读过的东西"清单——从《旧约》到《吉尔伽美什》,极其硬核。我开始读希腊悲剧后发现,光靠自己读,理解深度不够。所以找了一位博后给我当家庭教师。他对百科全书式的问题全都能回答——"这部悲剧在写的那个时代,雅典发生了什么?土耳其发生了什么?这个悲剧作家可能在回应什么?"这比AI能做的深入太多了。AI在表层知识上有帮助,但当你想理解文化背景和作品的历史意义时,人类仍然不可替代。
十七、别害怕未来,去设计它
Lenny:最后有什么想对听众说的?
Caitlin:我们正在进入一个可能是最激动人心的时代。害怕和担忧是正常的——我自己也是。但这也是个人能发挥前所未有影响力的时代。这些新工具、新工作方式很可怕,但如果你每天都在使用AI、每天都在把你手头的工作和AI结合,你就会站在接下来发生的一切的前沿。
创造性地使用这些工具。找到边界。每次新模型发布后重新测试。知道我们在面对什么、边界在哪里,这很重要。我从来没有对"个体的力量"这么兴奋过。
这不是单人游戏,这是多人游戏。我们应该一起设计我们想要的未来——在小说里、在文学里、在对话中描绘它——然后把它建出来。
视频链接:https://www.youtube.com/watch?v=G5WTgB87rYQ
