本文来自微信公众号: 果壳 ,作者:本一,编辑:沈知涵,原文标题:《AI公司Midjourney开了一家 SPA店,但不是你想的那种……》
6月17日,当Midjourney预告“将发布第一个硬件项目”时,科技媒体猜或是某种视觉创作硬件,比如,AI创作终端、沉浸式显示器、空间交互设备......
毕竟,这家公司做得最出圈的事情是让你用一句话生成一张猫图。创始人David Holz之前还创办过手势追踪公司Leap Motion。
然而,所有人都猜错了。
Holz坐在旧金山一家爵士俱乐部的小舞台上,发布了一台全身超声波计算断层扫描仪(Midjourney Scanner)。“配套产品”是一家他打算开在Union Square旁边的高端温泉会所,叫Midjourney Spa。
一台360度超声波扫描仪
Midjourney Scanner的核心原理并不神秘:超声波。
产检室里的手持超声探头用的也是超声波。但两者的关系,好比是手电筒对上詹姆斯·韦伯太空望远镜,物理原理一样,工程量级完全不是一个水平。

来源:Medical News Today
传统医用超声探头通常只有几十到几百个换能器(transducer),由医生手持在体表移动,靠经验找角度。它得到的是一个局部的、三维/四维、高度依赖操作者手法的图像。
Midjourney Scanner想做的事情完全不同:把你整个人泡在水里,用一整圈换能器从360度同时向你发射超声波,再用计算方法从海量回波数据中重建出三维立体图像。
它和CT扫描的逻辑类似,但是用声波替代了X射线。

来源:Midjourney Medical
整套系统的基本单元是换能器,一种在通电时像扬声器一样振动发声、在接收声波时像麦克风一样产生电信号的压电元件。每个换能器只有200微米宽,大致相当于一粒细砂。Midjourney把8960个这样的换能器排成一块阵列芯片,再用40块芯片围成一个直径70厘米的环。
这些芯片并非Midjourney自研。它们是医疗超声公司Butterfly Networks的Ultrasonic-on-Chip™模块。Butterfly Network是一家在纽交所上市的医疗科技公司(BFLY),以手持式便携超声设备有名,其创始人Jonathan Rothberg也是基因测序公司Ion Torrent的创始人。Midjourney把Butterfly为单探头手持设备设计的芯片,以40倍并联的方式排成环形阵列,并自己搭建了计算重建系统。
这意味着环形阵列上有358000个超声元件同时工作。想象一下:8000人的合唱团对着你唱歌,同时另外8000人在仔细聆听你身体反射回来的每一个音符,然后把这个场景放大40多倍。

来源:Midjourney Medical
这些换能器的控制频率达到每秒1亿次,它们轮流发射超声波穿过水中的人体。声波在水中以约1481米/秒的速度传播。如果用空气(声速约343米/秒),整个系统的刷新率会慢到没法用。水的声速比空气快了四倍多,这就是为什么你得泡在水里做扫描。
声波穿过人体时,遇到不同密度的组织(骨骼、肌肉、脂肪、血管)会发生折射和散射。环形阵列上成千上万的传感器同时记录这些反射信号,每个传感器能分辨的振动幅度小于一个原子的宽度--皮米级(picometer),甚至在多个传感器协同工作时可以触及亚原子尺度的飞米级(femtometer)。

整套系统的采集速率达到17 GB/s,看清你身体的一个横截面需要处理超过40 GB的数据,最终由21台服务器、2 petaflops的算力完成三维重建。当你被升降台以每秒4厘米的速度缓缓送入水中时,系统在60秒内获取数百个身体切片,拼合成一张亚毫米级分辨率的全身三维密度图。

Holz在发布会上反复强调:目前没有使用任何AI进行图像增强。
“这是一个全新的医学影像范式。我们还没用任何AI,纯粹是硬件和软件。”这似乎暗示了,当AI加入之后,这些图像的质量还有巨大的提升空间。

对成像模体进行的扫描,经分割处理,旨在验证受控条件下结构分离的清晰度|Midjourney Medical
去消费一次Spa就能检查身体
Holz为这台超声波扫描仪设计了一个绝佳的分发载体:Midjourney Spa。
第一家Midjourney Spa已经签约租赁,选址在旧金山Union Square附近,面积约25000平方英尺(约2300平方米),共四层,配备9-10台扫描仪,以及热水浴缸、桑拿房、冷水浴池和一个小型健身区。建筑设计团队是冰岛蓝湖温泉(Blue Lagoon)的设计方。目标开放时间是2027年底。

Holz给这个空间设定了一个非常高的体验标准:“即使这里没有扫描仪,你也愿意来。”这不是医院附属设施的逻辑,而是消费体验品牌的逻辑,先让你爱上这个地方,扫描只是附带福利。
他的终极目标是在全球部署50000台扫描仪,对应约5000个Spa店,总资本开支约200亿美元。Holz称不到12台这样的扫描仪全速运转,就能超过地球上所有MRI((磁共振成像)机器的全身扫描总吞吐量。首家Spa的建设资金完全由Midjourney的图像业务利润覆盖,无需外部融资。但规模化扩张显然需要引入资本,这和他三个月前接受The Information采访时承认的一致。
至于定价策略。Holz说“扫描成本几乎为零”,真正的约束是物理空间的容纳上限:一栋楼只能同时接待这么多人。因此定价本质上不是在为技术收费,而是在为稀缺的物理空间和时间槽位收费。他暗示会有多种价格档位:只扫描、只泡澡、会员制全包。
而设备本身也在快速迭代。
当前展出的是Gen 1原型。Holz自称这是“MacGyver版本”,核心传感芯片直接采用Butterfly Network的现成模块,其余组件也都不是定制的。Gen 2计划在2026年底完成,他预告“会有显著升级”。Gen 3则已经进入定制芯片阶段,届时将不再依赖Butterfly的通用模块。Midjourney已委托设计专用硅片。
从通用组件拼装到定制ASIC,这条路径和很多硬件创业公司的演进轨迹一致,但速度之快令人侧目。
据说比MRI便宜十倍,快六倍
Holz在发布会上给出了一组对比数字:Midjourney Scanner的设备成本不到MRI的十分之一,扫描速度是MRI的六倍以上。由于没有辐射、没有强磁场、没有耗材,单次扫描的边际成本趋近于零。
但用超声波做断层成像这个想法显然不是Midjourney发明的。
学术界从上世纪70年代就开始研究超声计算断层扫描(USCT),德国卡尔斯鲁厄理工学院(KIT)等机构在乳腺超声CT上已有多年积累。Holz在发布会上称这是“50年来第一个新的全身医学影像模态”,重点在“全身”和“工程落地”,而非基础原理上的首创。

德国卡尔斯鲁厄理工学院(KIT)开发的乳腺超声计算断层扫描USCT原型机|KIT
他做的事情,更接近于把一项长期停留在实验室和局部器官成像阶段的技术,用暴力工程方法(358000个换能器、17 GB/s数据流、2 petaflops重建算力)推到了全身级别。
如果这些数据经得起验证,它带来的不是一个“更好的MRI”,而是一个全新的使用范式:医学影像从“有症状才做”变成“随时可做”的日常消费体验。
Holz自己说得很直接:一台传统MRI做全身扫描需要约60分钟,体验是“在一个发出枪声般噪音的管子里躺着”。他说自己虽然负担得起每年一次MRI,“但身体很诚实就是不想去”。
Midjourney Scanner的设计目标是让扫描变成一件像泡温泉一样轻松的事,不需要特殊准备,不需要保持绝对静止,不需要给儿童打镇静剂。一位现场的急诊医学从业者立刻抓住了最后这一点:MRI扫描儿童通常需要全身麻醉,而超声波天然对儿童友好。
有个观众提了一个更尖锐的问题:当分辨率突破亚毫米级之后,这台机器是否能替代抽血化验?
Holz的回答审慎但乐观:如果你能每天做一次全身扫描并观察微小差异,“也许在某些情况下,你甚至不需要看血液就能知道出了问题”。他随即补充,这“可能超出了当前科学的边界”,认为这是让他最兴奋的研究方向。
“先生,我开始也是做猫图的”
David Holz在佛罗里达州的海边长大,父母都从事医疗工作,父亲在一艘帆船上开牙科诊所。
青少年时期的Holz热衷于拍照和天文,大学选了物理和数学,读了一阵研究生后觉得学术路线不适合自己,21岁创办了Leap Motion。
这家公司做了一个手指追踪控制器,上线48小时预购额达到4000万美元。但产品没能大规模普及。因为消费者对放弃鼠标毫无兴趣。2019年Leap Motion以3000万美元卖给了竞争对手Ultrahaptics。大家一度认为Holz肯定对硬件有“心理阴影”了。

Leap Motion产品Demo|CNET
Leap Motion结束后,Holz在2021年发现了扩散模型(diffusion model)的早期论文。他在自己公寓里给模型输入了“arcane lighthouse”(奥术灯塔),出来一张浮空灯塔、极光和帆船交织的图。他在发布会上说,“那个瞬间,这个东西比我更有想象力。”

Midjourney创始人兼CEO David Holz|Aituts
这是Midjourney故事的起点。
但在Holz的潜意识里,Midjourney从来不只是一个图像生成工具。现在看来,像是一个提供资金的“金主爸爸”。
他在发布会上坦承,创立Midjourney时银行账户只有大约20万美元,原本的商业计划是“赚到每年1000万美元的研发预算,够我再做一个Leap Motion规模的疯狂项目就行”。结果Midjourney在9个月内做到了1亿美元收入,12个月达到2亿。
于是他有了足够的弹药去做一件酝酿了10年的事:造一台新型全身扫描仪。
他曾找过科技公司推销这个想法。对方说自己做手机的,做这个扫描仪干吗?现在,Holz可以说,“我自己做出来了,但我开始也是做猫图的。”

团队目前只有9个人
Holz在发布会上花了相当长的时间讲述从Leap Motion到Midjourney的转变。在他看来,Leap Motion最终没有成功,不是技术能力的问题,而是产品与市场需求之间存在gap造成的。
这一次有什么不同?乐观来看,Midjourney Scanner和Leap Motion在产品层面至少有三个结构性差异。
第一,需求端更刚性。手势控制是一个“有了也不错”的交互改进,消费者已有的鼠标和触摸屏够用了;但全身医学影像是一个被医疗可及性、成本和体验同时卡住的巨大未满足需求。
第二,Holz现在有了Midjourney这个利润引擎,不再依赖VC的节奏和期望。他可以按自己的时间表迭代硬件,而不用在第一代产品不完美时被投资人逼着商业化。
第三,AI的加入使得超声波成像的上限被根本性抬高。传统超声波受限于图像模糊,而计算断层扫描加上深度学习重建,有可能把超声波推入此前只有MRI和CT才能覆盖的精度区间。
当然,失败的风险同样很高。
Holz说目前扫描仪团队只有9个人。尽管核心传感芯片来自Butterfly Network的成熟产品线,降低了硬件从零开始的门槛,但9个人团队同时覆盖系统集成、算法重建、机械工程和临床验证,依然很单薄。“做酷的事情不需要一千个人”这种话听起来像是在犟嘴,毕竟做个原型机这个规模的团队可能够,但要通过FDA审批、造5000个Spa、在全球铺设5万台设备,9个人肯定是远远不够。
FDA审批是第二个不确定性。Holz对监管话题的处理明显谨慎,反复提到"certain incantations and keywords which I may not say"(某些我不能说的咒语和关键词),把具体合规进展交给了台下一位名叫Tom的健康负责人。
目前产品的落地路径是先做体成分分析(body composition),这在监管上门槛最低,然后逐步向诊断和治疗方向叠加审批。但从“能测体脂率”到“能发现早期结肠癌”之间,有着漫长的临床验证和监管审批周期。
第三个风险的根源是Holz本人,他似乎有点注意力分散。
The Information在三个月前的报道中提到,Midjourney官网列出了7个即将发布的硬件和软件项目。Holz在发布会上也证实了这一点,说“接下来六个月会比较混乱,因为我们要一个接一个地发布”。
一位内部人士曾对The Information说,Midjourney有时像Holz的“personal playground”(个人游乐场)。可见,当一个70人的公司同时推进图像模型迭代、医疗扫描仪、Spa连锁和至少四五个未公布的项目时,资源会被稀释得多厉害?
而且目前我们还没有看到任何独立的产品demo或第三方影像质量评估。Holz展示了几张扫描切片图,说在某些维度上已经局部优于MRI,但这一判断需要放射科医生和独立研究者的验证才能站住脚。
他自己也坦承,整个系统仍有大量工程限制:数据带宽瓶颈(目前靠40根USB 3.1光纤传输)、对齐精度不够理想、扫描时间偏长(目标60秒,当前需要约20分钟)。
一位观众站起来说:“我最好的朋友Brandon,40岁死于结肠癌,因为他太年轻了没想到要检查。这台机器应该能发现那种东西。”
Holz没有做出任何承诺。他只是诚实回答了产品的定价、工程细节、物理论证等问题。
Leap Motion开端惊艳,结局草率。David Holz这次的赌注更大,赛道更难。但是至少这一次,他不用向任何投资人解释为什么一家做猫图的公司要去造医疗扫描仪。
