本文来自微信公众号: 太空与网络 ,作者:老谭
2023年8月,NASA和IBM在HuggingFace上发布了一个名为Prithvi的AI模型。
它用的训练数据——Landsat和Sentinel卫星影像——完全免费公开,任何人、任何国家、任何公司都可以下载。这个模型在洪水检测任务上,据公开报道,将传统方法的处理时间从数周级别压缩到数小时级别。据公开资料,NASA花了约40年时间、投入数十亿美元建设的数据基础设施,被一个开源AI模型在几个月内完成了价值的"二次释放"。
这就是遥感AI最深刻也最反直觉的事实:这场革命的燃料——遥感数据——是世界上最公开的数据之一。但也正因如此,用好公开数据的能力本身,变成了最大的竞争壁垒。
2025年7月,Google DeepMind发布了AlphaEarth Foundations。它的官方文案用了"虚拟卫星"(virtual satellite)这个词——不发射卫星,不占轨道位置,但能模拟卫星的全部观测能力。这已经不是"用AI辅助看图"了,这是在用AI重新定义"卫星"这个词的含义。
从Prithvi到AlphaEarth,从NASA到Google,从开源社区到商业遥感公司——遥感AI正在发生一场深刻的变化。本文将沿着一条叙事线索展开:谁拥有数据不重要,谁拥有"从数据中提取价值的能力"才重要。而这条原则将颠覆整个遥感的商业逻辑。
一、Prithvi的教训:NASA 40年的积累,被开源模型一夜变现
Prithvi的故事要从NASA的一个决定说起。据公开资料,2008年NASA将Landsat卫星的全部影像数据免费公开。此前,Landsat数据是按景收费的——每景约数百美元。开放后,据公开数据,数据使用量从每年数万景级别增长到数百万景级别,直接惠及全球的农业、林业、城市规划研究者。
但直到2023年Prithvi出现之前,这些数据的使用方式仍然是"人看"而不是"AI看"。据业内估算,一名解译员可能需要一周时间在一景Landsat影像上勾绘土地利用分类;一支团队可能需要三个月做一次区域性洪水评估。数据的获取成本降到了零,但数据处理成本居高不下。
Prithvi打破了这条成本曲线。据技术资料,它采用约13亿参数规模(到2.0版本扩展到约6亿参数的更高效架构),在HLS(Harmonized Landsat-Sentinel)数据上预训练后,在洪水检测任务上据报告达到了较高水平(90%以上的IoU,交并比)。更关键的是,它完全开源——模型权重、训练代码、微调教程全部公开。
这意味着:一个非洲国家的水利部门,只要有一个懂Python的研究员,就能用Prithvi构建自己的洪水监测系统,而数据成本为零。这在5年前需要一支百万美元预算的遥感团队才能完成。
Prithvi的深层意义在于:它证明了在遥感领域,AI的能力上限不由数据私有性决定,而由模型工程能力决定。数据公开是公平的——但能用好公开数据的能力,极不公平。
"Prithvi最震撼我的不是它的技术指标。而是它用所有人都能下载的数据,做到了只有少数机构才能做到的事情。这就像所有人都拿到了同样的画布和颜料,但只有少数人能画出蒙娜丽莎。"——一位遥感算法工程师的评价
但Prithvi也有一个致命的局限:它基于Landsat数据训练,空间分辨率30米。在精细场景下——比如识别一辆车、一栋建筑物的微小变化——30米的分辨率远远不够。这给下一个玩家留下了巨大的空间。
二、AlphaEarth:Google的"虚拟卫星"野心
如果说Prithvi证明的是"用公开数据做出好模型",那么AlphaEarth证明的是"用算力碾压做出更强的模型"。
AlphaEarth Foundations是Google DeepMind和Google Research在2025年7月联合发布的地理空间基础模型。与Prithvi最大的不同是:它不止处理光学影像,而是实现了跨模态推理——同时融合卫星影像、航拍照片、矢量地图、元数据等多种信号。它不是"看图识物",而是"理解地球"。
在17个国家的验证中,AlphaEarth对人口分布、树冠覆盖、夜间灯光、海拔的预测R²评分据报告达到了较高水平(0.85以上)。但技术指标之外,真正值得关注的是它的产品化策略。
Google没有把AlphaEarth当作一个研究项目晾在那里。它与Google Earth AI深度绑定——后者是面向数十亿用户的品牌。想象一下:哪天你在Google Earth上点击一个地点,AI自动告诉你"这里过去三年人口增加了15%,树冠减少了8%,建筑密度增加了22%"——这些信息不是从任何政府部门获取的,而是AlphaEarth"读取"卫星影像后自己推断出来的。
这是一场关于"地球理解权"的争夺。Google不拥有任何一颗遥感卫星,但它拥有世界上最大的AI算力集群、最先进的AI研究团队、以及面向数十亿用户的软件生态。如果AlphaEarth成功,Google将不再需要发射卫星——它只需要别人的卫星数据,然后用AI做出更好的地球产品。
这对传统遥感卫星运营商的威胁是结构性的。一家卫星公司花了5年时间、数亿美元部署一个30颗卫星的星座,最终的产品是"每天给客户提供一张照片"。而Google什么都没发射,但它通过AI提供的"洞察"可能比照片本身更有价值。这就是"虚拟卫星"概念的杀伤力。
三、Clay:开源的理想与困境
在Prithvi和AlphaEarth之间,还有一个叫Clay Foundation Model的开源项目——由Development Seed、NASA和Microsoft共同推进。它的技术路线比Prithvi更进一步:多模态融合,不仅能处理光学影像,还能整合SAR数据、高程数据、气象数据。
Clay采用了类似CLIP的对比学习范式,让模型学会在不同传感器模态之间建立关联。你可以输入一幅SAR图像,模型自动找到对应的光学影像位置;输入一段描述"植被覆盖率高的区域",模型在影像中定位出最匹配的区域。
但Clay面临一个尖锐的问题:在AI领域,开源模型在通用性上几乎永远无法与巨头资源堆砌的闭源模型竞争。这在NLP领域早已验证——GPT-4和Claude的能力远超过任何开源模型。在遥感领域,同样的剧本正在上演。
如果AlphaEarth最终闭源并收费,开源遥感模型将被迫进入一个"永远差一步"的困境——就像LlaMA永远追不上GPT。而这直接关系到遥感AI的"访问公平性":发展中国家的灾害管理部门、小型农业保险公司、学术研究者——他们用得起Google的付费API吗?
四、不可见的光谱:SAR+AI才是真正的暗线
前面讲的所有模型都依赖光学影像——晴天效果极好,但有云就抓瞎。而合成孔径雷达(SAR)可以穿透云层,昼夜成像。但传统SAR的解译需要极深的物理背景知识。AI正在改变这一切。
这也是本轮遥感AI革命中最被低估的一条暗线。
芬兰的ICEYE和美国的Capella Space是商业SAR领域的两大代表。据公开资料,ICEYE的AI系统实现了毫米级地表形变检测——通过分析多次SAR观测的相位差,AI模型可以识别出建筑物约10毫米级别的微小位移。这对城市沉降监测、矿区塌陷预警、大坝安全评估具有直接价值。传统上这需要昂贵的地面GPS网或InSAR人工处理,现在一颗SAR卫星+AI就可以做到。
Capella Space则将深度学习直接嵌入SAR处理管线。在高分辨率SAR图像上,AI可以自动识别船舶类型、估算吨位、判断航向——对海上缉私、渔业监管、港口管理的客户来说,这比光学卫星更有价值,因为SAR不依赖天气。
SAR+AI的真正意义在于:它打破了"遥感必须靠光线"的物理限制。光学遥感的AI化是"把已经很好的东西做得更好",SAR的AI化是"把一个极其专业、普通人完全看不懂的东西变成了可自动解译的产品"。后者的商业价值可能更大。
但SAR AI面临一个特殊的挑战——标注数据。光学影像普通人可以标注("这里有树、这里有房子"),但SAR影像的噪声模式和几何畸变使得标注极其困难且昂贵。这导致SAR AI的标注数据规模只有光学AI的十分之一。ICEYE和Capella解决这个问题的方法是:用仿真数据训练基础模型,再用少量真实数据微调。这是一个聪明的但不算完美的折中。
五、商业遥感公司的隐形困境
讲完AI公司和研究机构的故事,再来看那些真正拥有卫星的公司——Planet Labs、Maxar、Satellogic。他们的处境比想象中尴尬。
Planet Labs有全球最大的遥感星座——据公开资料约200颗Dove卫星,每天覆盖全球一次,分辨率约3.7米。Maxar有全球分辨率最高的商业卫星——WorldView Legion,据公开资料达30厘米级。他们都是数据领域的王者。但当AI成为价值核心时,他们的优势在减弱。
原因很简单:数据本身正在被商品化。Landsat和Sentinel的免费公开数据已经覆盖了10-30米分辨率级别。据市场观察,商业遥感数据(亚米级)的价格在过去数年呈下降趋势。在数据层面,Planet和Maxar的护城河在被侵蚀。但在AI层面,他们正在与Google、微软、IBM竞争——这不是他们的主场。
Maxar的GBDX平台试图成为一个"数据+AI"的平台,但它在AI能力上与微软Planetary Computer(整合约80PB遥感数据+AI推理)相比没有明显优势。Planet收购了Sinergise加强AI能力,但与Google的AlphaEarth相比仍然是"小玩家"级别的投入。
卫星运营商正在被夹在中间:上游的AI平台公司(Google、微软、IBM)在逼近,下游的客户要求从"卖图"升级到"卖答案"。如果不能快速完成AI能力的跃迁,他们可能沦为AI公司的"数据管道"——价值最低、利润率最薄的那个角色。
"卫星运营商的终极恐惧不是另一家卫星公司抢走市场。而是有一天客户说'我不需要你的卫星影像了,Google的AI就能告诉我足够多的信息'。"——某遥感行业从业者的观察
六、AI上天:Φsat-2与在轨推理的开始
前面讲的所有AI处理都是在地面完成的——卫星拍照,数据下传,地面运行AI模型。但ESA的Φsat-2正在验证另一个方向:AI直接在天上运行。
2024年发射的Φsat-2搭载了一颗Intel Movidius Myriad X的AI加速芯片。这颗小小的芯片在约500公里高空运行着深度学习模型,实现云检测与选择性下传、船舶识别与自动告警、超分辨率重建等功能。ESA的验证结果是:据ESA验证结果,星上AI处理可以将需要下传的数据量减少约70%以上。
这意味着什么?对于巨型星座来说,地面站带宽是硬约束。即使你有几千颗卫星,能同时建立通信链路的地面站有限。如果每颗卫星都把全部原始数据下传,地面站很快饱和。星上AI让卫星只下传"有价值的信息"——这可能是整个遥感经济学中最被低估的效率杠杆。
但星上AI也有它的反对者。质疑的论点很直接:让AI在轨做处理意味着你在发射前就要决定"什么是重要的"。如果一颗SAR卫星的AI在轨丢弃了云遮挡的影像,但恰好那片云的背后有一个你事后才意识到重要的目标——这个错误是不可逆的。地面处理虽然慢,但保留了全部原始数据。在轨AI则是一次性的决策。
这个争议没有标准答案。但一个趋势是清晰的:随着星上算力提升和AI模型压缩技术的进步,在轨AI处理的比例只会越来越高。五年后,完全不使用星上AI处理的遥感卫星可能会被视为"浪费带宽的过时设计"。
···
回到开篇的那个问题:当遥感AI的燃料是公开数据,而炼油能力(AI模型)集中在少数巨头手中时,这场革命的最大受益者是谁?
不是NASA——它的角色是"数据提供者",而非价值捕获者。不是卫星运营商——他们被困在数据商品化和AI能力不足的夹缝中。不是开源社区——他们的模型很好,但在资源投入上与巨头差距太大。
最大受益者可能是Google——它不发射卫星,但它拥有最先进的AI、最庞大的算力集群、最面向用户的产品渠道。AlphaEarth+Google Earth AI的组合正在验证一个可怕的商业逻辑:在遥感AI时代,拥有卫星可能不如拥有"看懂卫星数据的能力"。
那这背后到底是一门多大的生意?谁在赚钱、谁在烧钱?谷歌的"虚拟卫星"能盈利吗?卫星运营商的AI投入有回报吗?
下一篇,我们用数据拆解遥感AI的经济账。
