本文梳理当前全球遥感AI领域的发展脉络,点明遥感AI竞争核心是公开数据利用能力,该能力将颠覆传统遥感商业逻辑。 ## 1. 公开数据重构遥感AI竞争基础 NASA 40年积累、累计投入数十亿美元的Landsat卫星数据于2008年全部免费公开,2023年NASA与IBM基于免费公开的Landsat、Sentinel影像发布开源模型Prithvi,预训练后在洪水检测任务中IoU达90%以上,将传统数周级的处理时间压缩至数小时。 Prithvi证明遥感AI的能力上限不由数据私有性决定,公开数据公平可得,但用好公开数据的模型工程能力才是核心壁垒。它受限于30米空间分辨率,无法满足精细场景识别需求。 ## 2. 巨头的"虚拟卫星"重构行业格局 2025年Google DeepMind发布跨模态地理空间基础模型AlphaEarth Foundations,可融合卫星影像、矢量地图等多类信号,在17国验证中对多类地理信息预测的R²评分达0.85以上。 Google将其与面向数十亿用户的Google Earth AI绑定,不发射卫星即可基于公开卫星数据输出地理洞察,这种"虚拟卫星"模式对传统卫星运营商形成结构性威胁,本质是对"地球理解权"的争夺。 ## 3. 被低估的技术暗线:SAR+AI 光学遥感依赖晴天光照,多云天气无法正常工作,合成孔径雷达(SAR)可穿透云层、实现昼夜成像,但传统SAR解译对专业知识要求极高,AI正在降低其使用门槛。 目前商业SAR代表ICEYE依靠AI实现了10毫米级的地表形变检测,可用于大坝安全评估等场景;Capella Space可依靠AI自动识别高分辨率SAR影像中的船舶信息,对海事监管价值更高,但SAR AI受限于昂贵稀缺的标注数据,目前多采用仿真数据预训练+少量真实数据微调的折中方案。 ## 4. 传统玩家与技术分支的新挑战 传统商业遥感卫星运营商手握高分辨率数据,但Landsat、Sentinel免费数据已覆盖中低分辨率需求,高分辨率商业数据价格持续下降,同时AI赛道比拼的算力、模型能力并非传统运营商的优势,若无法完成AI能力跃迁,可能沦为利润率最薄的AI数据管道。 欧空局2024年发射的Φsat-2验证了星上在轨AI推理,搭载Intel AI加速芯片可将下传数据量减少70%以上,缓解巨型星座的地面站带宽约束;但在轨AI会提前过滤原始数据,错误决策不可逆,不过随着算力和模型压缩技术进步,在轨AI的应用比例会持续提升。
遥感AI的真相:最强大的模型,喂的是最公开的数据
2026-06-12 21:45

遥感AI的真相:最强大的模型,喂的是最公开的数据

本文来自微信公众号: 太空与网络 ,作者:老谭


2023年8月,NASA和IBM在HuggingFace上发布了一个名为Prithvi的AI模型。


它用的训练数据——Landsat和Sentinel卫星影像——完全免费公开,任何人、任何国家、任何公司都可以下载。这个模型在洪水检测任务上,据公开报道,将传统方法的处理时间从数周级别压缩到数小时级别。据公开资料,NASA花了约40年时间、投入数十亿美元建设的数据基础设施,被一个开源AI模型在几个月内完成了价值的"二次释放"。


这就是遥感AI最深刻也最反直觉的事实:这场革命的燃料——遥感数据——是世界上最公开的数据之一。但也正因如此,用好公开数据的能力本身,变成了最大的竞争壁垒。


2025年7月,Google DeepMind发布了AlphaEarth Foundations。它的官方文案用了"虚拟卫星"(virtual satellite)这个词——不发射卫星,不占轨道位置,但能模拟卫星的全部观测能力。这已经不是"用AI辅助看图"了,这是在用AI重新定义"卫星"这个词的含义。


从Prithvi到AlphaEarth,从NASA到Google,从开源社区到商业遥感公司——遥感AI正在发生一场深刻的变化。本文将沿着一条叙事线索展开:谁拥有数据不重要,谁拥有"从数据中提取价值的能力"才重要。而这条原则将颠覆整个遥感的商业逻辑。


一、Prithvi的教训:NASA 40年的积累,被开源模型一夜变现


Prithvi的故事要从NASA的一个决定说起。据公开资料,2008年NASA将Landsat卫星的全部影像数据免费公开。此前,Landsat数据是按景收费的——每景约数百美元。开放后,据公开数据,数据使用量从每年数万景级别增长到数百万景级别,直接惠及全球的农业、林业、城市规划研究者。


但直到2023年Prithvi出现之前,这些数据的使用方式仍然是"人看"而不是"AI看"。据业内估算,一名解译员可能需要一周时间在一景Landsat影像上勾绘土地利用分类;一支团队可能需要三个月做一次区域性洪水评估。数据的获取成本降到了零,但数据处理成本居高不下。


Prithvi打破了这条成本曲线。据技术资料,它采用约13亿参数规模(到2.0版本扩展到约6亿参数的更高效架构),在HLS(Harmonized Landsat-Sentinel)数据上预训练后,在洪水检测任务上据报告达到了较高水平(90%以上的IoU,交并比)。更关键的是,它完全开源——模型权重、训练代码、微调教程全部公开。


这意味着:一个非洲国家的水利部门,只要有一个懂Python的研究员,就能用Prithvi构建自己的洪水监测系统,而数据成本为零。这在5年前需要一支百万美元预算的遥感团队才能完成。


Prithvi的深层意义在于:它证明了在遥感领域,AI的能力上限不由数据私有性决定,而由模型工程能力决定。数据公开是公平的——但能用好公开数据的能力,极不公平。


"Prithvi最震撼我的不是它的技术指标。而是它用所有人都能下载的数据,做到了只有少数机构才能做到的事情。这就像所有人都拿到了同样的画布和颜料,但只有少数人能画出蒙娜丽莎。"——一位遥感算法工程师的评价


但Prithvi也有一个致命的局限:它基于Landsat数据训练,空间分辨率30米。在精细场景下——比如识别一辆车、一栋建筑物的微小变化——30米的分辨率远远不够。这给下一个玩家留下了巨大的空间。


二、AlphaEarth:Google的"虚拟卫星"野心


如果说Prithvi证明的是"用公开数据做出好模型",那么AlphaEarth证明的是"用算力碾压做出更强的模型"。


AlphaEarth Foundations是Google DeepMind和Google Research在2025年7月联合发布的地理空间基础模型。与Prithvi最大的不同是:它不止处理光学影像,而是实现了跨模态推理——同时融合卫星影像、航拍照片、矢量地图、元数据等多种信号。它不是"看图识物",而是"理解地球"。


在17个国家的验证中,AlphaEarth对人口分布、树冠覆盖、夜间灯光、海拔的预测R²评分据报告达到了较高水平(0.85以上)。但技术指标之外,真正值得关注的是它的产品化策略。


Google没有把AlphaEarth当作一个研究项目晾在那里。它与Google Earth AI深度绑定——后者是面向数十亿用户的品牌。想象一下:哪天你在Google Earth上点击一个地点,AI自动告诉你"这里过去三年人口增加了15%,树冠减少了8%,建筑密度增加了22%"——这些信息不是从任何政府部门获取的,而是AlphaEarth"读取"卫星影像后自己推断出来的。


这是一场关于"地球理解权"的争夺。Google不拥有任何一颗遥感卫星,但它拥有世界上最大的AI算力集群、最先进的AI研究团队、以及面向数十亿用户的软件生态。如果AlphaEarth成功,Google将不再需要发射卫星——它只需要别人的卫星数据,然后用AI做出更好的地球产品。


这对传统遥感卫星运营商的威胁是结构性的。一家卫星公司花了5年时间、数亿美元部署一个30颗卫星的星座,最终的产品是"每天给客户提供一张照片"。而Google什么都没发射,但它通过AI提供的"洞察"可能比照片本身更有价值。这就是"虚拟卫星"概念的杀伤力。


三、Clay:开源的理想与困境


在Prithvi和AlphaEarth之间,还有一个叫Clay Foundation Model的开源项目——由Development Seed、NASA和Microsoft共同推进。它的技术路线比Prithvi更进一步:多模态融合,不仅能处理光学影像,还能整合SAR数据、高程数据、气象数据。


Clay采用了类似CLIP的对比学习范式,让模型学会在不同传感器模态之间建立关联。你可以输入一幅SAR图像,模型自动找到对应的光学影像位置;输入一段描述"植被覆盖率高的区域",模型在影像中定位出最匹配的区域。


但Clay面临一个尖锐的问题:在AI领域,开源模型在通用性上几乎永远无法与巨头资源堆砌的闭源模型竞争。这在NLP领域早已验证——GPT-4和Claude的能力远超过任何开源模型。在遥感领域,同样的剧本正在上演。


如果AlphaEarth最终闭源并收费,开源遥感模型将被迫进入一个"永远差一步"的困境——就像LlaMA永远追不上GPT。而这直接关系到遥感AI的"访问公平性":发展中国家的灾害管理部门、小型农业保险公司、学术研究者——他们用得起Google的付费API吗?


四、不可见的光谱:SAR+AI才是真正的暗线


前面讲的所有模型都依赖光学影像——晴天效果极好,但有云就抓瞎。而合成孔径雷达(SAR)可以穿透云层,昼夜成像。但传统SAR的解译需要极深的物理背景知识。AI正在改变这一切。


这也是本轮遥感AI革命中最被低估的一条暗线。


芬兰的ICEYE和美国的Capella Space是商业SAR领域的两大代表。据公开资料,ICEYE的AI系统实现了毫米级地表形变检测——通过分析多次SAR观测的相位差,AI模型可以识别出建筑物约10毫米级别的微小位移。这对城市沉降监测、矿区塌陷预警、大坝安全评估具有直接价值。传统上这需要昂贵的地面GPS网或InSAR人工处理,现在一颗SAR卫星+AI就可以做到。


Capella Space则将深度学习直接嵌入SAR处理管线。在高分辨率SAR图像上,AI可以自动识别船舶类型、估算吨位、判断航向——对海上缉私、渔业监管、港口管理的客户来说,这比光学卫星更有价值,因为SAR不依赖天气。


SAR+AI的真正意义在于:它打破了"遥感必须靠光线"的物理限制。光学遥感的AI化是"把已经很好的东西做得更好",SAR的AI化是"把一个极其专业、普通人完全看不懂的东西变成了可自动解译的产品"。后者的商业价值可能更大。


但SAR AI面临一个特殊的挑战——标注数据。光学影像普通人可以标注("这里有树、这里有房子"),但SAR影像的噪声模式和几何畸变使得标注极其困难且昂贵。这导致SAR AI的标注数据规模只有光学AI的十分之一。ICEYE和Capella解决这个问题的方法是:用仿真数据训练基础模型,再用少量真实数据微调。这是一个聪明的但不算完美的折中。


五、商业遥感公司的隐形困境


讲完AI公司和研究机构的故事,再来看那些真正拥有卫星的公司——Planet Labs、Maxar、Satellogic。他们的处境比想象中尴尬。


Planet Labs有全球最大的遥感星座——据公开资料约200颗Dove卫星,每天覆盖全球一次,分辨率约3.7米。Maxar有全球分辨率最高的商业卫星——WorldView Legion,据公开资料达30厘米级。他们都是数据领域的王者。但当AI成为价值核心时,他们的优势在减弱。


原因很简单:数据本身正在被商品化。Landsat和Sentinel的免费公开数据已经覆盖了10-30米分辨率级别。据市场观察,商业遥感数据(亚米级)的价格在过去数年呈下降趋势。在数据层面,Planet和Maxar的护城河在被侵蚀。但在AI层面,他们正在与Google、微软、IBM竞争——这不是他们的主场。


Maxar的GBDX平台试图成为一个"数据+AI"的平台,但它在AI能力上与微软Planetary Computer(整合约80PB遥感数据+AI推理)相比没有明显优势。Planet收购了Sinergise加强AI能力,但与Google的AlphaEarth相比仍然是"小玩家"级别的投入。


卫星运营商正在被夹在中间:上游的AI平台公司(Google、微软、IBM)在逼近,下游的客户要求从"卖图"升级到"卖答案"。如果不能快速完成AI能力的跃迁,他们可能沦为AI公司的"数据管道"——价值最低、利润率最薄的那个角色。


"卫星运营商的终极恐惧不是另一家卫星公司抢走市场。而是有一天客户说'我不需要你的卫星影像了,Google的AI就能告诉我足够多的信息'。"——某遥感行业从业者的观察


六、AI上天:Φsat-2与在轨推理的开始


前面讲的所有AI处理都是在地面完成的——卫星拍照,数据下传,地面运行AI模型。但ESA的Φsat-2正在验证另一个方向:AI直接在天上运行。


2024年发射的Φsat-2搭载了一颗Intel Movidius Myriad X的AI加速芯片。这颗小小的芯片在约500公里高空运行着深度学习模型,实现云检测与选择性下传、船舶识别与自动告警、超分辨率重建等功能。ESA的验证结果是:据ESA验证结果,星上AI处理可以将需要下传的数据量减少约70%以上。


这意味着什么?对于巨型星座来说,地面站带宽是硬约束。即使你有几千颗卫星,能同时建立通信链路的地面站有限。如果每颗卫星都把全部原始数据下传,地面站很快饱和。星上AI让卫星只下传"有价值的信息"——这可能是整个遥感经济学中最被低估的效率杠杆。


但星上AI也有它的反对者。质疑的论点很直接:让AI在轨做处理意味着你在发射前就要决定"什么是重要的"。如果一颗SAR卫星的AI在轨丢弃了云遮挡的影像,但恰好那片云的背后有一个你事后才意识到重要的目标——这个错误是不可逆的。地面处理虽然慢,但保留了全部原始数据。在轨AI则是一次性的决策。


这个争议没有标准答案。但一个趋势是清晰的:随着星上算力提升和AI模型压缩技术的进步,在轨AI处理的比例只会越来越高。五年后,完全不使用星上AI处理的遥感卫星可能会被视为"浪费带宽的过时设计"。


···


回到开篇的那个问题:当遥感AI的燃料是公开数据,而炼油能力(AI模型)集中在少数巨头手中时,这场革命的最大受益者是谁?


不是NASA——它的角色是"数据提供者",而非价值捕获者。不是卫星运营商——他们被困在数据商品化和AI能力不足的夹缝中。不是开源社区——他们的模型很好,但在资源投入上与巨头差距太大。


最大受益者可能是Google——它不发射卫星,但它拥有最先进的AI、最庞大的算力集群、最面向用户的产品渠道。AlphaEarth+Google Earth AI的组合正在验证一个可怕的商业逻辑:在遥感AI时代,拥有卫星可能不如拥有"看懂卫星数据的能力"。


那这背后到底是一门多大的生意?谁在赚钱、谁在烧钱?谷歌的"虚拟卫星"能盈利吗?卫星运营商的AI投入有回报吗?


下一篇,我们用数据拆解遥感AI的经济账。

AI创投日报频道: 前沿科技
本内容来源于网络 原文链接,观点仅代表作者本人,不代表虎嗅立场。
如涉及版权问题请联系 hezuo@huxiu.com,我们将及时核实并处理。
正在改变与想要改变世界的人,都在 虎嗅APP
赞赏
关闭赞赏 开启赞赏

支持一下   修改

确定