本文来自微信公众号: 返朴 ,作者:Ren
凌晨三点,一台机器人已经完成了当天的第几百次实验。机械臂精确地将微量液体转移进下一个容器,与此同时,它的内置AI程序开始处理刚刚采集到的数据。不到一分钟,它已经做出决定:继续推进反应的下一步。整个过程中,实验室里没有任何人。
这个场景不是科幻小说。它发生在英国利物浦大学的化学实验室,机器人就是在这种节奏里工作了整整八天。

机器人利用人工智能执行探索性化学研究任务|图源:利物浦大学
领导该项目的博士后研究员维贾亚克里希南(Sriram Vijayakrishnan)曾经亲手完成这些操作,他深知其中的枯燥——而现在,人工智能承担了这部分工作,时间从“以小时为单位”压缩到了“以分钟为单位”。这项研究于2024年发表在《自然》(Nature)杂志上。
时间来到两年后的今天,机器人实验室已经从零散的学术实验演变为一场全球范围内的系统性行动。
今年4月,东京的一所大学启用日本规模最大的自动化实验设施之一。在这座设施内,机器人将代替人类进行科学实验。
传统的单臂实验室机器人在过去十余年中已被广泛应用于高通量筛选和标准化的微孔板处理任务,但其能力通常受限于极其标准化的环境。
相比之下,这家实验室引入的仿人双臂机器人能够完成更精细的任务,其运动灵活性凭借多个自由度,物理操作精度已经很接近人类了。
与此同时,大语言模型的迅速普及正在为这场变革注入新的能量——机器人开始不仅仅是在做实验,它们也开始“思考”实验该怎么设计了。
实验科学的产业革命?
今年4月中旬,东京科学大学汤岛校区机器人创新中心(Robotics Innovation Center)举行了开幕典礼。参加剪彩的来宾里,有几台机器人。
这间实验室目前运营着10台机器人,其中包括名为Maholo LabDroid的人形机器人。它由日本产业技术综合研究所(AIST)与安川电机(Yaskawa Electric)联合研发,外形并不科幻:两条机械臂,一个简洁的躯干,但它执行的操作比外表看起来精细得多——精准地转移微量试剂,打开温控设备门,按照预设程序进行细胞培养,随后检测、记录、调整。
Maholo在上臂额外设计了一个关节,与常见的六轴工业机器人不同,这使它能够在实验台等狭窄空间中灵活操作,复现人类手臂的运动逻辑。
这座实验室的目标并不局限于开幕时的部署规模。中心负责人中山敬一在开幕典礼上表示,计划到2040年将机器人数量扩展至约2000台,并让AI统合控制大量机器人,使从假设生成到实验验证的研究流程尽可能自动化。他将这一愿景称为“实验科学的产业革命”。
这句话背后有一个严峻的现实:日本正面临人口老龄化带来的科研人口收缩和劳动力短缺压力,支撑传统科研模式的基础技术人员与研究生队伍也面临补给不足的风险。
更远期的设想是建立一个工厂规模的科研设施,让该大学乃至海外科学家能够提交研究想法或实验协议,由设施内的机器人系统完成所需操作。部分报道将这一愿景类比为生命科学领域的“CERN式”基础设施,但至少目前看来,它仍是长期规划,而非现实。
在这座实验室正式开放之前,Maholo已在兵库县神户市的一家眼科专科医院投入使用,协助进行涉及诱导多能干细胞(iPSC)的临床研究工作,积累了相当的实战经验。
对东京科学大学的研究团队来说,干细胞培养是当下最核心的任务之一。神田元纪(Genki Kanda)团队在2022年发表的研究中,曾用AI机器人从2亿个可能的参数组合中,在111天内测试143种不同的实验条件,寻找干细胞培养的优化参数;另一个实验中,程序能对培养皿中的细胞成像、预测生长曲线,自动判断最佳收获时机;在研究人员外出休假期间,机器人连续照看细胞培养物长达8天,不需要人员在实验执行现场持续值守。

神田元纪团队开发的机器人搜索系统|图源:RIKEN
但现在,这类系统仍需人类研究员参与部分外围流程,包括试剂的前期准备、仪器设备的深度清洗、偶发性严重系统故障的排除以及消耗品的补充。此外,硬件部署、软件接口和系统集成成本仍然是阻碍该技术在普通高校实验室大规模普及的重要门槛;至于更加精密、自由度更高的双臂系统,研发与部署成本则更高。
“无人实验室”从何而来
要理解无人实验室的变革,需要区分两种截然不同的自动化。
第一种是沿用了数十年的流水线式自动化:机械臂分液、自动孵育、高通量筛选。这类系统执行的是固定程序,机器知道自己在做什么,但不知道为什么,也无法根据结果调整方向。
第二种是2020年前后以来加速进入成熟示范阶段的突破方向,研究界将其称为“自主实验室”(self-driving laboratory,SDL)。类比自动驾驶汽车,这类系统能在运行中感知环境、做出决策、修正路线。它的工作逻辑是一个持续循环:设计实验,执行,分析结果,据此设计更优化的下一轮实验。如此迭代,不需要人在每个节点做出判断,只需在关键时刻介入。

基于硬件和软件自主性类别的SDL自主级别示意图|图源:https://pubs.acs.org/doi/10.1021/acs.chemrev.4c00055
机器学习在这里扮演了关键角色。算法利用每一次实验的结果,来预测下一次实验该怎么做。这个主动学习的过程,使系统在一次次迭代中越来越高效地逼近目标。
利物浦大学的机器人化学实验室是这一理念的成熟实践之一。2024年11月发表的系统中,移动机器人共享同一个实验空间,调用超高效液相色谱—质谱仪和台式核磁共振仪对反应产物进行多维度表征——这模仿的是人类化学家在实验室里综合使用多种仪器的工作习惯,而非将结果限定在单一测量上。系统中的决策器综合这些数据,决定哪些反应值得继续、哪些应当放弃。在2020年发表的研究中,该团队的早期版本机器人曾在8天内自主完成688次实验,发现了一种光催化制氢效率比初始配方高出约六倍的催化剂组合。
加州大学伯克利分校与劳伦斯伯克利国家实验室联合建立的A-Lab(自主实验室)则走的是材料科学路线。这套系统整合了计算预测、历史文献数据、机器学习和主动学习,全自主完成固态无机粉末的合成。在17天的实验中,它从58个目标化合物中合成了41种,合成方案由经大量文献训练的自然语言模型提出,再通过基于热力学的算法不断优化,成果于2023年11月发表在《自然》上。
不过,这项研究发表后,随即遭到外部质疑:伦敦大学学院材料化学家罗伯特·帕尔格雷夫(Robert Palgrave)等人对实验表征质量和“新材料”表述提出了严重疑问。2026年初,论文作者完成勘误,将原先容易被理解为“科学上全新材料”的表述改为更谨慎的说法:这些材料对A-Lab的预测和训练平台而言是新的,但不一定是科学文献中从未出现过的材料。这次争议的意义在于,当机器人以极高速度产出大量结果时,人类专家的判断力仍是不可省略的最后一道关卡。
另一个强调速度提升的案例来自北卡罗来纳州立大学。该团队2025年在《自然·化学工程》(Nature Chemical Engineering)上发布了一项突破:通过将传统“稳态流”实验改为连续动态流模式,数据采集速度提升了至少十倍。在示范体系中,这种方法有望把部分新材料研究的早期筛选,从数月或数年压缩到数周甚至数天。
赋予机器人“思考”的能力
如果说自主实验室解决了“手”的问题,那么大语言模型(LLM)的加入,开始触及“脑”的层次。
2023年底,卡内基·梅隆大学的研究者在《自然》上发表了一项引发广泛关注的工作。他们用GPT-4构建了一个名为Coscientist的系统,使它能够查阅技术文档、编写设备控制代码,并驾驭实体自动化设备完成化学实验,包括自主设计并成功执行钯催化的交叉偶联反应。这是大语言模型较早系统展示端到端规划和执行实验室工作流程能力的代表性案例。
大语言模型的贡献不仅在于理解自然语言指令。更关键的是,它们携带着跨越海量文献的知识储备,能够根据已知信息推断实验方向,将“下一步该做什么”这个原本依赖科学家直觉的判断,转化为一种可供计算机处理的操作。换句话说,它让机器人有了查阅文献知识的能力,而不仅仅是执行写好的程序。
类似系统在2025年继续迭代。2025年4月,多智能体架构的ChemAgents系统发表在美国化学会旗下《美国化学会志》(Journal of the American Chemical Society)上,由中央任务管理器协调四个专职智能体分工:文献阅读、实验设计、计算执行、机器人操作,在论文展示的任务范围内形成一条从“读论文”到“做实验”的自动化流水线。
在科研论文的生产端,事态同样在加速。2026年3月,日本Sakana AI与英属哥伦比亚大学、Vector Institute、牛津大学合作,在《自然》正式发表了“AI科学家”(AI Scientist)系统。这套系统能够自主生成研究假说,编写实验代码,运行测试,分析结果,直至起草完整论文并模拟同行评审过程。其改进版生成的一篇论文,曾在ICLR 2025的一个会议研讨会中达到同行评审的接收阈值;不过,这属于会议研讨会层面的评审,不等同于顶级会议主会录用。
非营利机构FutureHouse于2025年5月推出了面向研究者的公开平台,首批提供四个专职智能体:通用文献问答、深度综述、重复性或先例核查,以及化学实验规划。该机构还展示了名为Robin的多智能体系统,进一步整合文献检索、数据分析、假说生成和实验规划等能力。该机构称,其整合系统能在一天内完成人类研究者原本需要数月的部分文献综述和假说生成工作。
2026年5月19日,Google Cloud AI Research、Google DeepMind和Google Research等团队在《自然》发表了Co-Scientist系统,进一步把这一方向推向“假说生成”本身。与卡内基·梅隆大学的Coscientist不同,Co-Scientist并不以控制实体实验设备为重点,而是一个建立在Gemini之上的多智能体AI系统,用于结构化科学思考和研究假说生成。

它能够根据研究目标和既有科学证据,提出可供实验验证的假说,再让不同智能体持续生成、批评、排序和改进这些想法。论文将验证重点放在三个生物医学场景中:药物再利用、新治疗靶点发现,以及解释抗微生物耐药机制;其中,在急性髓系白血病案例中,系统提出了新的药物再利用候选和协同组合疗法,并通过体外实验得到验证。
更有意思的是,论文的补充材料把这种系统明确放在“协作”而不是“替代”的框架下:研究人员让人类领域专家先给出若干复杂生物医学问题的初始“最佳猜测”,再把这些想法放入Co-Scientist的锦标赛式演化流程中接受批评、辩论和迭代。结果显示,随着测试时计算量增加,人类初始想法经AI改进后的方案评分持续提高,后期甚至超过完全由系统自主生成的方案。
换言之,这类系统最值得关注的能力,未必是凭空替科学家想出结论,而是把人的早期直觉快速展开、互相碰撞,并推向更成熟、更可验证的形式。
最真实的案例:药物发现
在目前的应用场景中,药物发现是机器人实验室最具说服力的商业案例之一,因为这里的时间成本最为具体。
传统新药从早期发现到最终上市通常需要十年以上时间,整体成本可达十亿美元量级,且充满失败风险。而从靶点提出、候选物筛选到临床试验申请(IND)及早期临床阶段,也往往需要数年。
人工智能公司Insilico Medicine自2022年12月起运营全机器人实验室LifeStar1。按公司披露口径,其自2021年以来已形成30个内部药物资产,其中10个获得研究性新药临床试验批准。其针对特发性肺纤维化的候选药物INS018_055(也称ISM001-055),于2021年2月被提名为临床前候选物,并在2023年6月进入II期临床试验,从候选物提名到进入II期临床耗时不足三年。

2025年3月,Insilico向实验室引入了一台名为Supervisor的双足人形机器人。按照公司的解释,这个决定背后是一个务实的技术瓶颈:实验室里许多仪器仍是按照人类手部结构和操作习惯设计的,即便是已经高度自动化的系统,也常常需要人工介入来更换试剂、完成维护。人形机器人被视为弥合这一鸿沟的过渡方案。
局限,不能回避的另一面
在这些进展之外,研究者们对这一领域的局限同样保持着坦诚。
利物浦团队2024年发表的论文也提示,该系统仍依赖明确设定的化学目标、预先选择的反应和构建单元,以及必要的人类补给和异常处理。把AI决策、移动机器人和复杂实验室环境长期稳定地整合起来,仍不是一个已经完全解决的问题。
东京科学大学的实验室同样坦承,在他们目前的无人实验室中,人类在多个环节仍不可或缺:准备机器人使用的试剂和耗材,在设备故障时进行排查和修复,以及在长时间实验中途补充消耗品。这些后台工作尚无法完全自动化。
来自学术界的一项评测则揭示了大语言模型本身的局限。研究者开发了一套LLM驱动原子力显微镜的自动化框架,并将多个主流AI模型放在真实实验任务中系统测试。结果显示,顶级模型在基础任务上仍频繁出错,且对提示词措辞极为敏感,表述上的细微差异,有时会导致模型表现大幅波动。更值得警觉的是,LLM存在偏离既定指令的倾向,在需要精确操作的实验场景中,这构成了直接的安全风险。
这些局限提示我们,每一项技术进展都建立在具体条件之上,在特定场景中有效的系统,未必能简单移植到另一个场景。即便是在Co-Scientist论文中,作者也把人类专家评价当作判断生成假说科学效用的关键标准,自动化评估可以扩展筛选规模,但不能取代最终的科学审查。
协作,而非替代
在这个领域有着多年积累的北卡罗来纳州立大学教授阿博哈萨尼(Milad Abolhasani)曾说过一句话,被许多研究者引用:“自主实验室将作为人类研究者的合作者,显著缩短达到科学解决方案所需的时间和成本。但它们不会取代人类研究者独特的专业知识和创造力。”
这句话值得细细品味。机器人能以数倍乃至数十倍于人类的速度完成数据密集型的探索性实验。AI大模型能辅助研究者从海量文献中提炼假说,辅助判断我们该问什么问题。但科学的核心问题——某个发现是否真正重要、是否开辟了新的方向、数据背后的机制究竟意味着什么——仍然离不开人类的判断。
从更宏观的角度来看,这场变革的意义或许超出了效率本身。2023年的一项科学计量学研究指出,在其覆盖的1945年至2010年论文和1976年至2010年专利样本中,颠覆性指标呈下降趋势。虽然这一结论本身仍有争议,但实验室自动化仍可能缓解其中一类瓶颈:将科学家从大量重复性操作中解放出来,让他们得以把精力投入到真正需要人类判断力的地方。
机器人实验室最能说明问题的地方,不是它把人类实验室原样复制了一遍,而是它正在把实验流程改造成更适合机器连续运行的新形态,建立一种新的工作方式。
科学,正在以一种几十年前难以预见的方式,继续向前走。人类科学家去哪里了?去思考更重要的问题了。
参考资料
[1]https://www.nature.com/articles/s41586-020-2442-2
[2]https://cen.acs.org/physical-chemistry/computational-chemistry/Robot-runs-almost-700-chemistry/98/i27
[3]https://www.chemistryworld.com/news/your-new-labmate-does-700-reactions-in-eight-days-and-its-a-robot/4012125.article
[4]https://www.nature.com/articles/s41586-024-08173-7
[5]https://news.liverpool.ac.uk/2024/11/06/ai-driven-mobile-robots-team-up-to-tackle-chemical-synthesis/
[6]https://www.ric.rim.isct.ac.jp/en/
[7]https://pubs.acs.org/doi/10.1021/acs.chemrev.4c00055
[8]https://www.nature.com/articles/s41586-023-06734-w
[9]https://www.nature.com/articles/d41586-023-03956-w
[10]https://pubs.acs.org/doi/10.1021/cen-10403-scicon1
[11]https://news.ncsu.edu/2025/07/fast-forward-for-self-driving-labs/
[12]https://www.nature.com/articles/s41467-025-64105-7
[13]https://www.nature.com/articles/s41586-022-05543-x
[14]https://www.nature.com/articles/d41586-023-00183-1
[15]https://deepmind.google/blog/co-scientist-a-multi-agent-ai-partner-to-accelerate-research/
