本文来自微信公众号: 深蓝观 ,编辑:王晨,作者:深蓝观团队
进入2026年,AI制药的野火在行业内蔓延得更凶猛了。
3月中旬,罗氏宣布扩展其全球人工智能基础设施,在美国和欧洲完成了2176个高性能GPU的部署;同月,礼来也正式启用了其医药AI工厂LillyPod,并与英伟达宣布将在五年内投入超10亿美元建立AI联合创新实验室。
两家MNC合作的英伟达BioNeMo平台采用的是实验室闭环(Lab in theLoop)模式,其目的在于打造数字实验室并探索定制化模型。和前几年的AI工具外包以及碎片化运用不同,一旦这种模式能大规模应用,将演变成一种贯穿式系统,且与湿实验之间形成可验证的循环。
越来越多的AI龙头也在努力挤进这一赛道。4月16日,OpenAI宣布推出GPT-Rosalind,这是一款用于药物发现和转化医学的推理模型。首批客户名单包括了安进、莫德纳、艾伦研究所等。
和MNC的大举进军同步的是投资界的狂热。
去年年末上市的英矽智能在掀起认购狂潮后势头不减,即使在创新药股价整体疲软的环境下,近日还在冲击新高。投融资方面,华森制药的海外AI制药平台Earendil Labs在3月末宣布完成了7.87亿美元融资;AI医疗企业深度智耀在今年短短3个月里累计完成1.5亿美元融资。无论从融资额还是融资速度上,有AI加持的医药企业都已超出了传统创新药企业一个身位。
但与此同时,在行业难以被外界探照到的角落,一些问题也开始涌现。
其中包括一些老生常谈的问题,比如AI效率提升的环节在药物研发流程中占比过小、作用不大,制药行业的数据壁垒难以被打破,AI训练的逻辑和生物科学的逻辑不对接,两边难以沟通;
同时,随着投资驱动的AI制药公司越来越多,鱼龙混杂的问题也比两年前严峻许多。在技术滤镜逐渐破碎的今天,不少药企寻找AI制药合作伙伴的要求从“发现并验证革命性靶点”降低成了“靠谱就行”。
一名曾在AI制药公司工作过的人士称,大部分处于融资阶段的公司,拿出去展示的成功案例基本上都是“现有医学证据已经支持的靶点”,本身就更容易做出有效药物。“一些公司会拿一些研究机构的数据,对那些不懂行的投资人说AI制药至少可以让成功率提升两倍。可能这个数据是真实的,但绝对是在选择之后达到的结果。”
还有一名从业者提到,一些AI制药公司的宣传册会列出大量候选分子,但大多“不是那么有挑战性,也不太有吸引力”。而当她在相关会议上问AI制药企业们可不可以做KRAS、多肽、跨膜蛋白GPCR等机制复杂的药物,收到的往往是“我们回头再研究一下”之类没有信心的回复。
当资本在前面发出召唤,作为公司的本能就是向前冲锋。但他们真的已经准备好了吗?
-01-
AI模型的单一性
关于模型强弱和产出好坏的关系,业内一直存在争议。一名在制药行业工作但长期关注AI领域的人士认为,AI参与药物研发的主要作用在于减少无效实验,也就是“避雷不踩坑”,但是其生成的数据质量和基于其上的预测并不比传统模式优越太多。
上述从业者也举例说明:她就职的药企曾与一家AI制药公司合作,但对方给出的肿瘤杀伤数据和亲和力数据,与公司内部预测的并无二差,属于“肉眼就可以判断的程度”。这个例子背后暗示的信息,在于:部分AI模型计算的方法和传统模式下基于观察和经验的方法没有本质区别。
“如果AI能做到的维度只能达到人类肉眼看到的维度,那就太局限了。”她说。
但上述曾在AI制药公司工作过的人士认为,导致这一现象的根本原因还应归咎于模型的单一性。“现在很多AI模型只能计算静态结构下的分子状态,但没有纳入细胞层面的动态变化等容易被忽略的因素。”他还提到,在预测结构亲和力上,更准确的模型应该兼容物理方法,也就是根据分子动力学等科学逻辑来进行更接近“真实机制”的模拟和运算。
同济大学生命科学与技术学院教授刘琦曾在一场行业论坛上拿新冠药物Paxlovid举例:对研发起主要作用的是基于常微分方程的PKPD数学模型分析,而非深度学习黑盒模型——这也从另一个角度证明了能提供生物学追溯路径的模型在制药过程中的重要性。
-02-
被成本困住
但想要把这种新的模型类型纳入现有框架并非易事——等于对如今生成模型的方法,即“喂数据、训练系统”的操作形成挑战。同时,算法团队里必须要加入更高比例的生物和药化背景人才。
大部分初创公司基于成本考量,并不支持自身去做这种幅度的改进。除了研发新模型造成的巨额支出以外,还要考虑到:单一模型更具有规模和速度优势,而多维度的模型系统不仅在算力上消耗更大,同时做出判断和决策的时间更长。比如根据物理方法,模型往往需要数周才能模拟一次相互作用。
上述从业者提到,她所接触的许多国内AI制药公司,其模型都是依赖于Alphafold这一开源模型上。虽然不少大公司也在使用,但其自身的模型组合要比初创企业丰富很多。在上述论坛中,南佛罗里达大学教授许东也提到,以AlphaFold为代表的模型基于进化中的负选择能很好地预测常见蛋白,但在面临BCR/抗体等处于主动进化的边缘案例时,效果要差的多。
“我们目前接触的AI制药公司,在预测蛋白折叠上大致准确。也就是你给他一个氨基酸序列,分析其怎样折叠在一起的,形成什么厚度,这个是可以的,也帮科学家省去很多时间。但是两个蛋白之间、尤其是抗体和抗原之间的互动,AI的预测并不是很准确。”
这也就意味着:国内企业因成本限制而大范围使用的Alphafold,在面对不稳定、高自由度的系统时,经常会失效。上述AI制药员工提到,他所了解的国内大多数企业,都是在Alphafold2和3的基础上做优化,“真正做引擎开发或者使用付费产品的,不足十分之一”。
但免费的午餐即将结束。被业内誉为“Alphafold4”的IsoDDe已经登场,且根据《自然》杂志的报道,其抗体-抗原结合预测准确度是Alphafold3的2.3倍。主要原因在于该引擎能够模拟CDR-H3环,这也是抗体结构中最具多样性的部分。更重要的是,这款模型将不再开源。
如此,AI制药公司将必须在成本与技术力之间做出选择,预算的多少也将成为公司之间竞争的主要筹码。当然,这也预示了在未来:就算技术力有缺陷,AI制药企业也必须硬着头皮将融资提上日程。
-03-
MNC的选择:盲目还是理性?
尽管AI制药在技术力上面临着种种限制,依然没有浇灭各大MNC投入的热情。
除了开头提到的罗氏和礼来,还有很多MNC在2026年在AI制药上下注:1月,阿斯利康收购Modella AI,将其纳入其生成式多模态生物大模型中;2月,武田制药与Iambic Therapeutics达成超17亿美元AI抗癌新药合作,这是日本药企近十年最大AI制药单笔投入。
而这些MNC之所以愿意花钱,原因在于其候选分子数量极其庞大,哪怕只是在临床前某一环节上筛选效率总体提高10%,都会带来几十亿级别的价值。
MNC对AI制药的投入也能最大程度避免目前面临的数据库不足的问题。由于临床试验中负面结果很少被公司发表,因此在AI检索语料库中变缺乏这些关键数据供其学习。“只喂给AI成功案例,就会造成其预测成功率虚高的问题。”而在MNC主导的定制化模型中,有海量的失败数据可供开放学习。
MNC可以坚定选择AI制药,还有一层更重要的原因:即有充分的资金进行模型组合。上述从业者提到,如今大部分初创企业都只有1-2个核心模型。“虽然有些公司宣传自己从靶点发现到进入合成阶段可以全覆盖,但基本上要么是没法做到,要么就是做得很粗糙。”这一问题,在MNC角度上不会存在。
有些AI制药可能会基于环节选择不同的开源模型:比如在结合预测上使用Alphafold,在虚拟筛选上使用Boltz-2。但这种拼合会造成系统的不一致,也不利于标准化工作。在跨模型工作中,由于下游模型对上游产出数据并不负责,因此经常会出现“将错就错”或者错误累积的情况。
正因为如此,大部分MNC才更倾向于一体化、定制化、有针对性的合作。目前被各大MNC追捧的“Lab in the Loop”理念也是对上述问题的一种解决:通过实验数据的快速反馈来校正算法。在过去,训练目标是提升局部模型组件的基准准确率;而未来,目标将更多围绕着整体实验成功率来设计。
可以说,在未来:如果AI制药公司想进入真正的药物开发核心流程,几乎必须与MNC深度绑定。这不仅是因为MNC有足够的经费可以投入,还在于当MNC完成了这一套系统闭环,仅仅作为某一环节的工具而存在的AI模型会遭到大面积淘汰。
换句话说,和MNC深度绑定,意味着完全融入这套一体化的循环系统中。这也就意味着:企业必须提升自己的定制化能力。同时,建立自动化的湿实验快速测试也是打动MNC的关键技术点。
....
