本文来自微信公众号: 峰瑞资本 ,作者:持续思考的
AI for Science(以下简称AI4S)正从一个非共识的小赛道,变成全球顶级资本和顶级药企集中下注的方向。
峰瑞一直在AI for Science上系统性布局。继2024年以晶型计算起家的晶泰科技以"AI制药第一股"身份登陆港交所之后,今年5月13日,做AI药物递送的剂泰科技也成功登陆港交所,成为全球AI药物递送第一股,也是港股AI大分子生物制药第一股。
前段时间,在上海漕河泾开发区,上海国投先导、峰瑞资本、漕河泾AI加速器共同主办一场聚焦“AI for Science(AI4S)”技术进展与产业机遇的专题沙龙。来自生物医药、新材料、细胞工程等前沿领域的资深专家与投资人,展开了一场关于“AI如何重写科研范式”的深度探讨。
在5场专题演讲后,圆桌环节由国投先导基金副总经理何苗主持,台上是三位峰瑞被投企业的科学家CEO:拓因科技张文彬、合生科技刘天罡、百曜科技李鑫,以及峰瑞资本合伙人马睿。

本场圆桌嘉宾合影。图源:现场拍摄。
圆桌上他们聊到了这些话题:
AI制药真的能做出药了,但下一个拐点到底在哪?AI虚拟细胞会是下一个AlphaFold时刻吗?
科学家变CEO,最难的不是技术,是"放弃的能力"?
数字世界和物理世界怎么对齐?怎么招到比CEO自己还能打的人?
在AI4S这种长周期、高壁垒的赛道上,创业者真正想要什么样的钱、什么样的投后服务?
下一个诺奖会先开在哪?一个爆款的天然分子,还是一个比爱因斯坦还强的AI?
下面是对话实录,经编辑。
/01/
AI4S的拐点,到底是什么?
何苗:在进入正题之前,先请几位做个简单的自我介绍。
张文彬:我是学有机化学出身,博士期间在阿克伦大学攻读高分子科学,之后在加州理工David Tirrell和Frances Arnold实验室做博士后,从那时候开始从事生物大分子的研究。2013年回到北大之后开始做拓扑蛋白质,后来和团队一起成立了拓因科技,把这件事产业化。
刘天罡:我们公司合生科技聚焦在天然产物领域,大家吃到的味道、闻到的花香、看到的颜色,日化里护肤品的功能成分,农业里的动物营养以及植保病虫害防治,还有小分子的天然药物,都属于天然产物的范畴。公司是从武汉大学的科研成果转化做出来的。
李鑫:我来自百曜科技,同时在中国科学院动物所和北京干细胞与再生医学研究院,回国前则是在MIT。我的研究背景横跨了干细胞和发育再生医学、表观遗传、衰老和疾病几个领域,看起来蛮丰富的,但底层的核心问题其实比较一致:从生命围绕中心法则、从序列上的信息投射到宏观表型的中间。
马睿:我是峰瑞资本的马睿,做交叉学科领域的早期投资比较多,AI制药与AI for science都是我们重点关注的领域,今天台上的三位都是我们的被投。一会儿我也会给大家讲一下我们对AI4S领域的判断。
何苗:今天能坐在这里,本身就说明大家都很看好AI4S。所以第一个问题请问各位,当时是什么契机接触到AI、它对你的研发起到了什么作用?以及,你是否觉得,现在已经到了AI4S产业化的黄金时点?
张文彬:我之前是做合成高分子的,那是个结构非常不精确的体系。转到蛋白质,感觉一下从石器时代进了信息时代。序列是确定的,折叠之后每个原子的位置也是确定的,但它能演化出的可能性又极多。
最早做拓扑蛋白设计,我和学生为了一个分子,能呆在办公室坐上十几个小时,拿着铁丝模型一点点去死磕。但2018年之后,随着结构预测、语言模型、生成式模型的陆续问世,整个流程一下子可控了很多,到现在连实验室里的本科生也能很快上手。所以AI4S是不是未来?毫无疑问,而且下半场会跑得非常快。
只是我们走的不是常见的那条路。大自然里的蛋白质都是线性结构,因为核糖体的模板聚合机制只能做线性,但这不是必然。如果我们把主链打开,让它变成环、纽结、套索或者链环,就相当于给蛋白质开了一个全新的"序列宇宙"。大自然演化了几十亿年,天然的蛋白骨架样式也只有大约1300种,而我们直接把这个数字拓到了10⁴级别,结合生成模型还能进一步推到10⁵。这件事的意义不在数量,而在于我们能够用更稳定、且能穿越专利壁垒的新骨架,把同样的功能再"重做一遍"。这也是我们后面会展开聊的核心。
刘天罡:科学和工业的进展,其实经常是懒人推动的。勤快的人愿意几天不睡觉把实验干完,但总有一些人不想这么费劲,会去想有没有更简单的办法。
何苗(笑):刘教授您是懒人?
刘天罡:也不能这么说。但AI让我们能把过去靠经验积累的规律总结出来,替代原来的大通量实验。看到这一点之后,那就积极去拥抱。
对我们这个行业来说,拐点的意义其实更大。人类花了一百多年,从自然界里鉴定出40万种天然产物,目前在用的有4000种,成功率1%。但我们只研究了地球上10%的物种,潜在的天然产物可能有400万种,甚至4000万种。过去找天然产物是上天入地。日本微生物学家大村智从高尔夫球场揣回一捧土,从里面分离出了avermectin(阿维菌素),这让他拿到了2015年诺贝尔生理学或医学奖,而辉瑞1949年的第一个专利化合物土霉素也是同一套办法找出来的。但这套范式已经走到尽头,大药企都把天然产物部门砍掉了。不是真的没有了,是用老办法找不到了。
所以我们换了个范式:从基因组数据里用深度学习预测沉默基因,再用高通量基因合成,让工业底盘细胞把分子"隔空取物"做出来。这可能是地球上最后一波跑马圈地。
李鑫:我做的是细胞生物学和干细胞。2006年iPS(诱导多能干细胞)出来的时候,掀起过一股用干细胞做再生医学的热潮,但这个承诺一直没兑现。干细胞的管线开发、分化、优化都太漫长,要靠人工经验加各种诱导物去试错。
大概2010年左右,就有人用基因调控网络去预测细胞状态了,但天花板很低。直到2018年AlphaFold出来,我们意识到深度神经网络对复杂系统的拟合能力非常强,就开始想:能不能用AI直接去模拟细胞状态的连续变化?但当时数据量和算法都不够。到2022年,我们才摸索出用自监督训练做这件事。跑通那一刻很兴奋,然后发现全世界聪明的人不止我们一家,有三个团队同时在做。这件事在学术界后来被叫做"AI虚拟细胞"。
2023年是虚拟细胞元年。那一年学术界首次把大量单细胞分辨率的转录组数据,和Transformer自监督架构结合起来,做出了Geneformer、scGPT、scFoundation和我们团队的GeneCompass四个模型。到2024年12月,AI虚拟细胞作为一个名词被正式提出;2025年进入产业和学术界的双爆发期。我们目前积累了接近6亿个单细胞数据,覆盖了人体几乎所有细胞类型;模型在虚拟细胞挑战赛上拿到全球第二、国内第一。细胞,是我们期待的下一个AlphaFold时刻。
我们对这件事非常有信念。它是一场基础性的革命,和过去单一分子层面的工作相比,能力性质和想象空间都不一样。
马睿:大概十年前,峰瑞就投了晶泰和蓝晶,一个AI制药,一个合成生物。从那时候起,我们就习惯了用AI视角看生物。但说实话,AI制药被诟病了四五年——大家都觉得它只能解决一点点效率,而且只在某一个环节,更关键的是没做出药。
我们很乐观的原因是我们亲眼看到了技术怎么一步步迭代、升维,而且通过这些公司的发展过程,我们发现,真正起作用的不光是技术,是创始人对AI的信仰。他最先在所有人都质疑的时候跳下去,然后得到了资本和市场的奖赏。晶泰就是典型。当然,剂泰科技也是。
今天我们看到的拐点信号至少有五个。
第一,多家AI制药公司走到上市,晶泰、英矽、剂泰都已经在港股,俗称“AI制药三小龙”。
第二,越来越多的药真的被AI做出来。
第三,过去两三年新一代模型大量涌现,AlphaFold 3、RFdiffusion、ChAI,以前的成就是基于更老更早的模型,新模型撑起的想象空间会更大。
第四,跨国药企开始大笔投资,绑定模型公司,礼来给了ChAI千万美金,把自己150年的数据开放出来。
第五,数据采集的范式变了,从手工实验变成agent加自动化高通量。一句话,AI制药从一种研发工具发展为造出真实的药物,从概念走向了现金流。
基于这些,我对未来五年AI4S非常乐观。
何苗:能看出峰瑞对AI4S是有信仰的机构。我想追问一下,在所有例如AI+材料、量子力学、可控核聚变等前沿行业中,下一个真正出现商业闭环的方向会优先出现在哪里?
马睿:我的判断是,会先发生在那些本来数据基础不错、又一直在尝试AI的领域。比如生物制造、脑机接口和AI虚拟细胞。其实何总您问的这个问题,本质上是在问,未来新的数据会从哪里来。哪里能稳定地长出新数据,哪里就有可能长出落地的应用。
这三个方向背后其实是同一个框架。AI自身的进展不能直接代表生产力,真正的生产力来自AI对各个行业的渗透。AI先扩散到物理、化学、材料、生物这些学科,在里面完成0到1的科学创新;这些创新再和产业里的需求结合,完成1到100的放大。
生物制造、脑科学、AI虚拟细胞会是接下来的几个闭环,是因为它们都已经站在这条链路的中段。美国有一家公司用生成式AI在两周内把电池的瓦时每千克提了50%,而过去150年这个指标年均进展不到1%;脑科学领域,我们投的一家公司优脑银河在难治性抑郁、帕金森上已经做出了非常好的疗效,还找到了新靶点;在核聚变领域,等离子体的预测、控制、设计离开AI几乎做不了,未来的反应堆设计也会需要AI。
基于这些,我对未来五年AI4S非常乐观。
/02/
创业最大的挑战,是什么?
何苗:下一个问题想再请教三位教授。三位不仅在科研上,在产业化上也做了很多工作。科学家创业过程中肯定会面临很多挑战,比如技术转化、团队搭建、商业模式。能不能分享一下心路历程?
李鑫:我觉得最大的挑战是身份的转变。从学术圈出来之前,我们想问题更多是从技术的角度出发,觉得能力边界是最关键的。但进入产业界你会发现,它是一个更综合的体现。既要技术本身,也要市场的反馈,市场又包括资本方和客户。整个过程我最大的心得是,最考验的其实是快速学习的能力。每个方面都是新的,你都得去尝试,所以这是一个底层的挑战。
刘天罡:我跟商业结合的经历比较多。我博后期间,也是美国最早一批合成生物学兴起的时期,我看着这些公司从起来到衰落,回国之后投资过一些初创公司,所以之前看得比较多。回过头来看,我现在觉得最大的挑战是放弃的能力,也就是做减法的能力。
身份转变、组建团队、销售这些事情,当过教授的人只要想干都能干好,只是原来不知道怎么干。但真正难的是另一件事。以前是来者不拒,谁来找我都帮,我很能打,能把事儿搞定;但花这些精力到底值不值得?在现在这个阶段,挑战最大的是怎么找到一个更高成长的赛道。
拿我们公司目前的几个产品举例。心梗领域我们做了一款代号HS-88的化合物,秋水仙碱长期是心梗治疗的潜在候选,但安全窗口太小了,而我们化合物HS-88在没做结构修饰前的安全性就比秋水仙碱好很多,效果还更好。蚊虫驱避领域我们做出了艾蒿醇,在50 ppm浓度下对蚊子和蜱虫都有效,在新疆北湾这种每立方米11700只蚊子的地方实测都管用。香气分子方向,我们做了圆柚酮,用大模型预测分子味道再去合成它的衍生物,做成下一代的香水替代分子。这三个东西分别对应药、农化、日化三个完全不同的客户群体。
张文彬:选品确实非常有挑战,它不仅要求你懂技术,还要求你懂市场和商业模式。我非常同意刚刚刘教授说的,要做什么,更要决定"不要做什么"。
我们刚把技术平台建立起来的时候,我自己雄心勃勃,觉得蛋白质作为生命功能的承担者,简直无所不能,可以做药物,可以做材料,也可以做催化剂。但真到了落地阶段,现实会告诉你,每一条路上都有强劲的对手。到底最契合你、最能让你发挥长板的产品在哪里?这时候,对创始人最残酷、也是最重要的要求,就是把你的"学术品味"升级为对科学和商业的双重敏感度。这是一个巨大的挑战。
面对这个挑战,我们的解法是把产品线清晰地拆成短、中、长三步走。最先跑通商业闭环的是"酶",从精细化学品、医药中间体到PET塑料降解酶,现在都已经有了多次复购的客户。第二层是大分子药,那是想象空间最大的市场;我们正在把现有蛋白药做成拓扑版本,去提升它的稳定性和降低免疫原性。第三层是复杂软物质,比如染料液晶,这是我们最长期的方向,它更多是测试我们AI泛化能力的"练兵场"。
/03/
下一步要跨越的门槛,是什么?
何苗:大家在science、商业化、AI跨界这么多领域里怎么分配时间精力?以及在你们各自方向上,下一步技术突破要解决的关键难题是什么?是多积累数据、跑通干湿实验闭环就够了,还是有别的待突破的技术难题?
张文彬:时间平衡这件事对我而言确实很有挑战。我其实是一个非常有好奇心、特别贪学的人。但这给我带来巨大的压力,时间永远不够用。
走到最后,我发现解决路径还是要回到战略:公司经营需要战略,个人发展同样需要取舍。人最稀缺的资产往往不是财富,而是注意力和专注力。所以,我现在正努力把精力死死聚焦在最核心的大事上,把其他事情通过充分放权和团队协作来推进。在科学研究中,一个人靠一项特长板就可以单点打穿;但在商业世界里,长板再长也拼不过一个系统,这注定是团队的胜利。
谈到下一步突破,我认为AI for science落地最核心的瓶颈,在于如何加速数字虚拟世界与物理现实世界之间的对齐与交融。我们正在做的TopoEvolver平台,正是为了回应这个巨大的挑战。它和传统高通量自动化实验不一样。它的"通量"是灵活、弹性且智能的。它不仅能自主像科学家一样去阅读文献,去做不同的实验流程、甚至能自主判断在什么时间节点、将什么样的AI模型结合起来,去攻克一个特定的具体问题。
何苗:追问一下。您演讲里提到现在蛋白质结构预测已经是红海,那您做的拓扑设计相比传统蛋白预测,到底起了多少增益?
张文彬:传统蛋白质结构预测偏向于理解"蛋白是什么"。而我们的拓扑技术,是从底层把骨架整个改写了一遍。同样的功能,我们可以让它在更稳定的新骨架上跑起来。这是一个完全聚焦于提升功能的体系。
传统线性蛋白往往要面对一个非常庞大的构象空间,但我们的拓扑结构可以重塑这个空间,把它"框"在功能构象旁边。构象空间被集中了,功能自然就上去了,可进化性也就提高了。
换句话说,前面那波结构预测可以说是蛋白质研究的"上半场",下半场一定是关于功能,看谁能控制它、怎么提升它。我们和传统线性蛋白走的是两条完全不同的路。他们是在大自然给的现有骨架上做内部变化,彼此之间是竞争对手;而我们完全是跳出来开辟了一个新赛道,这里面有无穷多的可能性,因为拓扑类型在本质上就是无限的。
刘天罡:时间分配上每个人在某个时期都有一个重心,没法真齐头并进。下一步对我们最难的是组织建设。前期我们靠科学和技术的先进性,加上自己躬身入局,把市场口子切开;但要从1复制到100,不可能只靠最原始的团队,一定需要后面的组织结构建设,能不能吸纳和培养比你还能打的人。
李鑫:我们这个领域非常新,AI虚拟细胞从有这个名词到现在才两年。再往前的计算生物学是用偏微分方程做细胞模拟,但用今天AI的算法来做模拟的人非常少。所以我花时间最多的也是团队建设,尤其是交叉团队。AI原生的人才,原来做自动驾驶、做通用计算机视觉的,怎么和生命科学,尤其是细胞生物学的背景匹配起来?还不止,你还要找应用场景,从做药到临床又是一个很漫长的过程。
外部的人不够,那就自己培养。我们内部有一个机制,大家强制性地在一个物理空间里头脑风暴,把学术端最前沿的技术和产业需求捏在一起。
整个领域最大的瓶颈还是AI for science最佳应用的摸索。这个技术太新了,目前能落地的场景在药这条路径上环节非常多,可做的方向也很多,但精力有限,所以我们也在做减法。
/04/
创业者想要什么样的钱?
何苗:作为代表上海市政府的投资平台,我们也想跟马总和各位科学家聊一聊。上海包括国资平台现在把AI for science当作战略重点,那么对政府侧、投资机构侧,几位有什么诉求?像基础设施、环境打造、人才引进这些事,过去两年我们在算力补贴、特殊人才引进政策上做了不少。具体到AI for science这个方向,希望听听各位的心声,我们后续能做什么。
马睿:第一,需要更多的钱支持AI for science的创业者,这一点非常需要国投的支持。第二,AI for science在上海已经有共识,但整体上还是非共识的赛道。钱进来之后,怎么往非共识的方向去配置很重要。
刘天罡:第一是要有重金。我们公司客户直接面对国外的大公司,所以感受很直观。真正的竞争对手就是中美,和美国相比,原创模型大部分是美国先出来,我们是跟随式创新。在这样的格局下,现在有一些很好的种子型企业、走在别人还没开始的赛道上、做的事情也有意义,应该坚定不移地加大投入,把这些种子选手打造成明星企业。
李鑫:第一是整合资源。钱是一方面,更重要的是上下游对接的生态链,这是政府引导可以发挥优势的地方。第二是围绕生物制药。AI for science最关键的是端到端,你最终的产品、最终的产出能不能让人群、让患者用上。怎么在这么长的链路里把最终的成果串起来,需要跟前面的资源整合配合。所以下游市场的培育,比如药品医保政策、药物开发过程中的加速政策,也是可以一起做的方向。
张文彬:AI for science现在面临一个挺大的产业交付问题。但我认为,这种困难很多时候真不是因为技术不行,而是题没选对。在产品立项、启动之前,大家可能没跟产业界做过充分的沟通,或者团队里全是科学家,缺少一个对产业有sense、懂商业的人,结果就是对真实的成本、对这个问题到底是不是刚需,缺乏一个靠谱的评估。所以,在这方面如果能有人帮我们做一些"个性化"的辅导,帮我们多连线一些产业资源,尤其是把海外的产业圈子和资源对接到位,再加上在人才招募上搭把手,那对我们的帮助就太大了。
/05/
下一个诺奖,会出现在哪?
何苗:上海这次推AI for science,是为了推动整个科研范式的演进。24年诺奖颁给了AlphaFold团队,我们希望这一波培育能在中国诞生新的诺奖得主。所以请几位大胆预测:下一个诺奖可能在什么领域?
刘天罡:先看历史。中国唯一一个自然科学诺奖给了青蒿素,是个小分子。屠呦呦老师这个名字本身就出自《诗经》里那句"呦呦鹿鸣,食野之蒿"。诺奖一般两类,一类是大的技术或模型突破,比如基因编辑、AlphaFold;另一类是真正解决问题的药物或分子,比如青蒿素。要有那种产业体量大、一药难求的分子,才有可能冲到这个级别。所以从概率上看,如果能在大自然进化出来的东西里快速找到一个爆款,或许有机会。
张文彬:从基础原理的角度来看,上个世纪好像已经把大方向"穷尽"得差不多了。现在的科学突破,更多是从这些最底层的原理里,去长出影响力特别大的具体发现,解决某些长期以来的具体问题。就像刘教授刚才说的,可能是一款划时代的药物,也可能是一项颠覆性的技术。核聚变是这种可能,一款新药也是这种可能。AI在这里能发挥的最大价值,就是把这些可能性"浮出水面"的速度狠狠提上来。它将打破原有的研发周期,让原本遥不可及的涌现,变成我们可以亲眼见证的现实。
李鑫:这个问题颗粒度不一样答案就不一样。生命科学在重要自然科学问题里占的面很广,从宏观到微观有非常多层次,每个尺度都可能出高影响力的成果,所以这个领域诺奖的点会比较多。其他学科里,量子方向也都有可能。AI for science真正能做的,是加速我们去看到那些目前还没看到、还没推断到的隐藏角落。具体在哪个点上爆发,很难提前指出。生命本身是一个复杂网络,每一个层面、维度、尺度都可能。我们做虚拟细胞,本质上是想把这些层级串起来,从系统的视角找到那个真正重要的靶点。
何苗:虚拟细胞领域是一个技术的集大成者。前面可能还需要分子和蛋白层面的进展。
马睿:我们现在每天都还在证明自己,能做药、能生产分子、能用AI虚拟细胞做哪些具体预测,因为这个领域整体还是非共识。但如果真大胆预测一下,我觉得没有AI for science,AI是到不了超级智能的。中间一定有一个阶段是AI for science超过一定水平的人类科学家。DeepMind创始人哈萨比斯说过,他们要做出一个比爱因斯坦还强的AI。这可能也是一个诺奖方向。未来AI for science可能会有一个更广义的概念。这条路径跟我们每天强调的"踏踏实实做分子"不一样,但值得期待。
