清华率先开源AI制药智能体平台!生物科研进入Autopilot时代
人人都是生物钢铁侠
LG 衡宇 发自 凹非寺
量子位 | 公众号 QbitAI
AI智能体,确实到了爆发时刻。
不论是因为会炒出圈的Manus,还是后续一众迅速跟进的OpenManus们……都在印证之前“AI智能体元年”的论断——背后核心印证的是基础大模型能力,已经到了足够支撑上层建筑的时候。
无独有偶,在更加垂直专业的生命科学领域,AI智能体也迎来了标志性事件。
就在最近,一个名为OpenBioMed的智能体平台低调亮相,率先对外开源开放。作为全球首个AI制药领域的智能体开源平台,生命科学领域、制药领域的研发人员人人可用。
生命科学研究,开始进入智能体驱动的新范式时代。
而驱动OpenBioMed智能体平台的,是清华智能产业研究院(AIR)和清华系专注于AI制药的高精尖创业公司——水木分子。
以及虽然是新团队,但核心人物却是AI老面孔——大牛聂再清,他是水木分子的首席科学家,也是前天猫精灵背后的首席AI科学家,一个因为AI骚扰电话不堪其扰而打造“二哈”反骚扰AI的硬核程序员。

现在,他希望通过为制药研发人员打造智能体,把AI之力,AI智能体之用,带入每一个人都是受众、每一个人都会受益的制药产业中。
清华果然是清华,侠之大者果然为国为民。
恰如清华大学智能科学讲席教授、清华大学AIR院长张亚勤院士所说,经过近四年的发展,清华大学AIR已汇聚了一批既懂科研又懂产业的人工智能领域学者:
如今,大模型与生成式AI技术正引领科学研究进入一个全新的人机协作新范式。生命科学智能体的出现与广泛应用,将彻底改变科学发现的进程,大幅提升科研效率。
在这一新范式下,科学家的角色将更加聚焦于提出高质量的问题和任务描述,充分发挥人类的创造力、经验和直觉。而智能体则通过高通量的文献阅读、海量实验数据分析、算法迭代与任务执行,成为科学家最得力的助手。这种深度的人机协作,将推动科学研究进入一个全新的时代。
全球首个生命科学与制药智能体开源平台
名叫OpenBioMed,架构如下:

最底层是AI制药任务用到的科研数据和知识图谱,中间则是专为生命科学和制药打造的垂直大模型和该领域研发中涉及的核心任务算法,然后最上层集成了最新最强的基座大语言模型、智能体设计平台……
最后可以实现面向场景的定制化应用。
流程全自动,效率指数级提升。
OpenBioMed可以实现什么?实现药物设计项目、生命科学研究项目的Autopilot。
举个例子,在过去,如果要发起一项药物设计,即便是一份报告生成,可能也需要一位老法师(制药专家),描述需求后让一个团队来配合执行。
但如果通过水木分子打造的AI智能体平台,完全可以Autopilot——老法师发出议题:针对携带KRAS G12C突变的局部晚期或转移性非小细胞肺癌(NSCLC)患者,设计新型药物分子。
接着AI智能体就会调动大模型展开推理,然后调用工具并形成工作流。

整个流程完全实现了完全自动化,大模型能力之下,整合了蛋白质结构分析、AI分子生成、计算筛选等技术和工具调用,形成从靶点分析到候选药物确定的闭环设计报告。
显而易见,按照Autopilot这样的节奏,过往数周数月甚至数年的制药设计周期,会被显著加快。
而且容易忽略的是,由于基座大模型的加持,Autopilot对于老法师的门槛也在降低,即便无法实现“人人都是老法师”,但对于制药领域的资源依赖降低也大有助益。
以及智能体可以7×24小时工作——未来制药领域,可能会出现智能体在凌晨3点自主优化分子结构的场景。
需要说明的是,Autopilot是水木分子在制药AI智能体上的最新成果,但不是全部路线。
作为智能双引擎的另一个,基于旗下ChatDD——AI制药领域的DeepSeek,水木分子还推出了Copilot模式,主打人类专家的“智能助手”。
在制药领域,类似设计报告一样的工作已经是非常成熟、标准化的任务,或者在某些特定领域中,智能体当前的能力已经足够强大,可以达到人类专家的水平,Autopilot作为全流程自动化执行角色,可以大大缩短研发周期。
而在需要高度专业知识和经验的任务中,把关者和决策者就必须是人类专家。
所以有了Copilot模式,就可以实现智能体与人类专家共同协作,智能体提供辅助支持,但最终决策权在人类专家手中。
具体如针对难成药靶点3D构象生成、药物筛选等任务,Autopilot来执行;AI靶点挖掘、验证实验方案优化,则由Copilot来实现。
Autopilot和Copilot被水木分子视为生物医药的智能双引擎,二者配合之下,可以显著缩短研发周期,降低系统误差,从而实现药物研发成本的下降。
当然,Autopilot和Copilot只是生命科学领域研发的最新进展,是行业智能体落地应用的表现。
在水木分子的设计中,完整的制药研发新范式,由三部分构成——
通用大模型底座+行业大模型+行业智能体。
三位一体,缺一不可。

一个时代有一个时代的制药研发范式
大模型为核心技术的制药研发范式,被水木分子命名为ChatDD,Chat Drug Design——对话式药物设计。
ChatDD将专家的认知和大模型的知识连接起来,通过人机协作对话式的方式进行药物研发。这一模式不仅重新定义了药物研发,还通过药物研发AI智能体(Copilot / Autopilot)实现了更高的灵活性和效率。
而在此之前,连点成线回溯,人类的制药研发大致历经了三大阶段:
第一代:TMDD——传统手工药物设计。
在远古时代至19世纪末,药物设计主要依赖传统手工方法(TMDD,Traditional Manual Drug Design)。科学家通过手工合成、提取和筛选药物,基于大量试验和经验进行探索。然而,这种方法存在低通量、缺乏系统性、耗时长和成本高等局限性。
第二代:CADD——计算机辅助药物设计。
20世纪中叶,计算机技术的兴起带来了计算机辅助药物设计(CADD,Computer-Aided Drug Design)。CADD通过计算机技术加速药物发现和设计过程,具有高通量筛选和工具属性强的特点,但仍依赖研究人员的经验和直觉。
第三代:AIDD——人工智能药物设计。
21世纪初,人工智能技术的发展推动了人工智能药物设计(AIDD,AI Drug Design)。AIDD具有超高通量和流程化的特点,能够从大规模高质量标注数据中挖掘药物发现和设计的规律。然而,AIDD缺乏模型与专家的交互,且对大规模高质量标注数据的依赖成为瓶颈。
在第四代制药范式中,科学家的角色将更加聚焦于提出高质量的问题和任务描述,充分发挥人类的创造力、经验和直觉。
而智能体则通过高通量的文献阅读、海量实验数据分析、算法迭代与任务执行,成为科学家最得力的助手。
按照水木分子的架构图谱,最底层是“知识”,上面是大模型和工具,再往上就是智能体,通过调用大模型能力,完成立项决策、临床前药物发现、药物开发、临床试验以及其他企业私有任务的部署。

但即便架构图谱清晰,路径明确,智能体要真正成为第四代制药范式的主角,就需要解决最核心的行业痛点——打通两大模态。
一个模态是文本模态,或者可以称为自然语言模态,是通用大模型底座。
另一个模态则是生物模态,以生物数据为“语言”,是行业大模型基础。
类比来说,两个模态很像目前基础大模型领域文本和图像两个模态,文生图和图生文如果要相互转换,就需要“跨模态翻译”,或者说对齐。
于是在生物数据大模型层面,水木分子打造了PharMolixFM。
它采用全原子建模的方式,把小分子、肽、蛋白质、DNA、RNA和离子等结构生物学研究对象的基本单元,实现了多尺度统一。
其次又把蛋白质折叠、蛋白质序列与结构设计、大小分子对接、基于靶点的分子生成等多任务统一。
最终完成了全原子基础大模型PharMolixFM。
该模型在多个关键任务上也实现了SOTA,包括分子对接任务、基于靶点结构的药物设计任务等,都在对应的行业基准测试数据集,创造了性能新纪录。
并且为了把分子结构翻译为化学家可理解且机器可利用的文本,水木分子还打造了“图生文”工具OCSU。
在通用大模型层面,基于最新DeepSeek-R1带来的推理技术,站在行业巨人肩膀上,水木分子与清华AIR联手推出了升级版的生物医药多模态开源基础大模型BioMedGPT-R1,把强推理慢思考的范式,带到了医药研发领域。
效果也非常显著,不仅以67.1%的正确率通过了USMLE美国医师资格考试,还在CheBI-20化学分子理解任务中,实现了15%的性能提升,进一步提高了由BioMedGPT-10B创造的最好成绩。

而这一系列技术能力和工具,被封装集成,然后在智能体平台OpenBioMed实现了All in One。
更难能可贵的是,作为全球首个该领域的智能体平台,OpenBioMed发布即开源,或者说为开源而生——OpenBioMed站在了开源基础大模型、开源生命科学成果的基础上,然后也通过开源的方式,进一步把智能火炬传递更深入、更广泛。
汇集众智,赋予众人。
在制药或者更广泛的生命科学研发领域,如果最好的资源能无差别覆盖到更多研发者,或许会让整个领域的推进更快更高效,一旦生物医药领域进入了涌现期,商业价值和社会价值,无疑会辐射到每一个人。
但依然有问题悬而未决,作为水木分子首席科学家,聂再清不只一次被问及这个问题——
会有AI独立制药的一天吗?
“AI在制药领域必须是助手”
“AI在制药领域,必须是助手。”
这就是水木分子首席科学家聂再清的回答。实际上,作为科学家、AI领域的大牛,聂再清很少有如此绝对的论断,但这一次他无比肯定,他补充说,从价值观上就需要明确AI的“助手”设定。
这也是AI在深入生命科学等前沿领域之时,常被人讨论的话题。
一方面,AI的能力正在不断突破人类的极限,或许用不了多久,AI就会独立发现新规律、新材料、新方法,人类已经不再是最聪明的那一个;另一方面,生命医药领域关系的是人类最基本最脆弱的身体健康……
有一派的观点是需要最大化助力AI的发展,包括在“独立”问题上,因为只有如此才能打造出真正强大的AI模型和系统,如果硅基正在觉醒,那碳基让出统治权也是历史发展的必然选择。
但另一派不这样认为,他们坚守的依然是“以人为本”的原则和信条,AI需要为人所用、帮助人向善,并且从一开始设计的时候就要确保其安全性。
很显然,聂再清选择站在以人为本这一边。
他本科硕士都毕业于清华大学计算机系,博士师从美国人工智能学会前主席Subbarao Kambhampati教授,先后在微软、阿里巴巴达摩院从事AI技术研发,是能力、资历和影响力兼具的AI大牛,带队获得过中国AI领域的最高奖项吴文俊人工智能科技进步奖。
2020年开始,他获得张亚勤院士感召,加入清华大学AIR智能产业研究院,担任清华大学国强教授、清华大学智能产业研究院首席研究员,并以水木分子首席科学家身份对外亮相。
但聂再清自己来说,他觉得自己始终在做的事情只有一件——
智能助手。
他说从微软亚洲研究院开始,做的其实就是“助手”相关的工作,比尔盖茨对智能助手“Personal Assistant”情有独钟,希望打造出一套人机交互里的完美助手。
后来去阿里巴巴达摩院,负责的天猫精灵,更是直接的AI助手,只不过交互方式更偏向于语音。
现在在清华大学智能产业研究院,“AI助手”也是其主轴,水木分子所做的事情,只不过是把“助手”放在了AI与生命科学两大前沿的交叉创新地带。
即便Agent智能体的定义业内还没有清晰的共识,但聂再清看来,AI智能体就是AI助手的另一种表述——更时髦流行的表述而已。

水木分子为生物制药领域的研发人员提供Autopilot和Copilot两种智能体可选模式。
OpenBioMed是由清华AIR和水木分子共同推出的全球首个生命科学与制药智能体开源平台,可以开源供业界开发生物医药智能体。
ChatDD是水木分子的商用平台和产品,通过Copilot助手和AutoPilot智能体两种模式,支持多种医药行业和企业的药研任务,场景包括例如: 立项、药物设计和分析报告生成等。
二者放在一起,组成的就是生物医药的智能双引擎,可以帮助更多科学家接近他们曾经在科幻里才能接近的向往——
之前有个统计说,让科学家选择想成为的超级英雄,最后被选择最多的角色是:钢铁侠。以为他以凡人之躯,借助科技之力比肩神明,打造AI助手发现了新元素、新材料、完成了时空穿越的模型验证。
哪个科学家不想拥有一个贾维斯星期五?
现在,水木分子迈出了引领全球的一步,率先开源OpenBioMed的智能体平台,希望生物医药研发人员,每一个都可以变成钢铁侠。
GitHub开源仓库:
https://github.com/PharMolix/OpenBioMed
