关闭广告

AI虚拟细胞面世,无需等待实验,可预警药物疗效与机制

DeepTech深科技1717人阅读

有了 AI,科学研究是否有一天可以摆脱对湿实验的高度依赖,通过在计算机中构建“虚拟细胞”,来模拟和理解新药可能产生的生物效应?如今,这一愿景正被逐步实现。由上海交通大学郑双佳教授及其研究团队打造的 VCWorld,构建了如同“生物世界模拟器”的虚拟细胞模型,为新药效果预测开辟了全新的计算路径。


图 | 郑双佳(来源:郑双佳)

他告诉 DeepTech:“其核心技术在于,我们基于 AI 科学家系统,发展了一种大语言模型与知识图谱混合增强的预测方式。我们构建了一个知识图谱,将人类已知的知识,如药物与靶点的关系、靶点与疾病的关系等,以显式、结构化的方式建模起来。”


(来源:https://arxiv.org/abs/2512.00306)

VCWorld:像侦探一样推理的白盒模型

VCWorld 的突破在于,它不是一个只会猜测的黑盒子,而是一个能像生物学家一样推理的白盒模型。它把 AI 变成了一个细胞侦探,既可以给出答案,还可以给你查看它的破案笔记。

VCWorld 的核心思想非常巧妙:

首先是构建一个生物知识宇宙,整合多个权威的生物数据库,把药物、基因、蛋白质、信号通路之间的关系,像地图一样连接起来,形成一个巨大的生物知识图谱;

其次,使用语言模型来理解知识,让一个大语言模型来读懂生物知识图谱中的复杂关系,并使用人类可以理解的语言描述出来;

最后,像侦探一样检索和推理,当被问到药物 A 对于基因 B 有什么影响的时候,VCWorld 不是去直接猜测,而是在知识图谱里查找药物 A 的作用机制和基因 B 的功能,以及去历史档案也就是训练数据里寻找最相似的案例比如作用机制相似的药物 C 是如何影响基因B的,然后像撰写推理报告一样,一步一步分析这些线索,综合得出一个结论并解释为什么。

在论文里,郑双佳等人举了一个例子:预测抗癌药物 Larotrectinib 对于增殖标记基因 MKI67 的影响。MKI67 基因产生的蛋白叫做 Ki-67,是细胞正在活跃分裂的指示灯。如果一种药物能够抑制癌细胞分裂,那么 Ki-67 的水平通常会下降。


(来源:https://arxiv.org/abs/2512.00306)

虽然之前没有直接实验证明 Larotrectinib 会影响 MKI67,但 VCWorld 是的推理是这样的:

第一步,寻找相似药物,借此发现 Larotrectinib 是一种激酶抑制剂。在历史案例中,作用机制相似的药物 Afatinib(另一种激酶抑制剂)被证明能够降低 MKI67 的表达;

第二步,寻找共同模式,其他一些能够引起 DNA 损伤或者细胞应激的药物,也会改变 MKI67 的水平。这说明,凡是干扰细胞生长和分裂过程的扰动,都有可能影响这个指示灯;

第三步,得出结论也就是 Larotrectinib 很可能通过抑制肿瘤细胞的增殖信号通路导致 MKI67 的表达出现下降。

这个预测与后来查到的真实实验结果完全一致。此前有文献记载称,使用 Larotrectinib 治疗之后,Ki-67 阳性的增殖细胞确实显著减少了,这证明 VCWorld 的推理不仅准确,而且有着坚实的生物学逻辑。

郑双佳表示:“我们的整个预测过程逻辑链路非常明确。模型能够解释为什么我认为这个药物会在这个细胞系上引起这个基因的差异化表达,并提供一套可追溯的知识推理链条。这就将传统的、黑箱式的虚拟细胞预测,变成了一个白箱式的、引入了因果推理引擎的过程。”


(来源:https://arxiv.org/abs/2512.00306)

什么是虚拟细胞?

细胞是我们身体里最小的生命单位,就像一个超级迷你的工厂,里面有无数的机器也就是蛋白质在不停地工作。科学家们一直想弄明白的是:如果给细胞喂一种新药,会有什么反应?哪些基因会被激活?哪些会被抑制?这对于治疗疾病和研发新药至关重要。

传统方法是在实验室里培养真实的细胞,加入药物之后再使用昂贵的仪器来检测变化。这个过程不仅耗时和耗钱,而且每次只能测试有限的药物。于是,虚拟细胞的概念诞生了:能不能在电脑里建设一个细胞的数字模型,让 AI 来预测药物的效果?

其实,已经有不少 AI 模型尝试过这个任务。但是这些模型非常挑食,它们需要海量的高质量数据来训练,如果遇到一种全新的、训练数据里没有出现的药物,就有可能预测不准。而且,这些模型依旧存在黑盒问题。而 VCWorld 则解决了这些问题。

郑双佳表示:“虚拟细胞这个概念其实已有二三十年的历史。近年再次兴起,有几个重要原因:单细胞多组学测序技术在前几年取得了重大突破,无论是蛋白质组学还是其他组学,高通量检测设备的水平提高、成本下降、精度提升,使得多组学数据大量积累。有了海量数据,人们自然会想到能否用这些数据构建类似 ChatGPT 的模型,去理解细胞尺度的语言,而不仅仅是 DNA、RNA 序列层面的语言。”

他继续说道,目前的虚拟细胞模型更像一个疾病解码器或基于表型的建模工具。但基于表型建模的最大问题是难以逆向设计药物:假设知道药物A会产生某种扰动信号,但很难根据想要的信号反向设计出分子 A。这是基于表型的药物发现的一个固有弊端。

因此,他和团队正在尝试向药物设计方向进行反向推理。例如,基于某种特定的、非药物手段(如敲低某个基因)或疾病状态产生的扰动信号,基于所期望逆转的细胞状态,能否根据这个期望的响应,反向设计出一个能实现该扰动的分子?“这是我们正在努力探索的方向。”他表示。

参考资料:

相关论文

https://arxiv.org/abs/2512.00306

排版:KIK

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

杜兰特谈28年洛杉矶奥运会:很乐意参加,必须保持高水平状态

懂球帝 浏览 1292

OpenAI奥特曼:能被ChatGPT消灭的工作不是真正的工作

量子位 浏览 2694

上年纪的女人穿衣别焦虑,试试这几个搭配套路,优雅还减龄

静儿时尚达人 浏览 2465

告别卡粉斑驳!保姆级遮瑕教程,手把手教你黑眼圈痘印全隐形

Yuki女人故事 浏览 1907

今年最好的大银幕电影,没有之一

电影最TOP 浏览 2510

李小龙妻子琳达晚年透露:丈夫其实很怕一种对手

南书房 浏览 2118

卡希尔:我确实替罗塞尼尔感到难受,我觉得球员们让他失望了

懂球帝 浏览 577

杀进世乒赛四强!国乒男团3-0复仇韩国,林诗栋+梁靖崑同时立大功

侃球熊弟 浏览 345

腾讯元宝派宣布支持接入OpenClaw

环球网资讯 浏览 1066

高效训练新标杆!华人开源原生VLM-NEO,以少数据追平顶级模型

DeepTech深科技 浏览 2429

西班牙拒绝加入美国发起的“和平委员会”

国际在线 浏览 1569

具身智能开启汽车产业万亿新赛道

车质网 浏览 2335

罗马诺:尤文等5队有意明格萨,塞尔塔目前不想将其出售

懂球帝 浏览 1856

牌桌被掀,中国模型换了一种赢法

36氪 浏览 1709

新款小米SU7计划春节前到店 预售22.99万起

网易汽车 浏览 1657

英王子因萝莉岛被死人"指控" 前妻与爱泼斯坦猛料被扒

新民晚报 浏览 9841

关键时刻伊朗欧盟关系生波澜 欧盟"站队"美以惹怒伊朗

澎湃新闻 浏览 5492

乌克兰称"首次"用无人潜航器击伤俄潜艇 俄罗斯回应

极目新闻 浏览 7205

余承东任华为终端公司董事长,孟晚舟等卸任董事

蓝鲸新闻 浏览 1554

3-0!日本U23横扫亚洲:打爆阿联酋 2连胜8-0出线 队内8名大学生

风过乡 浏览 1719

31省份去年人口出生率数据公布:哪些省份生娃多?

第一财经资讯 浏览 2438
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
Copyright © 2020-2022,版权所有 qukanredian.com
沪ICP备20002587号-1