AI正在构想“前所未有”的药物 | 水木视界iss.42


Copyright@Will Douglas Heaven, MIT Tech Review
82岁的Paul患有一种侵袭性的血液癌症,经过六次化疗仍无法消除。在每一轮长而不愉快的治疗中,他的医生都按照常规的癌症药物清单逐个尝试,希望能够找到有效的药物,并在确认无效后将清单上的药物逐一划掉。事实是,常规的杀癌药物并没有起到作用。
绝望之下,Paul的医生让他参加了由奥地利维也纳医科大学设立的一项试验。该大学正在测试一种新的患者匹配技术:该技术由英国公司Exscientia开发,在考虑到人与人之间的微妙生物学差异的基础上,能够将个体患者与他们需要的精确药物配对。
研究人员从Paul的组织中取了一个小样本,并将这个包括正常细胞和癌细胞的样本分成100多个部分,进而将它们暴露于各种药物的混合物中。然后,使用AI和计算机视觉识别技术,观察会发生什么。
实际上,研究人员所做的事情和医生相似:尝试不同的药物来看看哪种有效。但是,他们并没有让患者接受多个长达数月的化疗疗程,而是用生物样本对数十种治疗方法进行同时测试。
这种方法使研究团队能够进行详尽的药物搜寻。有些药物没有杀死Paul的癌细胞,而其他的药物伤害了他的健康细胞。Paul太虚弱了,无法服用在匹配过程中排名第一的药物。因此,他服用了匹配过程中排名第二的一种由制药巨头强生公司推出的癌症药物:令人意外的是,在以前的试验中,这种药物并不能治疗他的癌症类型。
这种方法对于癌症的治疗来说是一个巨大的改变,Exscientia的首席执行官Andrew·Hopkins表示:“我们在临床上测试药物的技术确实可以进行转化,并在将来服务真正的患者。”
选对药物只是Exscientia想要解决的问题之一。该公司旨在彻底改造整个药物开发流程。除了将患者与现有药物配对外,Exscientia还使用机器学习技术设计新药物。这反过来又可能产生更多的选项,从而在寻找匹配时进行筛选。
首批借助AI设计的药物正在对人类志愿者进行临床试验,以确定一种治疗方法是否安全有效,然后监管机构才能够批准其广泛使用。自2021年以来,Exscientia开发的两种药物(或与其他制药公司合作开发)已开始这一过程。该公司正在向监管机构递交另外两种药物。Hopkins说:“如果使用传统的制药方法,我们的科研进展将不会这么迅速。”
Exscientia并非独此一家。现在已有数百家初创公司在探索在制药业中使用机器学习的方法,Air Street Capital的Nathan Benaich说:“这些早期的研究成果足以吸引大笔资金。”
如今,开发一种新药物平均需要10余年和数十亿美元。不过,如果能够使用AI加速研发速度并降低药物发现的成本,即通过预测潜在药物在体内的行为并通过计算的方式舍弃不理想的化合物,机器学习模型将可以大幅减少艰苦的实验室工作需求。一家位于加利福尼亚的制药公司Verseon的CEO Adityo Prakash表示,总会需要新药物:“仍然有太多我们无法治疗或只能用长达三英里的副作用清单来治疗的疾病。”
现在,世界各地正在建造新实验室。去年,Exscientia在维也纳开设了一个新的研究中心;在2月,总部位于香港的药物发现公司Insilico Medicine在阿布扎比开设了一个大型新实验室。总共,约有二十余个(甚至更多)借助AI开发的药物正在进入临床试验。
Absci的创始人兼CEO Sean McClain解释说:“随着AI技术在制药业中的应用,我们获得了源源不断的化学和生物数据,从而能够训练更好的机器学习模型。”总部位于华盛顿州温哥华的Absci使用AI技术对数十亿个潜在的药物设计进行搜索。McClain认为,“在未来五年中,我们将看到这个行业的巨大变革。”
然而,AI药物研发仍处于早期阶段。Prakash表示,有很多AI公司的研究成果并不能被证明:“如果有人声称他们可以完美预测哪种药物分子能够通过肠道或不被肝脏分解的话,他们可能也会尝试卖给你火星上的土地。”此外,该技术并非万能良药:在实验室中进行的细胞和组织实验以及在人类身上进行的测试是开发过程中最耗时、最昂贵的部分,无法完全被省略。Luisa Salter-Cid是位于马萨诸塞州剑桥市的初创企业孵化器Flagship Pioneering的创新药物部门的首席科学官,她说:“AI已经帮我们节省了很多时间。它已经完成了我们以前需要手工完成的许多步骤。但最终的验证还是需要在实验室中完成。” 尽管如此,AI已经改变了药物的制造方式。可能还需要几年时间,才能看到第一批在AI的帮助下设计的药物进入市场,但从AI设计药物的早期阶段到最终获批的过程中,该技术已经引起了药品行业的巨大变革。
从头开始研发新药的基本步骤并没有改变多少:首先,选择身体中与药物相互作用的目标,比如蛋白质。然后,设计一种分子,使其对靶点产生作用,比如改变其工作方式或关闭它。接下来,需要在实验室中制造该分子,并检查它是否确实能够完成预期的任务(而且没有其他副作用)。最后,在人体中进行测试,以确定它既安全又有效。
几十年来,化学家们在对靶点样品添加不同的分子,并观察反应来筛选候选药物。然后,他们反复进行此过程,例如调整候选药物分子的结构——替换这个原子,那个原子等等。AI加快了速度,但试错的核心过程是不可避免的。
但试管并不是身体。许多看起来在实验室中有效的药物分子最终在人体测试中失败了。“现有的整个药物发现的过程都是失败的,”Exscientia首席商务官、生物学家Richard Law说。“药物研发成本如此之高的原因在于,你需要设计和测试20多种药物之后,才能得到一个有效的。”
新型人工智能制药公司专注于药物开发流程中的三个关键失败点:选择正确的靶点、设计与之相互作用的正确分子,以及确定哪些患者最有可能从这种分子中获益。
在数十年间,计算技术如分子建模等正不断地改变着药物开发流程。但即使是最强大的方法,也涉及到手工建模的过程:这是一种缓慢、困难且容易产生与现实世界条件不符的模拟过程。通过机器学习,包括药物和分子数据在内的大量数据可以被利用来自动构建复杂模型。这使得预测药物在体内的行为变得更加容易和快捷,从而可以在计算机模拟中进行许多早期实验。机器学习模型还可以以前所未有的方式筛选潜在药物分子的巨大未开发资源。其结果是实验室(以及后来的临床试验)中必须进行的艰苦但必要的工作只需要在最有成功机会的分子上进行。
许多公司在模拟药物行为之前甚至将机器学习应用于识别靶点的问题上。Exscientia和其他公司使用自然语言处理技术,从数十年来的大量科学报告档案中挖掘数据,包括数十万个发表的基因序列和数百万篇学术论文。从这些文件中提取的信息被编码成知识图,这是一种组织数据的方式,可以捕捉诸如“A导致B”等因果关系的链接。然后,机器学习模型可以预测哪些靶点可能是在治疗特定疾病时最有前途的。
虽然将自然语言处理应用于数据挖掘并不新鲜,但制药公司,包括大型制药公司,现在正在将其作为其制药过程的关键部分,并希望它能帮助他们找到人类科学家们可能忽略的潜在药靶联系。
AstraZeneca的数据科学和人工智能副总裁Jim Weatherall表示,让人工智能爬取大量生物医学数据帮助他和他的团队找到了一些他们本来不会考虑的药物靶点。“这真的很有帮助,没有人会读几百万篇生物学论文,我们的生物学家会去查看AI给出的建议,并确定其是否有意义。”Weatherall说,这种技术揭示了看似无关的事物之间的联系,例如最近的发现和10年前被遗忘的结果。然而,这种靶点识别技术仍处于早期阶段。他说,要等“几年”才能将其结果转化为AstraZeneca的药物,并要更久才能进入临床试验阶段。
但选择靶点只是开始。更大的挑战是设计一种药物分子来与之产生作用——这正是大多数创新药努力的方向。人体内分子之间的相互作用非常复杂。许多药物必须通过敌对的环境,如肠道,才能发挥作用。而且一切都受到在原子尺度上运行的物理和化学法则的支配。大多数基于人工智能的药物设计方法的目的是在广阔的可能性中探索,并迅速锁定尽可能多的新分子。总部位于马萨诸塞州剑桥市的创业公司Generate Biomedicines由Flagship Pioneering创立,旨在使用与文本到图像软件DALL-E相同类型的生成式人工智能。不过,Generate Biomedicine的软件并非操纵像素这么简单,而是使用随机的氨基酸链,并找到将它们扭曲成具有特定属性的蛋白质结构的方法。由于蛋白质的功能是由其三维折叠结构所决定的,这实际上使得有可能设计出一个能够执行特定工作的蛋白质。 (包括华盛顿大学David Baker实验室在内的其他团队正在开发类似的技术。)
Absci也在尝试使用机器学习创建新的基于蛋白质的药物,但是采用了不同的方法。该公司利用模型,使用实验室实验数据进行训练,以改造现有的抗体,即免疫系统用来清除细菌、病毒和其他不需要的攻击者的蛋白质,以产生许多新设计,以改善这些抗体与外来物质结合的部分。其想法是重新设计现有抗体,使其更好地结合目标。在模拟中进行调整后,研究人员会合成并测试效果最佳的设计。
今年1月,Absci与默克等大型制药公司合作,宣布利用其方法重新设计了多种现有抗体,包括针对SARS-CoV-2病毒尖刺蛋白的抗体和阻止癌细胞生长的一种蛋白质的抗体。
Apriori Bio是Flagship Pioneering位于剑桥的另一家创业公司,也关注Covid-19:他们特别希望能够开发出保护人们免受各种病毒变体侵害的疫苗。该公司在实验室中构建了数百万种新冠变体,并使用机器学习技术测试了它们与抗体互相作用的效果,进而预测出最佳抗体的效果如何:这些抗体可以抵抗1000亿亿(10的20次方)种变体。他们的目标是使用最有前途的抗体(即似乎能够应对大范围的变体或可能处理特定变体),并使用它们设计抗变异的疫苗。
“在之前,这种实验是不可能的,”Flagship Pioneering合伙人、Apriori Bio首席执行官Lovisa Afzelius表示。“仅凭人脑,不可能把所有那些零碎的东西都放在一起,理解整个系统。”
对于Prakash来说,人工智能的真正潜力在于开发出一种巨大而未被开发的生物和化学结构,这些结构可以成为未来药物的成分。Prakash说,一旦你剔除非常相似的分子,所有大型制药公司——如默克,诺华,阿斯利康等——的成分清单最多只有1000万种分子可以用于制药,其中一些是专有的,一些是公共的。“这是我们正在全球范围内测试的——化学家在过去一百年的劳动成果的总产品,”他说。然而,根据有机化学规则,可能用于制药的分子数量是10的33次方(其他估计将药物类似分子的数量甚至高达10的60次方)。“将这个数字与1000万相比较,您会发现我们甚至没有在海洋旁边的沙滩积水中钓鱼,”Prakash说。“我们只是在一滴水中垂钓。” 像其他公司一样,Prakash的公司Verseon使用旧的和新的计算技术来调查这个海洋,产生数百万个可能的分子并测试它们的性质。Verseon将药物与体内蛋白质之间的相互作用视为物理问题,模拟原子之间的推拉,这影响分子如何相互适配。这种分子模拟并不新鲜,但Verseon使用人工智能来更准确地模拟分子之间的相互作用。到目前为止,该公司已经为一系列疾病,包括心血管疾病,传染病和癌症,生产出了16种候选药物。其中一种药物正在临床试验中,而另外几种药物的试验也将很快开始。
关键是,模拟使研究人员能够越过通常特征化药物设计过程的混乱。公司传统上会创建一批希望具有某些特性的分子,然后依次测试每个分子。通过机器学习,他们列举一些具有基本特性的分子愿望清单,并在按下按钮时生成具有这些特性的分子设计。Salter-Cid说,这颠覆了开发的早期阶段:“这不是我们过去能够做到的事情。”在开发新药物时,公司通常会在五年内制造2,500到5,000种化合物。而Exscientia仅在一年内就为其一种新的癌症药物生产了136种分子。
Weatherall表示:“这是关于加快探索周期的,我们现在可以在不必真正制造分子的情况下做出更多决策。” 然而,无论如何制造,药物仍然必须在人体中进行测试。这些药物开发的最后阶段需要招募大量志愿者,难以运作,通常需要很长时间,平均约需10年,有时甚至需要20年。许多药物花费多年才能达到这个阶段,但到最后仍然面临失败。
AI无法加速临床试验过程,但可以帮助制药公司降低寻找新药候选的时间和成本,以更有利的方式加快药物候选者的进展。在实验室中测试走入死胡同的药物分子所需的时间较短,这意味着有前途的候选者将更快地进入临床试验。而且由于资金投入较少,公司并不会感到压力,也不会坚持使用效果不佳的药物。
更好地针对患者也有助于改进这个过程。大多数临床试验衡量的是药物的平均效果,统计出多少人从中受益,多少人没有受益。如果足够多的人在试验中看到病情有所改善,那么药物就被认为是成功的。如果药物的效果不够好,那么它就是失败的。但这可能意味着忽略了药物对一小部分人有效的情况。Weatherall表示:“这是一个非常粗糙的方法。我们实际上想做的是找到最大受益于药物的患者子集。”这就是Exscientia的匹配技术发挥作用的地方。“如果我们能够选择正确的患者,它确实会从根本上改变制药行业的经济模式。”Hopkins补充道。这也将大大改善像Paul这样对常见药物没有反应的患者的生活。对此结论,Laws表示:“患者可能会经历可怕的经历,不断地进出医院,有时持续数年,接受无效的药物治疗,直到要么没有药物了,要么最终找到了对他们有效的药物。” 在 Exscientia 找到适合Paul的药物后,该公司进行了一项科学研究。它从接受过至少两个失败的化疗疗程的数十名癌症患者中取得了组织样本,并评估了139种现有药物对它们的细胞的影响。Exscientia 能够确定一种适用于超过一半患者的药物。现在,该公司希望利用这项技术来塑造其药物开发方法,将患者数据纳入流程的最早阶段以训练更好的人工智能。Hopkins说:“我们可以从患者的组织开始,而不是从一种疾病的模型开始。患者是最好的模型。” 目前,第一批由人工智能设计的药物仍在通过临床试验关卡。在它们通过并进入市场之前,可能需要几个月,甚至几年。有些药物可能不会通过审批。但即使这个初始的批次失败了,还会有其他药物。药物设计已经永远改变了。Benaich 认为:“这些公司正在尝试的仅仅是第一批药物,而接下来的药物可能会超出我们的想象。”
水木未来丨视界iss.42
Credit@Will Douglas Heaven, MIT Tech Review
"AI is dreaming up drugs that no one has ever seen. Now we've got to see if they work."