欢迎光临散文网 会员登陆 & 注册

AI在药物发现中的应用及其临床相关性

2023-07-25 10:53 作者:AIDDPro  | 我要投稿

全球国内生产总值(8.5~9万亿美元)中6~7%每年用于医疗,为新药上市带来的成本远远超过10亿美元,可能需要长达14年的时间。在全球所有治疗类别中,药物开发(定义为从 I 期临床试验到药物批准)的成功率非常低,例如97%的癌症药物在临床试验期间失败。
人们对应用人工智能 (AI) 方法改进药物发现管线的各个阶段产生了极大的兴趣,包括从头分子设计和优化、基于结构的药物设计以及临床前和临床开发。生物医学数据集,如基因组图谱、成像数据以及化学和药物数据库,可以与分析方法耦合,尤其是深度学习模型,以协调发现有用药物及其临床应用所需的工具。药物发现管线通常将由以下几个阶段组成,在基于靶标的发现中,首先是从蛋白质组中鉴定出具有与疾病证据关联的新靶标。通过对这些靶标的化合物库进行高通量筛选,识别潜在的相互作用分子。化合物将针对有利的药物特性进行优化,在临床前和临床试验中进行测试,并在理想情况下给予 FDA 批准。药物发现管线的所有阶段都可以从 AI 中获益,例如,设计新合成分子的生成模型、强化学习 (RL) 以优化特定方向分子的特性、GNN以预测药物-疾病关联、药物再利用和对药物的反应。自然语言处理 (NLP) 可用于通过挖掘科学文献寻找药物。

基于 AI 的方法在药物发现管线不同阶段的应用

数据科学在药物发现过程中的应用

1.1 药物发现中的靶标鉴定

药物发现过程中的靶标鉴定旨在鉴定分子,通常是蛋白质,如果它们的活性被调节,就可以改变疾病状态。机器学习算法可以分析各种类型的数据,包括基因表达谱、蛋白质-蛋白质相互作用网络以及基因组和蛋白质组数据,以确定可能参与疾病途径的潜在靶标。在人类蛋白质组中约20,000种蛋白质中,仅约3,000种被确定为潜在治疗靶标。

识别目标的第一步是建立目标和疾病之间的因果关系。基因和疾病之间的因果关系可以使用图形、GNN或基于树的方法来识别。靶点与疾病相关性信息的主要来源是文献。文本挖掘自然语言处理 (NLP) 方法也可用于从文献中识别相关的靶点疾病对,并开发用于靶点识别的数据库。BeFree、PKDE4J和其他基于深度学习的工具可用于挖掘文章,以确定药物-疾病、基因-疾病和靶标-药物相关性。

1.2 化合物的虚拟筛选与优化

AI 可用于虚拟筛选和优化化合物,评估其生物活性,预测蛋白质-药物相互作用。AI 可以帮助虚拟筛选的一种方式是通过开发预测模型,可以识别与目标蛋白结合概率较高的化合物。这些模型可以使用各种类型的数据进行训练,如已知的蛋白质-配体复合物、结构信息和分子描述符。药物的理化性质,如溶解度、分配系数 (logP)、电离度和固有渗透性,可能对药物与靶受体家族的相互作用产生间接影响,在设计新药时必须加以考虑。

对药物的候选结构进行细化和修饰,以提高靶点特异性和选择性,及其药效学、药代动力学和毒理学特性。具有结构和配体信息的虚拟化学空间可能提供图谱分析,更快地消除非先导结构,并通过避免昂贵的耗时实验室工作来加快药物发现过程。

1.3 临床前和临床开发

预测对药物的可能应答是药物设计管线中的关键步骤。相似性或基于特征的机器学习方法可用于通过结合亲和力或结合自由能,预测药物对单个细胞的反应和药物-靶标相互作用的疗效。

基于 AI 的技术可以通过识别相关的人类疾病生物标志物,预测潜在的毒性或不必要的副作用。AI 还可以帮助在实际试验之前预测临床试验的结果,最大限度地减少对患者产生任何有害影响的机会。

1.4 FDA批准和上市后分析

自然语言处理 (NLP) 可用于挖掘科学文献,以报告药物的不良反应(如毒性)或耐药性。通过基于机器学习的系统预测产品的可能销售额,可以帮助制药公司优化其业务资源。

药物开发的现有数据库和工具

2.1 化学和生物数据库

表1.化合物和生物活性数据库列表


表2. 靶点和化学数据库列表

用于药物开发过程的基于 AI 的软件工具

表3. 用于药物发现、开发和分析的基于 AI 的软件列表

用于药物发现应用的数据表示和图形神经网络

大多数机器学习算法假设训练和测试数据都是独立和均匀分布的,然而,这一假设并不适用于药物发现应用。

固定分子描述符可根据其维度进行分类。分子具有 0D 属性,如分子量 (MW)、原子序数和原子类型计数。对于功能组,需要涉及更多结构信息的描述符,如指纹(二维二进制向量)。为机器学习算法开发了更复杂的表示,如SMILES、分子图和指纹。拓扑数据分析 (TDA) 可用于检查复杂的数据集,如生物分子的表示。检查通过连续转换保留的空间特征的数学分支,作为 TDA 的基础。训练深卷积神经网络 (CNN) 学习分子拓扑结构的分层表示,可以预测分子的各种性质

图2. 不同形式的小分子表征图示

大多数生物医学数据,如蛋白质-蛋白质相互作用、蛋白质-药物相互作用、药物-疾病相互作用和药物发现中使用的药物再利用是相互关联的,因此适合图形表示。小分子药物也可以用图形表示,原子为节点,化学键为边缘。知识图可用于呈现药物、不良反应、药物再利用和相关结局之间的复杂关系。

图3. 预测模式下的图神经网络

AI制药初创公司布局

根据 Emersion Insights 研究,在2021年上半年,药物开发领域的 AI 初创公司融资约21亿美元。AI 已经被各大生物制药公司用于药物发现的各个阶段。例如,辉瑞正在使用基于机器学习的系统 IBM Watson 来寻找免疫肿瘤药物。罗氏 Gentech 正在使用来自剑桥的 GNS 医疗,诺华正在使用微软进行细胞和图像分割的研究,Astrazenecca与 BenovalentAI 相关联,开发和商业化 Jenssen 的新型临床阶段候选药物。谷歌、DeepMind、Insilico Medicine、Deep Genomics、Healx等公司也在对基于 AI 的药物发现应用进行巨额投资。

美国是 AI 实施的先驱和主导参与者,主办了全球一半以上的 AI 公司用于药物发现业务。近年来,美国和欧盟的投资者数量大幅增加。中国也在专注于投资 AI 进行药物发现,并将在AI上投资50亿美元。到2030年,中国预计将成为 AI 药物发现初创企业的领导者。

图4.药物发现 AI 初创企业统计

在合同研发组织 (CRO) 方面,美国也领先于AI,50%的 CRO 位于美国,其次是欧洲,有25%的CRO。同时,亚洲也有10%的 CRO 对 AI 导向的药物发现感兴趣。

表4. AI 的制药和生物技术初创企业

结论

基于 AI 的方法正在医疗保健行业被采用,低成本、智能和灵活的方法正在影响药物设计、支持临床决策、诊断、预防和提出临床建议等领域。通过使用数据科学方法进行靶标鉴定、从头分子设计、药物再利用、逆转录合成和反应性和生物活性预测、可以加速漫长且昂贵的药物设计过程。未来可期!

参考文献:

Qureshi R, Irfan M, Gondal TM, Khan S, Wu J, Hadi MU, Heymach J, Le X, Yan H, Alam T. AI in drug discovery and its clinical relevance. Heliyon. 2023 Jul;9(7):e17575. doi: 10.1016/j.heliyon.2023.e17575. Epub 2023 Jun 26. PMID: 37396052; PMCID: PMC10302550.

版权信息

本文系AIDD Pro接受的外部投稿,文中所述观点仅代表作者本人观点,不代表AIDD Pro平台,如您发现发布内容有任何版权侵扰或者其他信息错误解读,请及时联系AIDD Pro (请添加微信号sixiali_fox59)进行删改处理。

原创内容未经授权,禁止转载至其他平台。有问题可发邮件至sixiali@stonewise.cn


AI在药物发现中的应用及其临床相关性的评论 (共 条)

分享到微博请遵守国家法律