JCIM | 细胞色素P450 3A7选择性抑制剂和底物的预测模型
今天介绍的是美国国立卫生研究院(NIH)于2023年1月发表在Journal of Chemical Information and Modeling的一篇论文:《Predictive Models for Human Cytochrome P450 3A7 Selective Inhibitors and Substrates》。本研究旨在利用化学结构分析建立“First-in-Class”的预测模型,用于预测细胞色素P450(CYP)3A亚家族抑制剂和底物,以区分药物对胎儿/新生儿和成人的作用。

研究背景
细胞色素P450是最广为人知的药物代谢酶之一,参与了大多数临床药物的代谢。在人类肝脏中,细胞色素P450 3A亚家族是最丰富的一类,其表达在发育过程中发生变化,特征是在出生后不久就从细胞色素P450 3A7转变为细胞色素P450 3A4。这些变化提供了一种潜在的方法,可以区分药物对胎儿/新生儿和成人的影响。由于药物既可以作为CYP抑制剂,也可以作为底物,了解药物代谢和抑制对将药物不良反应和药物相互作用(DDI)的可能性降至最低至关重要。然而,至今尚未报道有关CYP3A7预测模型的研究。
在以往的建模工作中,主要集中在预测细胞色素P450酶的抑制物或底物,而忽略了与发育阶段相关的异构体。本研究收集了5000种已知药物和生物活性分子与CYP酶的结合数据,以及3300组∼3A4和∼3A7的CYP3A亚家族的代谢稳定性数据。基于这些数据,作者确定了CYP3A7特异性抑制剂和底物,并建立了相对于CYP3A4的CYP3A7抑制剂/底物预测模型。作者尝试了各种机器学习算法和特征选择方法,以获得最佳的模型,并针对每种抑制剂/底物类型进行预测。这些模型可以用于筛选大量的新的类药化合物,以确定它们可能对胎儿/新生儿产生的潜在影响。此外,与CYP3A7特异性抑制剂/底物相关的化学特征可以为药物的发现和开发提供指导。
化学结构表征及模型构建
将化合物的化学结构转换为两种常用的结构指纹,即ECFP4和ToxPrint。其中,ECFP4用于构建分类模型,而ToxPrint用于识别对CYP3A7/CYP3A4活性重要的结构特征。利用Fisher精确检验,通过ToxPrint指纹确定每个结构特征对于CYP3A7/CYP3A4的显著性,p值<0.05则被视为统计显著性。
为了筛选每个CYP3A7/CYP3A4抑制剂/底物类别的特征,作者在五个不同的p值截断值(从0.01到0.05)下进行了筛选。作者使用了五种分类方法,包括朴素贝叶斯(NB)、神经网络(NNET)、随机森林(RF)、支持向量机(SVM)和极度梯度提升树(XGboost)。每个模型都使用了五倍交叉验证进行评估,并使用了四种抽样方法进行平衡数据集,包括下采样、上采样、ROSE和SMOTE。
数据来源
作者购买了CYP3A4 (产品编号:456202)、CYP3A7 (产品编号:456237)、NADPH 和AXYGEN试剂。用于实验的化合物组来自NCATS的∼2,800种药物和NCATS中带有生物活性标签的∼2,200种类药化合物。CYP3A7/CYP3A4 抑制试验与先前研究 (PubChem AID: 1851) 中描述的方案相同,出于建模目的,曲线等级小于-1为是活性(1),否则被认为是非活性的(0)。在代谢稳定性测定中,底物一般可以在短时间内代谢,出于分类目的,t1/2 < 30min为底物,t1/2 > 30min为非底物。其他化合物 (~10%)具有不确定性,应在建模中忽略。
实验结果
4.1 CYP3A4和CYP3A7抑制剂/底物数据集
本研究中,共包括4511个药物样品,这些样品在抑制实验中被鉴定为活性抑制剂或非活性物质,以及子集中的3381个样品在代谢稳定性实验中被鉴定为底物或非底物。这些样品在两种实验中的活性数据如图1所示,其中使用曲线排名表示化合物的抑制效应,使用代谢半衰期(t1/2 min)表示化合物的代谢稳定性。

CYP3A4和CYP3A7数据集分为两类:活性数据集和选择性数据集(图2)。活性数据集包括CYP3A4抑制剂、CYP3A7抑制剂、CYP3A4底物和CYP3A7底物。选择性数据集包括CYP3A7选择性抑制剂(对CYP3A4)、CYP3A7底物(非抑制剂)、CYP3A7抑制剂(非底物)和CYP3A7选择性底物(对CYP3A4)。

4.2 预测CYP3A4和CYP3A7抑制剂/底物
图三总结了在不同数据集上,不同模型的预测结果。其中RF在CYP3A4和CYP3A7抑制剂预测方面表现最好,SVM在CYP3A4和CYP3A7底物预测方面表现最好。数据重新平衡有助于提高某些模型的性能,但对某些模型没有影响。

4.3 显著的结构特征
作者鉴定出128个结构特征用于CYP3A7/CYP3A4的活性(抑制剂或底物)或选择性,这些特征通过ToxPrint定义(图4)。对于每个CYP3A7/CYP3A4活性类别,显著化学特征的数量按升序排列,分别为:CYP3A7/CYP3A4常见底物(19个)、CYP3A4选择性底物(29个)、CYP3A7选择性抑制剂(29个)、CYP3A7选择性底物(31个)、CYP3A7/CYP3A4常见抑制剂(31个)和CYP3A4选择性抑制剂(35个)。在表1中,突出显示了包含这些显著特征的代表性化学结构。


结论
本研究通过一个生物发光抑制性酶反应的高通量筛选,对大约5000个药物样品在人类CYP3A4和CYP3A7同工酶中进行了药代动力学评估,并对其中的约3300个化合物进行了CYP底物的代谢稳定性测试。结果得到了大量可靠的数据,为开发和评估预测模型提供了坚实的基础。研究中应用了五种监督式机器学习算法(NB,NNET,RF,SVM和XGBoost)构建了CYP3A7抑制剂/底物的预测模型,并以CYP3A4作为比较基准。研究还通过特征筛选方法缩减维度,以解决高维数据处理的问题,并通过四种数据重平衡方法解决数据不平衡问题。最终,该研究成功地开发出了精确、鲁棒的预测模型,可以预测CYP3A7和CYP3A4抑制剂/底物类别,并对相关药物代谢和开发新药物具有一定的指导意义。
参考文献
Xu T, Kabir M, Sakamuru S, et al. Predictive Models for Human Cytochrome P450 3A7 Selective Inhibitors and Substrates. J Chem Inf Model. 2023;63(3):846-855. doi:10.1021/acs.jcim.2c01516
版权信息
本文系AIDD Pro接受的外部投稿,文中所述观点仅代表作者本人观点,不代表AIDD Pro平台,如您发现发布内容有任何版权侵扰或者其他信息错误解读,请及时联系AIDD Pro (请添加微信号sixiali_fox59)进行删改处理。
原创内容未经授权,禁止转载至其他平台。有问题可发邮件至sixiali@stonewise.cn