欢迎光临散文网 会员登陆 & 注册

利用主动学习方法高效设计肽结合聚合物

2023-06-27 09:37 作者:AIDDPro  | 我要投稿

本文讨论了主动学习(AL)算法在化学研究领域的应用。传统的机器学习(ML)模型需要大量的标记数据集进行训练,但在化学领域,获得这样的数据集十分困难。主动学习解决了这个问题。

01 主动学习

用于解决分类问题的机器学习,如今已经是很熟悉的话题了,我们知道所有分类模型都需使用标记样本训练,并且分类模型的效果依赖于标记样本的质量。一个好的分类模型离不开大量优质的训练数据,但是在实际应用条件下,我们得到的数据往往都是没有经过处理的,而数据的处理是一项相当庞大且繁琐的工作,并且有时候还需要一些专业人士才能处理,因此需要耗费巨大的人力成本和时间成本。基于此,在机器学习领域中,提出主动学习方法,优化分类模型。

主动学习算法会通过某些方法找到样本数据中最有价值的数据,然后我们把删选出来的数据交由专家进行人工标注后,将标注后的数据放入训练集对分类模型进行迭代优化训练,这一过程称为主动学习简单来说,机器学习中的主动学习能够用更少的人工成本获取更有价值的标记样本从而使分类器具有更好的泛化性能。和以往被动学习算法不同的是,主动学习算法会根据某一些策略将未标记样本中的一部分样本进行标记,然后重新投入训练集中,用来辅助分类器的训练。AL已经被用于分子和材料设计中,通过优化所需的属性来加速发现有前途的候选物。用于测试的候选物要么是通过计算预测和实验测试重新生成的,要么是从现有数据中选择的。候选物的选择是基于最大化模型性能("探索")或针对特定属性("开发")。AL已经在各个领域找到了应用,包括预测反应产量、发现有机半导体、寻找具有特定性质的材料、设计成像剂、预测量子化学性质和帮助药物发现。虽然许多研究从大量的初始数据集开始,但也有一些例子表明AL从极小的数据集开始,即使在数据稀缺的情况下也显示出它的有效性。

02 主动学习(AL)在基于聚合物的药物输送系统设计中的应用

在药物输送系统领域,实验数据是有限的,而且实验成本很高,AL的使用可以帮助研究人员更好地设计实验。AL辅助建模的主要目的是快速识别具有改进特性的给药系统,而不是像传统的机器学习方法那样使预测能力最大化。

AL被整合到一个迭代的设计策略中,最初的小型数据集被用来开发一个起始模型。然后,这个模型被用来建议新的设计和实验,这些设计和实验随后被用来更新模型,提高精确度。目标是利用计算和实验工具对庞大的设计空间进行智能采样,以有效地确定所需产品。设计过程考虑到各种参数,如聚合物和药物结构,以及实验条件。研究重点是发现能够选择性地结合特定肽或小分子的合成聚合物。这些聚合物有可能被用作异种生物的清除剂、靶向传递系统或药物溶解度的增强剂。由于数据有限和稀少,传统的定量结构-活性关系(QSAR)模型无法应用,这种情况AL明显更为适用。

为了验证所提出的方法,作者选择了ASGPR作为分子识别筛选的靶点。ASGPR参与各种生物过程,在很多的疾病中已成为药物输送的靶点。基于大分子的识别系统在特异性、稳定性和克服与小分子药物相关的挑战方面具有优势。该研究旨在设计一种基于聚合物的靶向分子,用于肝脏疾病的定向治疗和预防ASGPR靶向与病原体的相互作用。

03 方法

该研究采用随机森林回归(RFR)、随机森林分类(RFClf)和高斯过程回归(GPR)方法建立定量结构-属性关系(QSPR)模型。最初的数据集是随机选择的,或者通过选择不同的对象。测试了不同的主动学习策略,包括利用、探索、混合选择、随机选择和一个假设的完美策略。这些策略的性能是根据模型的准确性和候选人的改进来评估的。实验涉及使用Biacore X100机器和兔肝的ASGPR进行ASPGR结合测量。KD值使用1:1关联模型进行评估。

04 结果

本研究介绍了一种将经典的机器学习方法与主动学习(AL)相结合的方法,利用最小的实验测量发现具有所需特性的化合物。AL策略(Y-MAX、Y-VAR、混合Y-MAX-Y-VAR)的性能与随机选择和假设的完美策略在回归和分类情况下进行了比较。混合Y-MAX-Y-VAR策略显示出最好的性能,平衡了探索和利用。研究发现,在探索小的化学空间时,分类建模在AL中更有效率。

与以前的研究相比,AL方法需要的数据量较小,取得了类似的性能。AL算法被成功地应用于寻找选择性地与蛋白质目标结合的聚合物。它强调了AL对于高效和成本效益的设计活动的潜力。该研究的结论是,AL指导下的用于药物输送的聚合物材料的开发提供了多种好处,在保持准确性的同时减少了数据要求。该方法可以使用可获得的计算工具轻松实现,并有可能在药物输送系统开发中得到更广泛的应用。参考资料:https://blog.csdn.net/it_is_me_a/article/details/103477074

Rakhimbekova A, Lopukhov A, Klyachko N, et al. Efficient design of peptide-binding polymers using active learning approaches[J]. Journal of Controlled Release, 2023, 353: 903-914.

版权信息

本文系AIDD Pro接受的外部投稿,文中所述观点仅代表作者本人观点,不代表AIDD Pro平台,如您发现发布内容有任何版权侵扰或者其他信息错误解读,请及时联系AIDD Pro (请添加微信号sixiali_fox59)进行删改处理。

原创内容未经授权,禁止转载至其他平台。有问题可发邮件至sixiali@stonewise.cn


利用主动学习方法高效设计肽结合聚合物的评论 (共 条)

分享到微博请遵守国家法律