18101298214
公司首页
实验手册
小分子化合物
细胞培养和检测
定制服务
文献资料
联系我们
订购指南
公司首页
实验手册
小分子化合物
细胞培养和检测
定制服务
文献资料
联系我们
订购指南
首页
实验手册
开发用于药物-靶点结合亲和力预测的人工智能新算法
发布日期:2023/8/22 10:43:00
药物研发
是一个漫长而昂贵的过程,目前开发一种新药大约需要10-15年时间。这促使人们使用计算方法来降低成本、提高效率。药物分子以适当的化学特性和亲和力与靶点结合的过程是药物治愈疾病的关键步骤之一。因此,准确预测药物与靶点的结合亲和力(Drug-target affinity,DTA)对药物研发至关重要。在使用计算机进行预测的方法中,分子对接需要蛋白质的三维结构和较长的计算时间,而基于配体的方法需要同一靶点的大量已知配体信息。所以,
为了克服上述局限性,人们寄希望于使用深度学习方法进行DTA预测。
该研究利用深度学习和基于注意力机制的特征融合方法,在更接近现实环境的实验设置下,相比于其他传统机器学习算法与深度学习方法表现出了更好的预测性能。
虽然现有的一些深度学习方法在 DTA 问题上已经表现出卓越的预测能力,但这些方法大多是在随机分割的数据集上进行评估(测试集中的药物和蛋白质靶点已经出现在训练集中),这会由于信息泄露而导致结果过于乐观。从应用角度看,大多数蛋白质或药物不会出现在训练集中。当数据集按照更现实的场景分割时,许多模型的预测性能会急剧下降。因此,
需要提高DTA预测模型的泛化能力,使其在实际场景中发挥更大的作用。
图 1 ColdDTA方法的模型框架
为了提高模型的泛化能力,研究者提出了ColdDTA。模型的训练过程一共可以分为4个部分:1. 去除药物分子图,并与原始蛋白质形成新的数据对。2. 使用图神经网络(Graph Neural Network,GNN) 和卷积神经网络(Convolutional Neural Networks, CNN) 分别提取药物和蛋白质靶点的特征。3. 将上一步提取的特征输入药物-靶点融合模块进行交互,以获得更有效的特征表示。4. 将融合后的特征输入多层感知机(Multilayer Perceptron,MLP) 以预测结合亲和力。
在这项研究中,Davis和KIBA数据集被用于比较ColdDTA和其他方法。每个数据集都被分为了三种任务:药物冷启动,蛋白质冷启动和配对冷启动。药物冷启动指测试集中的药物不出现在训练集中,而所有蛋白质同时出现在两个集中,当需要识别可能与新发现化合物发生相互作用的潜在蛋白质时,这种实验设置非常有用。蛋白质冷启动指的是测试集中的蛋白质不出现在训练集中,这种分割的意义在于提高模型为复杂疾病的新蛋白质推荐潜在药物的能力。
配对冷启动指测试集中的药物和蛋白质都没有出现在训练集中,这可以研究新化合物是否可以作为新蛋白质靶点的潜在药物,但这种实验设置也是最具挑战性的。
图 2 ColdDTA 与 SOTA 和传统机器学习方法在公共数据集上的 CI 结果比较
实验结果表明,在一致性指数(Concordance Index,CI)的比较上,ColdDTA在所有任务上都超过了其他方法。研究者还研究了数据增强对于模型预测性能的影响,结果表明
移除药物子图的数据增强方法能有效提升模型预测药物冷启动和配对冷启动的能力。
图 3 是否使用数据增强对模型性能的影响
文章结论与讨论,启发与展望
在这项研究中,研究者利用数据增强和基于注意力的特征融合进行DTA预测。它在训练阶段去除固定比例的药物分子图,与原始靶点形成新的数据对,这种数据增强能有效提高模型的泛化能力。同时,该模型采用了一种新的基于注意力的特征融合方法,以更好地实现化合物与蛋白质信息的交互,从而提高模型的预测性能。实验结果表明,与其他方法相比,ColdDTA在基准数据集上的性能有了明显提高。消融实验也验证了所提出方法的有效性。研究者在文中还提出,在今后的后续研究中,将努力解决与计算机视觉领域中的许多数据增强方法类似的共性问题,进一步降低完全随机的数据增强方法在少数情况下生成的难解释样本量。
上一篇:
评述in silico方法调控自噬治疗人类疾病
下一篇:
关注ApoE在病毒感染中的重要作用
已经到最底了
技术支持:
库价化学
Copyright © 2024北京螽斯羽生物有限公司 备案号:
京ICP备2023018288号-1