论文剖析
生物信息学
从分子结构图像预测药物相互作用
///////////////
0.摘要
预测和发现药物-药物相互作用(ddi)是一个重要的问题,已经从医学和机器学习的角度得到了广泛的研究。几乎所有的机器学习方法都专注于文本数据或药物结构数据的文本表示。我们提出了第一个工作,使用药物结构图像作为输入,并利用一个孪生卷积网络结构来预测DDI。
1.介绍
药物不良事件(ADEs)是“与药物相关的医疗干预造成的伤害”,与药物错误(不适当的处方、配药、使用等)不同,它们是由正常剂量的药物引起的。根据美国国家卫生统计中心的数据,48.9%的美国人在过去30天内至少服用了一种处方药,23.1%的人至少服用了三种,11.9%的人至少服用了五种。在老年人(65岁及以上)中,这三个数字分别急剧上升至90.6%、66.8%和40.7%。这意味着在包括住院、门诊和长期护理在内的各种卫生保健环境中发生ADE的可能性非常高。例如,在住院环境中,ADE医院相关并发症的三分之一,每年影响多达万住院时间,并将住院时间延长2-5天。
这些问题的经济影响与各种医疗保健设置一样广泛,而且可能是惊人的。据估计,仅在美国,ADEs就造成了36亿美元的超额医疗费用。在美国,由于大量老年人是联邦医疗保险的受益者,这种经济影响将由已经不堪重负的联邦医疗保险体系承担,并最终转嫁给纳税人和整个社会。除了老年人之外,还有其他一些患者群体也容易受到ADE的影响,包括儿童、社会经济收入较低的人、获得保健服务的机会有限的人以及某些少数群体。
最近的研究发现,有些令人惊讶的是,许多不良事件可以归因于非常常见的药物,其中许多是可以预防的或可改善的。这一问题推动了我们的长期目标,即以疾病/药物不可知的方式,并在各种医疗保健环境中,开发可获取和强有力的方法来识别DDI。DDI往往是由于对各种药物禁忌症认识不足造成的,是住院、再住院、急诊室就诊甚至死亡的主要原因。
识别ddi是药物设计和测试过程中的一项重要任务,监管机构如美国食品和药物管理局(fda)要求在批准之前进行大规模的受控临床试验。除了费用和耗时外,不可能发现此类临床试验中所有可能的相互作用。这就需要DDI预测的计算方法。DDI的大量工作集中在文本挖掘,从大文本语料库中提取ddi。
我们的目标是通过开发药物的各种特征和识别药物相互作用行为的模式来发现大型药物数据库中的ddi。最近的方法考虑了药物的表型、治疗、结构、基因组和反应特性或它们的组合来表征药物相互作用。通过深度学习,我们通过分子图像的视角,从一个全新的角度来看待DDI预测,如图1所示的几个例子。我们的工作在以下几个方面是新颖的:
我们将DDI发现表述为链路预测问题;
我们的目标是直接在药物的分子结构图像上进行DDI发现,而不是在有损的、基于字符串的表示上,如SMILES字符串和分子指纹;
我们利用深度学习,特别是孪生网络,以一种对比的方式构建一个DDI发现引擎,可以无缝集成到药物数据库中。
2.药物-药物相互作用的孪生卷积网络
在(Chopraetal.5)中介绍了一种使用孪生体系结构学习相似性度量的判别方法,该方法将输入(输入对)映射到目标空间,使得对于相似的示例对,映射之间的距离在目标空间中最小化,而对于不同的示例,映射之间的距离最大。我们采用孪生结构来预测两种药物是否相互作用。由于孪生体系结构的结果在一对给定的输入之间的相似性的措施,它可以设置一个阈值,以获得一个分类。我们使用对比损失,基于一个距离度量(本例中为欧氏距离),学习一个参数化函数F,以获得从输入空间到目标空间的映射,该映射的最小化可以将语义相似的示例推到一起。损失函数的一个重要性质是通过两个例子计算得到的。损失函数公式如下:设X1和X2是一对药物图像,Y是分配给每对图像的标签。如果药物图像对不相互作用,则标签Y=0;如果药物图像对相互作用,则标签Y=1。另外,设D为图像对经基础孪生网络处理后的向量之间的欧氏距离,P为函数F的参数。对比损失函数可以如下所示
图2显示了我们的完整体系结构。它由两个相同的子网络组成,即具有相同参数和权重的相同配置的网络。每个子网络以一个××1的灰度图像作为输入(我们最初有彩色图像,我们将其转换为灰度后再送到子网络),由4个卷积层组成,滤波器数分别为、和。每个卷积层的核尺寸为(9×9),激活函数为relu。relu是一个非线性激活函数,表示为f(x)=max(0,x)。每个卷积层后面是一个大小为(3×3)的最大池化层和一个batchnormal层。在卷积层之后,子网络有3个全连接层,分别有个、个和20个神经元。因此,图像对经过孪生子网络处理后,得到两个维数为20×1的向量。然后将对比损失应用于所获得的向量对以获得输入对之间的距离,该距离随后可被阈值化以获得预测。
最初我们将阈值保持在0.5,然后使用精确召回曲线来确定最佳阈值=0.65。注意卷积子网络中的卷积提供了平移方差特性,但旋转方差在我们的问题域中也很重要。这是因为药物的同分异构体(手性形式之一)在与某种药物相互作用时预期会发生不同的反应。例如,芬氟拉明和右芬氟拉明是彼此的异构体,芬氟拉明与乙酰丁洛尔相互作用,而右芬氟拉明不相互作用(图4)。另一个例子是甲氧吗啡的L-异构体左美沙芬是阿片类镇痛药,而D-异构体右美沙芬是解离性止咳药。
3.实验
略
4.结论和今后的工作
在这项工作中,我们专注于以成对的方式使用药物的分子图像,并将它们输入到孪生网咯结构中,以预测两种药物是否相互作用。我们对从PubChem数据库获得的药物图像的评估证实了我们提出的方法的优越性,这与目前通常以文本格式使用药物分子结构的方法不同,例如SMILES。
结合我们之前的工作,使用了从药物和酶之间已知化学反应的有向图中获得的不同相似性度量,转运体和抑制剂以及以SMILES和SMARTS字符串形式存在的药物结构,目前使用药物结构图像的工作是自然的下一步。此外,完善孪生网络的架构和向网络提供更多的药物图像也是未来工作的一个有趣领域。
原论文名称:PredictingDrug-DrugInteractionsfromMolecularStructureImages
预览时标签不可点收录于话题#个上一篇下一篇