在生物医学网络中学习链接预测的应用研究
摘要:在生物医学信息网络中发现未知的相互作用(链接)具有广泛而重要的应用价值,如药物-靶相互作用预测、药物-疾病关系检测和致病基因预测等。近年来发展起来的网络表明,学习技术已被证明在复杂的网络分析任务(如节点分类、链接预测和聚类)中表现出令人鼓舞的效果。然而,到目前为止,大多数学习算法的预测性能仅在非生物医学网络(如社交网络)中进行评估,而在复杂的生物医学网络中还没有系统的实验和分析。同时,现有(异构)网络表示,在处理复杂的异构网络数据时,学习技术还面临着如何平衡异质信息、难以定义多边关系等问题。基于此,本文重点研究了如何利用高效的网络表示学习方法在生物医学网络上进行链接预测,主要包括以下两项创新工作:(1)本文设计了两种基于网络表示学习的链接预测方法,即基于相似性的非端到端学习方法和基于自编码器的端到端学习方法,系统评价网络表示学习算法应用于生物医学网络链接预测任务的有效性和潜力。同时,本研究通过实验得出结论,与现有技术相比,新兴的网络嵌入式算法往往具有竞争力甚至更好的预测性能。此外,本文还深入讨论了基于大量实验的观察结果,为相关从业人员提供了如何选择表示学习算法的建议。(2)针对现有(异构)网络表示学习算法的不足,本文以药物-靶异构信息网络为研究目标,提出了基于异构性学习算法的创新药物-靶相互作用。作为第一个将异构网络表示学习技术引入DTI预测领域的算法模型,HineDTI克服了药物靶网络中高维度、稀疏性和异构性的问题,并学习了一个低维嵌入向量表示,信息量紧凑但充足,以准确解释异构网络中各节点的拓扑属性(如多层相互作用关系、上下文语义信息等)。在几个真实未知的DTIS预测场景中的实验结果表明,HineDTI的预测性能在准确性和鲁棒性方面明显优于最新的DTI预测计算方法和现有的网络表示学习算法。例如,与目前的State-of-the-artdti预测计算方法(Neodti)相比,Hinedti在AUPR评价指标上实现了11.1%的性能提高。此外,本文还发现,通过Hinedti模型进一步证明了相关文献预测能力。总之,通过大量的实验论证,HineDTI可以提供稳定准确的工具来预测潜在的DTIS,从而促进药物开发和药物重定位。
关键词:网络表示学习;生物医学网格;链接预测;药物-靶标相互作用;
摘要
ABSTRACT
符号对照表
缩略语对照表
第一章
1.1研究背景和意义。
1.2研究现状。
1.3论文工作内容。
1.4论文组织结构。
第二章相关理论基础和技术概述。
2.1信息网络。
2.1.1信息网络定义。
2.1.2生物医学信息网络。
2.2网络表示学习算法综述。
2.2.1网络表示学习定义。
2.2.2同构网络表示学习算法。
2.2.3异构网络表示学习算法。
2.3链接预测概述。
2.3.1问题描述。
2.3.2数据集划分。
2.3.3评价指标。
2.3.4经典算法。
2.4本章总结。
生物医学网络链接预测第三章基于网络表示学习。
3.1概述。
3.2基于网络表示学习的链接预测方法。
3.2.2非端到端链接预测。
3.2.3端到端链接预测。
3.3实验。
3.3.1实验数据。
3.3.2实验中使用的算法。
3.3.3实验相关设置。
3.3.4实验结果及分析。
3.4本章总结。
第四章HineDTI:一种基于异构网络的药物-靶相互作用预测算法。
4.1概述。
4.2hineDTI算法。
4.2.1问题描述。
4.2.2基本框架。
4.3实验。
4.3.1实验数据。
4.3.2实验基准算法。
4.3.3实验相关设置。
4.3.4实验结果及分析。
4.4本章总结。
总结和展望第五章。
5.1总结。
5.2展望。
参考文献
致谢