关键词:
抗癌药物筛选
人工智能
药物反应预测
图表示学习
深度学习
摘要:
癌症是一种对人类生命健康构成严重威胁的复杂疾病,其治疗难度主要源于肿瘤微环境中癌细胞的遗传多样性。针对不同患者选择合适的药物是癌症治疗研究中的一项重要内容。传统的抗癌药物发现通常依赖于细胞水平的高通量筛选实验,存在成本高、流程复杂、周期长等局限性,难以满足现代精准医疗的迫切需求。因此,开发先进的计算方法,通过准确快速地预测药物对于肿瘤的反应,“因人而异”地筛选出有效药物,有望为抗癌药物发现和精准医疗带来革命性的突破。
近年来,随着药物与肿瘤细胞系反应数据的积累,以深度学习为代表的人工智能方法因其强大的数据分析能力在抗癌药物反应预测中得到了广泛应用。尽管这些方法取得了重大进展,但仍面临诸多问题与挑战:1)反应预测涉及药物结构、细胞系组学、反应关联等多种信息,如何构建能够充分融合多源信息的方法,以提升单一药物筛选的预测精度;2)与单药治疗相比,多药协同具有降低癌症耐药性的优势,但药物组合存在复杂的多路关系,如何构建能够有效融合多路关系信息的方法,以提升组合药物筛选的预测精度;3)除预测精度外,方法背后的逻辑对于揭示反应为何发生至关重要,如何设计具备生物学解释性的方法,以帮助医学研究者理解预测机理;4)由于细胞系与患者组织之间存在系统差异,使得面向细胞系的方法难以推广到临床患者,如何利用细胞系数据中的先验知识构建可迁移的方法,以提升对临床药物筛选的适用性。为解决上述问题,本文基于图表示学习技术,充分挖掘抗癌药物反应系统中蕴含的生物关联知识,开发了如下的计算方法:
针对问题1,提出一种基于图对比学习的药物反应预测方法(Graph CDR),用于更精准地进行单一抗癌药物筛选。首先,将药物和细胞系视为节点、敏感性反应视为边,构建异质反应图来融合生化知识和反应关联等多源信息;然后,采用图神经网络进行多源信息的互补学习,并利用耐药性反应构造增广数据,通过敏感性和耐药性之间的差异设计对比学习任务,从而捕捉更具辨识性的节点表示;最后,基于所学的节点表示实现药物与细胞系之间的反应预测。实验结果表明,Graph CDR相较于以往方法具有更高的反应预测精度,并且在一项淋巴白血病细胞系RCH-ACV的案例分析中,准确筛选出了具有治疗效果的潜在抗癌药物Dasatinib。
针对问题2,提出一种基于超图神经网络的药物协同预测方法(Hyper Synergy),用于更精准地进行组合抗癌药物筛选。首先,将药物组合与细胞系之间的协同作用抽象为超边,通过构建协同超图来融合生化知识和多路关系等多源信息;然后,使用超图神经网络进行多源信息的互补学习,并利用分子相似度设计基于自监督的关联图约束任务,进一步加强对协同超图的表示学习;最后,基于所学的超图表示实现药物组合在细胞系上的协同作用预测。实验结果表明,Hyper Synergy的预测精度比以往计算方法更高,并且在案例分析中成功筛选出了多个潜在协同药物组合,例如Dasatinib联合Gefitinib可抑制卵巢癌细胞系OVCAR-3、SKOV-3的增殖。
针对问题3,提出一种基于子成分交互的可解释反应预测方法(Sub CDR),用于提供细粒度层面的药物筛选可解释性。首先,构建一系列生物知识驱动的神经网络,以此将每种药物的分子式分解为具有不同功能的子结构,将每种细胞系的基因表达谱分解为体现不同癌症功能的基因子集,进而从细粒度层面刻画药物与细胞系;然后,以图的形式建模药物与细胞系各自子成分之间的反应交互,并通过图神经网络从子成分交互图中学习表示,建立与反应输出之间的梯度关系。实验结果表明,与以往计算方法相比,Sub CDR不仅实现了精准的药物反应预测,更能通过追踪交互图来识别关键子成分(例如羰基、二氟基团分别在药物Nelarabine、Gemcitabine的敏感性反应中发挥重要作用),从而为抗癌药物筛选提供指导与帮助。
针对问题4,提出一种基于多标签域适应的可迁移反应预测方法(Transfer CDR),用于更高效地进行临床抗癌药物筛选。首先,将细胞系、患者分别视作源域、目标域,通过一种启发式的域适应训练去消除两个域在基因表达上的系统偏差;然后,将每种药物视为独立的标签,以多标签关联图的形式刻画不同药物之间的相关依赖性,用于在源域上训练能够同时输出多种药物反应的预测器;最后,将面向源域的多标签预测器迁移到目标域,实现多种药物反应在临床患者上的同时预测。实验结果表明,Transfer CDR与以往迁移方法相比,在临床用药数据上的预测准确性更好、计算效率更高,并且在一项睾丸癌患者的临床案例分析中,快速筛选出了具有治疗效果的潜在抗癌药物Vinorelbine和Vinblastine。
综上所述,本文围绕抗癌药物筛选研究中的关键问题,从多源信息融合、细粒度可解释性、细胞系-临床患者迁移等方面着手,构建了四种新颖的图表示