新型网络计算机模型助力癌症共现突变发现

一种计算机算法能够有效地发现共同驱动癌症发生的基因突变,以及其他重要的基因线索,研究人员或许有一天会利用这些线索为各种癌症开发新的治疗方法。

在《生物信息学前沿》杂志的报告中,由华盛顿州立大学领导的一个团队使用了一种新颖的网络计算机模型,在几种癌症中发现了同时发生的突变以及 DNA 序列元素之间的其他相似之处。该模型便于在海量的癌症基因数据中更容易地搜索模式。

“这不是对一种特定癌症的研究,不是对其进行深入研究并尝试理解,而是对许多癌症一起进行研究,寻找模式和有朝一日可用于药物发现的东西,”通讯作者、华盛顿州立大学电气工程与计算机科学学院副教授阿塞法·格布雷梅丁说。

癌症往往被当作一种疾病来谈论,但它实际上是一系列疾病,不同的驱动突变决定着疾病的进展和预后,共同作者、佛蒙特大学分子遗传学研究员史蒂文·罗伯茨说。

更好地了解不同的突变和驱动基因在各类癌症中的常见程度,可能有助于确定治疗可能的靶点的优先次序。但癌症研究人员在寻找线索的过程中受到了阻碍,因为所需的计算空间太大了。

“我们真的无法查看所有的序列,因为所需的计算空间太大了,”罗伯茨说。“如果你试图将所有的基因组数据放在一起并对其全部进行分析,数学问题会呈指数级地增长,会让系统不堪重负。”

由华盛顿州立大学团队开发的网络模型,被称为 DiWANN,比现有的网络模型更为稀疏、更为高效,同时不会丢失关键的结构组件。

“这种模型以最小的方式来呈现事物且不丢失信息,”格布雷梅丁说。“我们的模型试图以更有效的方式理解序列之间的关系,所谓有效,指的是它们能够快速被计算。通过这种网络的最小表示,您可以获得更多信息并使计算具有可扩展性。”

自从五年前开发出他们的 DiWANN 模型以来,研究人员已使用它来研究蜱传疾病的地理分布以及大流行期间 COVID-19 的传播。

在这项工作中,研究人员添加了一个数据缩减步骤,以进一步减少所需的计算量,并添加了第二个计算机模型,以更深入地了解共现基因。华盛顿州立大学计算机科学博士生 Shruti Patil 领导了这项工作,并且是该研究的第一作者。

研究人员在他们的工作中发现了证据,例如,胰腺癌中的两种突变几乎总是同时出现——这一点在此之前只是被猜测。其中一种突变,肿瘤蛋白 53,抑制肿瘤生长,而另一种被称为 KRAS 的突变,则是增殖的驱动因素。

研究人员确定了彼此密切相关的癌症类型,这些类型或许可能对常见的药物治疗具有敏感性。有些癌症是同质的,这意味着它们都具有导致癌症的相似突变,而其他类型的癌症则有各种各样不同的突变。

“某些特定的癌症类型非常、非常同质,它们的驱动突变几乎总是相同的,但随后你会发现其他一些癌症类型则完全不一样,”罗伯茨说。“根据我们的预测,那些是可能最难治疗的。”

因为它提供的信息有限,WSU 网络模型使研究人员能够增加他们可以研究的肿瘤数量。

“这提高了我们实际检测新的相互作用和这些肿瘤行为的新方面的能力,”罗伯茨说。“如果我们实际上能够筛选大量数据集,这是一种更为快捷的办法。”

研究人员现在致力于为公共卫生专家开发一个基于网络的工具,以便卫生领域的研究人员能够更轻松地使用该模型来研究癌症和其他疾病中的复杂问题。