癌症治疗大进展 新模型快速扫描基因组 揪关键驱动突变

癌症治疗大进展 新模型快速扫描基因组 揪关键驱动突变。(示意图/Shutterstock)

癌细胞 DNA 中可能存在数千个突变,如果能快速区分推动癌症进展的肿瘤驱动基因(driver gene)与搭便车的乘客基因(passenger gene),将能帮助研究人员更好确定药物靶点。

为了达成这项目标,在《Nature Biotechnology》最新研究中,麻省理工(MIT)团队运用概率性的深度学习方法建立了一个全新神经网路模型,可以快速扫描癌细胞的整个基因组,找出那些正在驱动肿瘤生长的主谋。

●寻找肿瘤驱动基因的有力工具

寻找肿瘤驱动基因一直存在挑战,过去在人类基因组定序研究帮助下,已经找到如 EGFR、BRAF 等与特定癌症相关的基因存在,然而基因组中毕竟只有约 2% 序列包含蛋白质编码,其他 98% 同样可能存在推动肿瘤的突变,缺乏工具摸索有如大海捞针。

麻省理工团队打造的神经网路模型或有助解决这项问题。透过表观遗传调控蓝图计划(Roadmap Epigenomics Project)和全基因组癌症分析(PCAWG)里 37 种不同类型癌症基因组数据对团队开发的 Dig 算法训练,模型得以确定每种癌症的背景突变率并协助查找异常。

研究作者、麻省理工研究生 Maxwell Sherman 解释,Dig 算法的真正好处在于只需针对给定的癌症类型进行一次训练,建立的模型就可以掌握该种癌症在基因组内各处的突变率,在那之后,研究者就可以照需求去与在患者身上的突变数进行比对找出异常。团队希望新工具能让研究者未来不仅可以查看基因组内 2% 的蛋白质区,而是 100% 的内容。

●值得关注的隐蔽剪接突变与非编码区

透过研究,团队也对致癌突变有了两项值得关注的新发现。其一,在正常细胞转译过程中,被称为内含子(introns)的非编码片段应被剪除,但当发生一种被称为「隐蔽剪接突变」(cryptic splice mutations)的突变时,剪接的细胞机制似乎会受到混淆,导致不该保留的内含子片段被错误地留置其中。

研究人员发现,许多隐蔽剪接突变似乎会破坏肿瘤抑制基因(tumor suppressor gene)的作用。当这些突变出现,肿瘤抑制基因会因此出现错误,从而失去对癌症的防御力。尽管据估计隐蔽剪接突变比例不高,约仅占肿瘤抑制基因中所有突变的 5%,但这仍提供相关研究人员在疗法开发上的另一种切入点。

另一个值得关注的发现则位于基因的非编码区。过去已知抑癌基因 TP53 与许多癌症相关,其 5′非转译区(5′ UTR)序列中往往存在许多缺失,而团队在另一个抑癌基因 ELF3 的 5′ 非转译区也发现了相同的现象,这项观察显示这些突变可能够透过某种方式影响了基因活性。

不仅如此,团队还发现一些已知的肿瘤驱动基因也可能导致不同类型的癌症。举例来说,与黑色素瘤有关的 BRAF 同样也推动小部分胰腺癌、肝癌和胃食管癌的癌症进展。

目前在对癌症患者进行检查时,约有 30% 患者找不到能指引治疗方案的潜在致癌突变来源,研究人员相信透过新模型,能至少为另外 5-10% 的患者提供了可能的驱动基因来源,协助更多癌症患者获得治疗机会,并推动未来更多临床试验的规划进行。