AWS助科学家发现13万种RNA病毒 防堵全球传染病爆发

在AWS的帮助下,UBC CIC团队和全球计算生物学家发起了The Open Virome(开放病毒专案),并建立Serratus,一个开放性病毒侦测云端运算平台。目前该研究成果已经发表在科学杂志《Science》上,同时也创建了公开病毒资料库,向全球科学界分享研究成果,帮助加速对RNA病毒的研究。

由RNA病毒引起的疾病包含普通感冒、流行性感冒、严重急性呼吸道症候群(SARS)、新冠肺炎、C型肝炎、伊波拉病毒、狂犬病、脊髓灰质炎(小儿麻痹症)和麻疹等。由于RNA病毒繁殖和进化速度快,因此更容易感染新的宿主物种。如果基因组学研究人员能够提前辨识新冠病毒,将彻底改变当前全球疫情的状况。

基于AWS服务所取得的研究成果,彻底改变了生物资讯学的研究方式。在此之前,科学家们经过几十年的资料分析,只发现了1.5万种病毒。而在使用AWS的基础架构和服务后,The Open Virome专案团队在发现新病毒方面,已为科学界节省了数百万美元和长达数年的时间。

病毒的辨识和研究需要分析海量的基因定序数据,其中就包括数十万种未知病毒的DNA和RNA。基因组学的资料量每天都以倍速增长,造成病毒定序资料库的总量非常庞大,依靠传统运算方式根本无法对其进行全面分析或处理。

The Open Virome专案的研究人员仅用8周的时间,顺利地运用AWS的云端科技建构功能强大的超级运算平台。借助其优异且弹性的运算能力,快速处理数百万GB的资料,并获得显著成本效益。

该团队运用Amazon Simple Storage Service(Amazon S3)中镜像出病毒基因定序资料库SRA,而后使用AWS弹性运算云端执行个体Amazon Elastic Compute Cloud(Amazon EC2)来分析资料集。专案团队的目标是在处理每个定序资料集支付不到1美分,而在专案完成时全面超越此目标,实际上在处理每个定序资料集支付不到半美分。

在短短11天内,该团队处理高达570万个定序资料集,仅花费2.4万美元,并发现了13万个新型RNA病毒。奠基于AWS云端科技打造的Serratus平台,研究人员相信他们既能辨识潜在的有害新病毒,又能提醒科学家注意新冠肺炎病毒SARS-CoV-2 virus的潜在突变成因,帮助改善诊断测试和疫苗开发,为医疗政策决策者提供更有效的指引。

AWS表示,医疗和生命科学产业是AWS的优势领域之一,透过在基因组学研究中应用云端运算,让客户能将更多时间和资源应用于科学研究,以更快获得洞察,并加速进行突破性研究和产品上市。、