用机器学习辨识癌细胞与病变!Google:台湾有很强的先天优势

记者洪圣壹/台北报导

深度学习其实是机器学习当中的一环,是目前整个人工智慧发展领域当中最被关注的,在应用上,则是以影像辨识发展最快。Google 研究团队产品经理,同时本身也是医学博士彭浩怡(Lily Peng)稍早向台湾媒体揭露了几项 Google 在深度学习的医疗应用成果整体看来,透过人工智慧协助医生诊断出癌症,将成为必要的发展方向

Google 研究团队产品经理、医学博士彭浩怡(Lily Peng)表示,这几年深度学习因为真实资料量越来越多,再加上机器运算能力增强,使得神经网路的表现比起其他的网路更好,让人们可以做出更多事情,像是使用深度神经网路分类小狗、小猫,虽然不如科学家,但是实际成果已经接近人类的表现。

▲Google 研究团队产品经理、医学博士彭浩怡(Lily Peng)。(图/记者洪圣壹摄)

深度学习应用在图像辨识领域其实相当广泛,而彭浩怡的团队主要透过「卷积神经网路」来进行,只要给出足够量的图片,就可以让机器快速辨识出物体,像是要辨识熊猫,只要给机器一些照片,告诉机器这些都是熊猫的照片,再给机器一些照片,告诉机器都不是熊猫,系统就可以透过深度学习的方式快速执行相对应的指令,好比说自动计算出有熊猫的照片有几张,或者是选择初辨识结果里面有熊猫的照片。

这项技术跟传统电脑运算的差异在于电脑运算是属于「特征工程」,工程师必需要先输入指令告诉电脑熊猫有哪些特征,接下来电脑才会辨识,不仅费工耗时,而且还会发生错误。以一般经验法则来看,只要给电脑大约 5,000 张照片就可以辨识出熊猫,但是透过特征工程则是要不断修正指令跟架构,才能有效辨识熊猫,而且如果要执行其他动作,则必须要输入其他指令。

在 Google I/O 2017 开展前,彭浩怡发布一项机器学习在医疗领域的研究成果,这项成果可以用深度学习的方式,快速判读网膜上细微的血管瘤位置,提早发现糖尿病性视网膜病变,让患者进行即时或预防性治疗。

而通过稍早的解释,会这么做的起因在于她看到印度当地并没有足够的眼科医生判读糖尿病的视网膜病变,她认为这不仅是医疗资源短缺的问题,而是透过现有的科技就可以解决的问题。因为糖尿病的视网膜病变,其实是可预防的失明病变,一般来说,定期筛检是预防失明的做法,透过视网膜眼底图像能协助诊断糖尿病是网膜病变,而透过机器学习的机制,其实已经能够成功筛选出有问题的视网膜照片。

她说:「我自己本身是医生,希望把机器学习跟深度学习应用在视网膜专案,初期只花了 20% 的工作时间跟印度当地的医疗机构沟通跟研究,后来这个案子成了一个大型的专案。」

相关数据显示,印度当地至少还需要 12.7 万名专业眼科医生,有高达 45% 的糖尿病患者,在还没诊断之前就失明了,一方便的原因在于要判读视网膜病变必须要有专业的眼科医生,搭配专业的医疗用拍摄仪器才能进行,而即使在在印度当地,这种疾病其实是完全可以预防的,因此若因为像是这种疾病导致失明的发生,让人很不能接受。

合作过程中,彭浩怡与团队跟印度当地合作伙伴只聘请 54 名眼科医生,就成功判读超过 13 万张视网膜图像,判读机制就是采用机器学习搭配医生的专业判断所进行。

在这当中,彭浩怡的深度学习研究团队采用了 26 层卷积神经网路来辨别照片当中是否有视网膜病变,然后与医生的专业判断建立起辨识模型,之后建立一套辨识工具,把图像放到系统里面,近而作出诊断结果。从下图的调查数据可以看出,为了检测视网膜眼底照片中的糖尿病视网膜病变而开发出的深度学习演算法,表现已经接近医生的判断结果,医学界也非常乐见这样的成果。

下一步将与印度当地医疗相关机构像是 Aravind Eye Care System、SANKARA NETHRALAYA 以及 FDA ,并与 NIKON 等摄影器材合作伙伴共同合作,一方便提升影像品质,一方便透过更多的资料与认证结果,提升辨识成果。

除了视网膜疾病,透过机器学习可以判读癌症切片的照片,数据指出,每 12 人的乳癌切片中,就有 1 人可能被误诊,其他癌症也有类似的情形,像是前列腺癌 7 人就有 1 人被误诊。毕竟如果要判断切片,必须要看 1,000 张照片,对于医生来说是相当不容易的,所以要研究新的演算法来协助医生。

透过 Google 与医疗团队 IHC 医疗实证的结果显示,透过深度学习搭配专业医生判断的方式,有 92% 的机可诊测到癌细胞,当中有 8 个是假阳性结果,若全部都是一般医生判读的话,只会有 73% 的机会去诊测到癌细胞,而且还没有假阳性的结果,因此未来若透过病理学家跟机器学习合作,将可望提升判读的准确度。类似的案例,在史丹佛大学发表的一篇论文当中也说明,透过 Tensorflow 深度学习可有效判读皮肤癌

针对深度学习的下一步,彭浩怡表示,接下来深度学习的发展重点工作有三:第一件便是临床验证;第二件事情应该是建立医疗团队的信任感,让医师愿意跟机器合作,她个人坦承,这是一件不容易的事情;第三件事情是工作流程跟使用者介面设计。整个机器辨识的流程必须符合医生的工作需求。她希望透过新的科技工具,是真正能帮助医生,而不是造成医生的困扰根阻碍。

其实透过机器演算法的形式来辅助医疗自 90 年代开始便有相关研究报告产出,只是到了最近这几年,随着机器本身的演进,才有跨时代的发展,类神经网路在图像识别的应用,除了被应用在癌细胞之外,针对健康照护、医疗保健领域方面,也有做出相对应的研究,不过谈到机器学习辅助医疗实际上线的时间点,彭浩怡表示,这些目前还在前期的研究当中,相关医疗仪器要真正开发出来,并且通过 FDA 审查,实际上至少需要五年,因此整体来说不会非常快。

Google 台湾董事总经理简立峰表示,图像辨识确实是在深度学习发展最好的,台湾糖尿病患者超过 100 万人,仅次于日本,这是东亚基因缺陷,使得糖尿病患者比例比起欧美地区来说都相当高,因此这方面的研究需求是必须的,如果台湾要做类似的研究,其实是很有竞争力的。

简立峰进一步指出,「医疗影像」跟「健康照护」这两个领域都是台湾很值得投入的区块,因为台湾不仅有很好的医疗研究资源,也有很强的资通讯技术,过去这两个领域或许交集得很少,但是走在人工智慧蓬勃发展这个时代,医生跟工程师这两个领域之间的交流,是台湾需要投入更多的。

不过简立峰也认为,现阶段要谈让医生跟深度学习科学家合作,在台湾非常困难的,因为台湾从学生时代的科系就在分流,很多即使学生想要学,老师却没有教。不过由于法规的关系,台湾的医学体系是独立的,很多研究都可以在内部先行,这个优点可能是别的国家所没有的。

▲Google 台湾董事总经理简立峰。(图/记者洪圣壹摄)

整体来说,台湾有资通讯优势、医疗体系优势,若当中获得整合,相信对于人工智慧医疗的发展,将有跳跃式的进步。若从长照的领域来思考,简立峰认为,如果科技部要推动 AI人工智慧 ,应该是从长照发展、智慧型辅具,或是替代人类的机器人等等方向推动,或许自动驾驶车不行,总该可以开发自动轮椅;此外,台湾还有别的国家没有的问题,就是五楼公寓没有电梯的问题,这些住在高楼层年长者不方便下楼运动,造成提早老化,如果现在发展,10-20 年就可以收割。