人工智慧影像辨识竞赛 台科大陈奕嘉在场景文字检测夺冠

教育部办理人工智慧竞赛,台科大学生陈奕嘉在场景文字检测项目夺冠。(台科大提供/林志成台北传真)

人工智慧的影像辨识的应用相当广,台科大资工所学生陈奕嘉在教育部全国大专院校人工智慧竞赛中(2021 AI CUP)获得两项佳绩,于繁体中文场景文字辨识竞赛夺冠,也在水稻无人机全彩影像植株位置自动标注与应用竞赛获得亚军,共得16万奖金。

教育部全国大专校院人工智慧竞赛 着重「标注暨竞赛」,透过目标明确竞赛题目,训练学生解决明确目标的问题。今年特别以招牌繁体中文字辨识、水稻无人机全彩影像植株位置自动标注以及医病决策预判与问答为主题,让学生有实际解决AI问题的经验与能力。

现实生活中各式各样的招牌、路牌、看板、标语与广告等,其中包含的文字内容提供了许多场景重要资讯,若能自动地将场景画面中的文字辨识出来,对场景理解、智慧城市、交通发展、机器人技术、自动驾驶、协助视障者或外来旅者等应用都能有所帮助。

获奖的陈奕嘉表示,繁体中文场景文字辨识竞赛,主办单位提供几千张训练资料,涵盖台湾街头各种景象,最困难的是场景和环境比较复杂,调整需要花较多时间,在这个比赛中,他试了许多不同方式,最后选择使用了Box Discretization Network (BDN) 技术,也花了不少时间微调来成功增加电脑判断的准确度,才成功将场景的文字辨识出来。

另一这竞赛主题则是水稻无人机全彩影像植株位置自动标注与应用竞赛,以无人机拍摄水稻田数个时期高解析度影像,来进行水稻植株位置辨识,像是以计算植株密度以进行水稻产量评估,也可推估作物生育期或产期,或未来可应用在无人机定点少量喷洒植物等,未来期望能以人工智慧建立水稻田植株辨识模组,以提升台湾未来农业发展。

陈奕嘉说,水稻田并不是很清楚,直接从图片找到点较为困难,因此用颜色越亮的方式来标注水稻标记的位置,来增加准确度。相较于场景文字辨识竞赛,有较多的先前的研究,比较容易从网路上找到资料,水稻辨识则是相对冷门很多的问题,得自己想方法从头开始训练。