影像辨识同时侦测车列及车速 中研院研发物件侦测演算法「全世界最快准」

中央研究院研究团队,与俄罗斯开发者博科夫斯基共同研发出目前世界上最快最准的物件侦测演算法。(图/中央研究院提供)

记者崔至云台北报导

台湾参与人工智慧跨国研究取得重大突破!中央研究院研究团队,与俄罗斯开发者博科夫斯基共同研发出目前世界上最快最准的物件侦测演算法(YOLOv4),平均正确率达43.5%,一举超越其他种影像辨识技术。同时也运用该技术开发「智慧城市交通车流解决方案」,目前已布设于桃园新竹,在路口就能进行交通影像辨识及车流分析

中央研究院资讯科学研究所特聘研究员廖弘源说明,YOLOv4是一种利用人工智慧执行即时物件侦测的技术,能侦测物件、追踪及判断,可应用于交通车流计算、自驾车研发、工厂瑕疵检测医疗影像分析、五官定位等。自今年4月以开放原始码免费释出后,全世界已有数万人测试应用。

廖弘源表示,过去训练电脑识别一张照片里的物件,须执行几千次的识别指令。YOLO是「You only look once」的简称,顾名思义,只需训练一个网路模型,电脑只要看一眼,就能判断照片或影像里的物件类别与位置,大大提升辨识速度。自104年推出第一代版本后,深受开发者喜爱,为电脑视觉技术立下重要的里程碑。改良后的YOLOv4性能更强大,经微软开源影像资料库测试,辨识物件的速度及精确度皆大幅提升,堪称是目前世界上辨识速度最快、最精准的物件侦测演算法。

▲YOLOv4演算法已实际应用于「智慧城市交通车流解决方案计划」,可即时侦测车辆、停等车列车速。(图/中央研究院提供)

博士后研究员王建尧提到,物件侦测技术追求速度和精准,二者缺一不可,却难以兼备。他从去年开始改良YOLOv3,一改过去多采「降速控球」,即降低或牺牲速度来换取准确度提升;转而从YOLO所运行的人工智慧模型着手,改善网路识别物件的回传机制,优化传输路径,以减少演算法的计算量,因此能增加运算内容的多样性及运算速度。

深度学习演算法的计算复杂度高,YOLOv4也突破过去的技术限制,拥有轻盈的系统架构高效率的演算法等优势,使用一般的图形处理器就能运算,「像是用算盘打出计算机的速度!」王建尧表示,团队的开发初衷,即希望打造一个亲民、好用的侦测系统,降低硬体成本,让每个人都能以此技术创造更多有趣的应用。

▲中央研究院研究团队研发出目前世界上最快最准的物件侦测演算法。(图/中央研究院提供)

廖弘源指出,YOLOv4使用的关键技术源自该团队承接科技部人工智慧专案计划,与义隆电子合作开发的「智慧城市交通车流解决方案」。为建置智慧车流分析系统,需要结合影像感测器和电脑视觉,在每个路口就能即时侦测车辆、停等车列及车速。团队借由着手改良YOLO演算法,发展轻量、精准、快速的物件侦测核心技术,以实际应用于交通影像辨识。

YOLOv4自今年4月在原始码代管平台公开后,任何人都可免费使用,在电脑视觉领域里引起全球广泛讨论,各式自制的教学影片、各种应用层出不穷。廖弘源表示,在台湾,以YOLOv4技术开发的智慧车流分析系统,目前已布设于桃园、新竹等地,全世界已有许多研发单位以此为基础,发展相关的系统或产品。

►我们的美丽就用白纸黑字写下来

►过期的票券只能丢掉吗?快来兑换东森币复活你的钱