自研算法赋能智慧工厂OPPO在国际人工智能会议CVPR 2021展示了AI创新实力

6月24日,一年一度的全球计算机视觉会议CVPR落下帷幕,OPPO在六大赛道共十二项赛项中取得一项第一,七项第二,四项第三的成绩,再次展示了AI创新实力

本次参加CVPR 2021竞赛团队来自OPPO研究院智能感知与交互研究部和OPPO美国研究所,先后在多目标行为分析足球行为分析、长视频理解、时空行为检测、跨模态分析及人机交互识别六大赛道上取得优异成绩。他们通过对算法优化训练,不断强化OPPO 的AI能力,让AI更好地为人类服务。

据OPPO相关人士介绍,在多目标行为分析(Multi-Agent Behavior)赛道中,OPPO所应用的AI算法能基于特征信息准确判别、预测动物及人在复杂交互内容下的行为。OPPO凭借着领先的AI算法能力,从全球240多个顶尖参赛团队中脱颖而出,获得子赛项少样本行为分类任务(Learning New Behavior)第一,及传统分类(Classical Classification)与标注风格迁移任务(Annotation Style Transfer)赛项的第二与第三名。目前,这项技术正在OPPO智慧工厂发挥着保护作用,工人们在这套算法的辅助下,可以避免关键生产环节错漏错放,令自身和产线更安全。

在基于多张2D图片的3D人脸重建挑战赛中,OPPO自研的AI算法所还原的三维人脸模型与真实人脸误差仅为1mm左右,在主要指标成绩排名中取得第二名。该算法克服了在实际生活中,特别是动态视频拍摄时,因为动作导致的人脸五官点不明晰、表情夸张、甚至图片数据失真等问题。事实上,OPPO自研的人脸检测算法已能够识别635个人脸特征关键点,并实现30次/秒的高速运行。在不久前发布的OPPO Reno6上,依托于该算法架构的AI焕采美妆视频技术为用户轻松打造了动态的自然美妆效果。

目前,OPPO的AI能力已发展到可以识别人在时空环境中的行为状态。在足球行为分析(SoccerNet)赛道中,OPPO取得动作定位(Action Spotting)和回放定位(Replay Grounding)两个赛项第二名。这项挑战需要在一段足球比赛视频中辨别出十几种关键动作,包括越位红牌这类基础规则复杂,动作幅度小,人类都很难识别的行为。同时AI算法还需要排除摄影机位不同等干扰因素,准确定位回放片段在原始比赛视频中发生的时间点。

在跨模态行为分析(MMact)赛道上,OPPO分别在行为识别(Cross-Modal Action Recognition)与行为定位(Cross-Model Action Temporal Localization)两个子赛项中取得第二名。OPPO的AI算法仅通过视觉信息便可准确识别一段视频中人物在特定空间内发生的交谈、屈膝、走动等十余种动作。该技术未来有望广泛应用在家居场景,为家中老人、小孩宠物带来更贴心的照料

此外,OPPO还在时空行为定位(AVA-Kinetics)赛道获得第三名。AVA数据集作为一个时空行为检测的数据集,使用该数据集的定位赛项历来是人工智能热门赛道之一,每年不乏国际顶尖科技公司与院校的知名团队参与其中。时空行为定位算法不仅可以准确识别视频中人们的行为,还可以同步定位其所处的时间段和空间范围。

本次CVPR上,OPPO在学术界前沿领域长视频理解(LOVEU, Long-form Video Understanding)挑战中,获得两大赛项第三名。该赛道需要AI在预先没有特定分类标准的情况下,自行理解视频的意义并分割出其边界的时间段落。因此,对算法的泛化性提出了极大挑战,AI需要像人一样思考,理解视频中人类动作、颜色、物品、乃至光源变化,并对变化点进行判断。

OPPO研究院美国研究所参与了稠密深度估计挑战赛道,展示了能够基于2D图像输出稠密3D深度信息的技术,获得自监督学习赛项第二名的成绩,并获得“最佳创意奖”。该技术通过利用深度学习模型直接从普通图像输出深度信息,未来有可能替代ToF这样的深度传感器,带来体验更好的室内外导航。