智能驾驶疆场,海天瑞声的「数据」纵横论
作为人工智能的重要应用之一,自动驾驶也在这场一年一度的全球顶级会议期间大放异彩——
会议期间首次开展了面向大会观众基于开放道路的载人应用体验,体验路线总长2.8公里,共12个路口,途经世博中心。此外,特定区域自动驾驶应用展示也同步进行。
自动驾驶动态体验线路
基于这些应用体验,国内自动驾驶全产业链成就和最高技术水平得以展示,自动驾驶技术对于人们日常生活以及出行方式的改变可以窥见。
事实上,自动驾驶系统平稳运转的背后,是一个大家都耳熟能详的关键词——数据。
"数据已经成为了一种生产要素,前提是要把人类世界的信息转化为计算机可以识别的方式。"海天瑞声的副总裁李科告诉新智驾。
想要打造真正安全可靠的量产自动驾驶产品、支持成千上万辆同时交互的自动驾驶车辆,企业就必须想明白如何高效地收集以及有效利用海量数据。
那么,具体该怎么做呢?
智能驾驶的"幕后英雄"
尽管不像硬件一样看得见摸得着,但无论是自动驾驶、辅助驾驶,还是智能座舱,这些被赋予智能属性的驾驶体验都离不开数据的驱动。
在李科看来,通过训练数据生产的各个环节(设计、采集、加工、质检),可以收获很多有益于智能驾驶算法模型迭代的规律和结论。
譬如关于驾驶员踩刹车的图像数据
这个动作通常代表着判断和决策的结果,那么在这个动作之前发生了什么?在这个动作之后发生了什么?有没有比较特殊的事情发生?
语音交互时,哪些功能的启动可能会对驾驶产生干扰?麦克风如何排列可以更好地满足各个座位上的交互需求?回声噪声的情况如何、该怎样解决?
于自动驾驶企业和主机厂而言,这些数据都值得重点关注,因为它们后续可能有助于强化 Corner Case 的处理能力、优化用户的乘坐体验。
而计算机视觉和智能语音训练数据正是海天瑞声从事了近二十年的领域,且已向微软、亚马逊、阿里等国内外500多家知名企业提供从方案设计、数据采集、加工处理到质检交付的全流程数据服务。
其中,海天瑞声在智能座舱的布局,最早可以追溯到2005年。这些历程无疑为其积累了足够多数据层面的 know-how,使得海天瑞声可以基于自己的技术研发实力、经验沉淀从数据角度去加速客户的算法模型训练及商业化落地,相应的也得到了越来越多智能驾驶客户的青睐。
事实上,除了数据采集、标注服务,一个实力雄厚、经验丰富的数据合作伙伴最重要的是帮助玩家们较为准确地预估投入产出比,找到与整体业务目标契合的解决方案。
对此,李科也尝试通过一个例子来帮助理解。
在训练算法模型时,玩家们希望获得某一场景中所有可能碰到的情况并以数据的形式给到机器去学习,在智能驾驶业务中,这不仅包括常规的多种路况环境(拥堵、城市街道、高速路段),天气状况诸如大雾、暴风雨雪天气,不同光线条件例如白天、黑夜、清晨傍晚,还包括交通事故、违规行为等各种突发状况。
智能驾驶舱外采集环境多样、复杂
这就要求包括海天瑞声在内的数据服务商能够深刻理解客户的业务场景,在设计方案过程中考虑到算法对样本多样性的需求,以及不同样本数据的占比应该是怎样的,同一类型场景的数据至少要达到多少才能满足机器学习的需求,数据方案如何设计才能避免出现与模型的过拟合、欠拟合等诸多问题。
帮助客户不在数据准备阶段走弯路,加速模型训练、产品落地和迭代是海天瑞声坚守的初衷。
起于砖瓦的技术壁垒
随着智能驾驶更进一步发展,在可预见的未来里,玩家们对底层数据处理能力的要求会越来越高、对长尾场景数据的需求会越来越大、对高质量训练数据的诉求会越来越强,智能驾驶的发展已成为不可逆转的大趋势,并且具备了进一步落地应用的充分条件。
然而这一领域鲜有高质量的一站式数据服务,整体的数据处理速度、精度、准度都还有待提升,尤其是3D 点云数据。
因为远见,海天瑞声早已开始思考如何将自己在数据处理方面的先发优势最大化发挥,去帮助玩家们解决痛点。据了解,目前海天瑞声的技术已经能够支持3D 点云标注、3D 点云连续帧标注、3D 连续帧与2D 联合的标注、3D 语义分割等。
譬如,针对同一物体在不同空间中的数据处理,海天瑞声前期会对其进行多个坐标系的建模和配准,然后经过校准后投影到同一个坐标系中,最终保障不同空间中的标注结果的统一。
对于3D & 2D 的联合标注,海天瑞声能够通过算法实现3D 标注结果自动投影到2D 平面,随之自动生成对应目标的空间位置。
可以看到,得益于强劲的技术实力以及在数据服务领域耕耘的经验,即便是在新兴的且难度较大的3D 点云数据处理方面,海天瑞声也已经做得游刃有余。
在舱内场景,DMS 数据因为涉及到光线、多角度同步等不同要求,大大加剧了采集的难度。海天瑞声则基于自研的多通道桌面车载录音工具,配合不同采集设备,从采集端实现多通道同步,且支持灵活参数设置和实时语音质检,在提高采集效率的同时还能够实时监控采集质量。
舱内多通道采集示例
种种这些,都是海天瑞声区别于业内其他数据服务商的根源,也是在经年累月的努力下为自己打造的深厚壁垒,使其得以领跑智能驾驶数据服务。
数据安全,立身之本
随着行业的高速发展,千差万别的需求背后,不变的是对数据合规及安全的要求。作为行业的领路人,海天瑞声稳步前行的同时也持续加码在合规及安全方面的建设。
其业内首创科学的项目管理体系,从资源的合规性、数据存储安全及流转等方面制定了详尽的措施:
比如,所有项目采集前必须获得被采集人的书面授权,否则需要重新配置资源以保障合规性;
同时,海天瑞声还专门设立了进行数据安全及合规性审核的数据保护官(以下简称"DPO");并且通过完善的制度条例充分保障被采集人的权利,曾经有一位海外被采集人在项目结束后申请删除个人数据信息并撤回相应授权,收到请求的DPO第一时间整理了相关资料后与客户联系,协商操作,最终在24小时内完成了被采集人的诉求;
2018年5月由欧盟出台的《通用数据保护条例》,被称为史上"最严数据保护法案",曾因为数据信息保护失职对英航开出了15.8亿人民币的天价罚单。值得一提的是,此法案一经出台,就被海天瑞声纳入了项目及技术研发人员的"必修课",组织学习并进行考核;
…
除了制度上的严格规范,一向以技术严谨而著称的海天瑞声自然也有相应的"硬实力"去保障数据安全,即一体化数据处理平台:
该平台是海天瑞声基于自身近20年数据服务经验,并融合了数十项核心技术及专利打磨而成。平台内上千个自研标注工具联合打通,不仅可以用来处理复杂的交叉业务场景数据,更重要的是保证了数据从采集到脱敏、清洗、标注、质检等全流程不出平台即可完成,与平台内严格的人员权限管理、实时监控等功能一起,充分保障了数据的安全可控。
此外,还支持私有部署、驻场标注等一系列高级别数据安全处理请求。
以上种种举措,使得海天瑞声很早就通过ISO/IEC 27001管理体系认证,并于日前获得具有"最严苛资质审核"称号的ISO/IEC 27701隐私保护标准认证。
数据的合规安全是客户的重要诉求,也是海天瑞声牢牢坚守的生命线。
行于未来之路
纵观行业的发展,智能驾驶已经成为了全球大多数国家和地区都在推进的主旋律,这个市场的规模还将呈倍数增大。
对此,李科向新智驾表示,现在一些造车新势力发展势头迅猛,这会进一步带动舱外感知的数据需求,我们今年在持续发力舱内的同时,会侧重舱外的布局。
事实上,无论舱内还是舱外,与这些场景结合的技术大多离不开智能语音、计算机视觉和自然语言理解——这些也是海天瑞声一直在耕耘、也会坚持耕耘的方向。正如李科所介绍的,从2005年开始,海天瑞声就开始在AI全核心领域进行深度的数据布局。
如今十六年过去,海天瑞声已然立于数据服务行业的高山之巅。
全球语言学家团队、 超过160语种方言服务能力、覆盖全球近1/2国家及地区的本地化项目经验、760余个自有知识产权的训练数据产品等,这些均是海天瑞声长期以来坚持创新和自主研发的果实——不仅可以助其在火热的智能驾驶赛道大展身手,加速海内外自动驾驶以及智能座舱的应用落地;也能够作为海天瑞声发展的核心代名词,成为自身多项业务延续和拓展的重要基础。
无论从何种角度来看,用户驱动、需求驱动、实战驱动都是推动海天瑞声持续稳步前进的动能。也只有通过这些方式打造出来的产品,才接地气、才具有真正的生命力。(来源:雷锋网)