为使语音助理更聪明 亚马逊雇用一个团队聆听使用者对Alexa的要求

▲亚马逊在全球雇用了数千名员工,聆听智慧音箱Echo从使用者家中办公室捕捉到的录音。(图/达志影像美联社

科技中心/综合报导

有些人不愿购入智慧音箱是因为怀疑背后可能有人窃听,事实上,还真的有人在听。美国电商龙头亚马逊(Amazon)在全球雇用了数千名员工,聆听智慧音箱Echo从使用者家中及办公室捕捉到的录音,经转录、注释后反馈至软体中,以改进Alexa语音助理,消除Alexa对人类语言理解的差距并协助它更有效地响应使用者的语音命令

彭博报导,根据参加过该团队工作人士透露,Alexa的语音审查过程突出了培训软体演算法中经常被忽略的人类角色。就像其他从经验中学习而建构的软体工具一样,人类也正为Alexa的学习做努力。知情人士透露,该团队由承包商及亚马逊全职员工组成,他们在从波士顿柯斯大黎加、印度及罗马尼亚等各分支机构中工作,并签署了保密协议,禁止公开谈论这项计划内容

据2名在亚马逊分支机构工作人员的说法,他们每天工作9小时,每位审听人员需分析多达1000个语音片段。这项工作十分枯燥,波士顿的一名听审人员表示,他会将特定语言资料累积起来并对这些数据进行注释,如Taylor Swift这样一个单一词语,以向搜索者表明其是一名音乐艺术家

有时审听人员也会听到一些Echo使用者宁愿保持隐密的东西,如一位在淋浴唱歌狂走音的女人,或一个尖叫着寻求帮助的孩子。团队内部会使用聊天室来共享那些有趣的文件,不过偶尔也会听到一些令人沮丧的录音,甚至可能是犯罪过程。

亚马逊发言人透过电子邮件回应指出:「我们认真对待每位客户的个人讯息及隐私安全,我们只会注释一小部分Alexa录音,以便改善用户体验。这些讯息有助于我们训练语音识别及自然语言理解系统,让Alexa可以更好理解使用者的需求并确保服务适合每个人。」发言人也强调,亚马逊有严格的技术及操作保障措施,「对滥用我们系统者采取零容忍政策。员工无法在工作过程中识别该名使用者或知晓该名使用者的帐户及讯息。所有讯息都具有高度机密性,我们使用多重身分验证来限制查询,透过加密及审核的操作系统来保护这些资讯。」

▲除非Echo听到唤醒词或被按下按钮唤醒,不然平时并不会录音储存。(图/达志影像/美联社)

亚马逊并未在其行销隐私权政策文件中明确表示,将有人类员工收听他们的对话录音,仅在常见问题中写道:「我们使用您对Alexa的要求来训练我们语音识别及自然语言理解系统。」在Alexa地隐私设定中,亚马逊为用户提供了在开发新功能时禁止用其录音的选项。根据彭博获取的截图,发送给Alexa审听人员的录音并没有用户的全名及地址

据一位熟悉该工作流程的知情人士透露,亚马逊对语音资料的审查过程始于Alexa随机抽取一小部分用户的录音,并将这些录音资料发送给审听人员或承包商。部分Alexa审听人员的工作是转录这些使用者的命令,将录音与Alexa的自动转录文本进行比较。有时候审听人员会听到使用者提及自己的姓名或银行资讯,在这种情况下,他们会勾选纪录表上「关键资讯」的栏目打勾,然后直接换下一个录音。

亚马逊官网显示,除非Echo听到唤醒词或被按下按钮唤醒,不然平时并不会录音储存。不过偶尔也会出现莫名被唤醒的情况,通常会因此录到一些听不懂的噪音,但无论该录音的内容如何,审听人员都会将其转录,一名知情人士说,审听人员每天至少会听到100段这种被意外触发的录音。

曾研究过智慧音箱及其相关隐私问题的密西根大学(University of Michigan)教授绍布(Florian Schaub)说:「你不一定会想到会有另一个人听了你告诉智慧音箱的那些话。我们已经习惯于假定这些机器正在进行神奇的机器学习,但事实是,这其中仍涉及手动处理。」绍布指出,这是否属于隐私问题取决于亚马逊及其他公司对他们手动注释的讯息类型的谨慎程度,以及他们如何向他人提供这些讯息。

2名在亚马逊担任审听人员的说,全球都有使用者猜测Echo智慧音箱背后有人在听,他们偶尔会听到使用者问「你为美国国安局工作吗?」、「Alexa,有人在听我们说话吗?」这种问题。