Google打造开放式聊天机器人 「近似真人」什么都可以聊

聊天机器人(Chatbot)。(图/达志影像美联社

记者王晓敏综合报导

过去10年来,聊天机器人(Chatbot)一直是相当热门的应用之一,如今在各种互动性服务上更为常见。不过一般的聊天机器人往往被其专业性受限,即其对话大多仅限于特定主题,为此,Google正致力于开发一款「不专门」的聊天机器人,「可以与用户天南地北地聊天。」

过去那些「高专业化」的聊天机器人大多存在一些关键缺陷,包括问答自相矛盾、缺乏对世界常识基本认知,有时候也会给出一些无法呼应上下文的答复。Google周二(28日)详细介绍了一款近似人类开放性聊天机器人「 Meena」,其有着26亿参数端对端神经对话模型,较现有的SOTA聊天机器人能更正确地完成对话,内容也更加具体、清楚。

Google的目标是创建一款可「聊用户想聊的所有内容」的聊天机器人, Meena着重于理解对话的上下文以提供「正确」的回应。该模型使用来自公共领域社交媒体对话达314GB大的文本进行训练,与现有的GPT-2模型最大版本相较,训练的资料量是后者的8.5倍。

为进一步进行评测,Google针对该聊天机器人提出一项新的人类评估指标,即敏感度及特异度平均值(Sensibleness and Specificity Average, SSA)。该指标捕捉人类对话中基本但重要的属性,值得注意的是,研究也发现「困惑度」(Perplexity)是一种易于在任何神经对话模型中实现的计算指标,与SSA高度相关。

为计算SSA,研究人员会与正在测试的聊天机器人进行自由形式的对话,这些聊天机器人包括Meena及其他开放性聊天机器人,如水谷(Mitsuku)、Cleverbot、小冰及DialoGPT等。而为确保评估的一致性,所有对话都将从「嗨!」开始,评估人员都将基于常识来判断每次对话,并对其评定「具体与否」、「有意义与否」两个指标。举例来说,若A表示:「我爱网球」,而B回答:「这很好。」则会被标示为「不具体」;但若B的回答为:「我也是,我很喜欢费德勒。」则会被标示为「具体」,因为其所讨论的内容与主题密切相关。在此标准上,Meena的表现比现有其他聊天机器人来得好,且其也正逐渐「缩小与真人差距」。

▼Meena和其他聊天机器人的性能对比。(图/取自Google AI Blog)

科技网站《9to5Google》指出,这种聊天机器人的实际应用包括设备指导制作相关的互动式电影游戏角色等。展望未来,虽然目前研究人员仅关注聊天机器人的敏感度及特异度,但Google希望能在未来持续加入如个性真实性等其他属性的评量,此外,解决模型中的安全性偏差也是一个关键的重点领域,目前团队并未发布研究演示。「但是,我们正在评估将模型检查点具体化所带来的风险益处,并且有可能会选择在未来几个月内使用,以帮助推进该领域的研究工作。」