AI学脑补 打造聊愈系机器人

图说故事人类来说是轻松好玩的事,但对毫无想像力的AI人工智慧而言,却是巨大挑战,必须理解图片意义、生成字句,还要看懂图片中的因果逻辑中央研究院资讯科学研究所副研究员古伦维开发独创模型,教AI看图说出「好看」的故事,让机器更有温度

电脑如何学会「看图说故事」?古伦维指出,目前学界使用机器学习的方式,把图和对应文字丢进电脑,让电脑从大量图文搭配组合,从中学习看到怎样的图片,应该说出怎样的故事。这个方法俨然成为军备竞赛,「谁的电脑计算能力强,得到的模型更复杂,生成的文字就会更好。」

在这样竞争环境下,古伦维改采不同策略,把生成故事过程拆成「语意抽取」和「生成文本」两阶段。第一阶段利用精熟的图片辨识技术资料库,抽取故事概念。例如图片中有小男孩天空脚踏车三个概念,AI最后可能生成「一个小男孩在天空下」故事大纲人们手动调整为「一个小男孩骑着脚踏车」。

在第二阶段,古伦维再运用故事文本资料库,让机器学习如何将第一阶段抽取,且由人类修改过的概念,组合成漂亮的故事。古伦维进一步表示,在看图选角阶段,其团队已开发出「自动选角」技术,电脑有能力筛选出让故事最精彩的「黄金组合」,是目前成果最好的AI故事生成模型。古伦维也在模型中纳入「知识库」,帮AI增加说故事知识。例如当图片中有人与马时,知识库可补充人会骑马养马等知识,让AI有机会说出「一个人骑着自己养的马」这种具有故事性句子

「会看图说故事的AI,可从眼前情景连结到事件情感,就像人类脑补一般,这些脑补就是故事。」古伦维说,这项技术让居家照护机器人更有人味,让人类被「聊」愈。