AI学脑补 打造聊愈系机器人
看图说故事对人类来说是轻松好玩的事,但对毫无想像力的AI人工智慧而言,却是巨大挑战,必须理解图片意义、生成字句,还要看懂图片中的因果逻辑。中央研究院资讯科学研究所副研究员古伦维开发独创模型,教AI看图说出「好看」的故事,让机器更有温度。
电脑如何学会「看图说故事」?古伦维指出,目前学界使用机器学习的方式,把图和对应的文字丢进电脑,让电脑从大量的图文搭配组合,从中学习看到怎样的图片,应该说出怎样的故事。这个方法俨然成为军备竞赛,「谁的电脑计算能力强,得到的模型更复杂,生成的文字就会更好。」
在这样竞争环境下,古伦维改采不同策略,把生成故事过程拆成「语意抽取」和「生成文本」两阶段。第一阶段利用精熟的图片辨识技术和资料库,抽取故事概念。例如图片中有小男孩、天空、脚踏车三个概念,AI最后可能生成「一个小男孩在天空下」故事大纲,人们可手动调整为「一个小男孩骑着脚踏车」。
在第二阶段,古伦维再运用故事文本资料库,让机器学习如何将第一阶段抽取,且由人类修改过的概念,组合成漂亮的故事。古伦维进一步表示,在看图选角阶段,其团队已开发出「自动选角」技术,电脑有能力筛选出让故事最精彩的「黄金组合」,是目前成果最好的AI故事生成模型。古伦维也在模型中纳入「知识库」,帮AI增加说故事知识。例如当图片中有人与马时,知识库可补充人会骑马、养马等知识,让AI有机会说出「一个人骑着自己养的马」这种具有故事性的句子。
「会看图说故事的AI,可从眼前情景连结到事件或情感,就像人类脑补一般,这些脑补就是故事。」古伦维说,这项技术让居家照护机器人更有人味,让人类被「聊」愈。