写诗看图就好不用走七步! 台大学生做出AI「曹植」

记者庄友直台北报导

大家想必都知道曹植「七步成诗」的典故,如今借由人工智慧威能,不用走七步,或许「七秒」内就能做一首诗了!微软在先前的 Academic Day 2017 主题演讲中,来自台湾大学资工研究所学生团队,就成功作出让 AI 「看图作诗」的强大功夫

这项计划是由在微软亚洲研究院时期的台湾大学资工研究所研究生吴肇中网路多媒体研究所毕业生文峰所计划,并由台湾大学徐宏民林守德教授和 MSRA 研究员宋睿华所指导。借由人工智慧深度学习演算法技术,让电脑能透过侦测不同的图片,借此分析内部物件,并做出一首四句的现代新诗

▼这项程式其实应用了 AI 中的深度学习,借由广纳诗集图像分析技术,让程式能自行「看图作诗」。(图/记者庄友直摄)

现场展示时可透过电脑与手机 APP 的不同介面,可借由传送图片、或现场拍照(手机)的方式让 AI 辨识并开始做诗;但毕竟是没有规律关系,同一张图片在不同的辨识之下,也会有不一样的诗句内容,可玩性其实还蛮大的。

▼不仅一般电脑可行,就连手机也有专属 APP 可用。(图/记者庄友直摄)

▼由于辨认技术的关系,同一张图片在多次侦测后,写出来的诗也不一样,这点跟人类倒是蛮像的。(图/记者庄友直摄)

被问到为何不做古诗时,团队指出其实这样的技术早期就有了,而且现代新诗不像古诗有着平仄等规律变化,在实作上反而难度更高。这项程式也收集了高达 519 位诗人作品,将比较常出现的词语归纳化。除了在中国大陆出了诗集外,近期更获微软旗下的人工智慧机器人小冰」团队关注,先前还曾开放限时体验;但目前已经停止了。

▼先前这项服务也登上了微软智慧机器人「小冰」,但目前已经下架。(图/记者庄友直摄)

另外,同场也有另一项利用影像辨识即时分析物体的 AI 应用「Seeing Bot」,借由像是 Webcam 等影像辨识装置,程式在感知接收到的画面后,就会精准描述场景内容;但实际测试之下误差度还是算大,可能会把黑桌当成钢琴,或是同样场景出现不同辨识语句状况,恐怕还有一段长路要走。

▲▼另外,同场也有侦测图像并即时描述物件的 Seeing Bot 应用,可惜在复杂的场景中,准确度还有待加强。(图/记者庄友直摄)