颜值测年龄网站爆红 微软5点释疑
近来脸书上疯传「How Old Do I look?」 (我看起来几岁?) ,短短48个小时内,网站how-old.net便就有一百万人上传照片测试,现在平均每秒有700张照片上传而且数字尚在成长中。大部份的人都很满意自己的测试结果,因为都比实际年龄少了许多,随着它的爆红,以致在网路上引发诸多讨论。使用者多数有以下疑问:
-这到底怎么猜的?怎么这么准?
-这到底怎么猜的?为什么我表情不一样,猜的年龄也不一样?
-这到底怎么猜的?为什么我一直被猜是女生?我明明是男的?
-这到底怎么猜的?我PO上去的照片会不会被微软拿去用?
微软表示,「我看起来几岁」是微软公司开发人员所开发的软体,当初的目的只是为了在开发者大会 (//build) 对开发者进行展示,以示范使用Azure服务建立智慧应用程式非常轻而易举。该网站使用了许多与物联网及大数据相关的技术,包括微软刚发表的脸部侦测API (Face detection APIs)。以下透过熟知内情人士揭晓「我看起来几岁」的幕后花絮,以飨诸多好奇的网友:
1.样本从哪里来?
起初,网站开发团队只想找50个人作为样本,结果吸引了3万5千人参加 (而且2万9千人还是来自土耳其!)。不过几小时内,用户总共上传了21万张照片,网站再用Microsoft Azure 云端服务上的Face detection APIs 去找出人脸,加以分类,借以辨识是否为同一人。根据一位微软员工表示,「我觉得很准,因为我拿我们家小猫『阿布』的脸去测,即便他很帅,网站还是测不出他几岁」。
要在一两天就写出这款讨喜的App,当然不能不从研究演算法开始,也得站在巨人的肩膀上才看得远。因此,这个开发团队使用微软的机器学习套件- Azure Machine Learning Gallery 中,由一个名为「牛津专案」(Project Oxford) 所做出的云端智能服务,包含脸部 (Face)﹑语音 (Speech)和视觉 (Vision)辨识。另外,开发团队考量使用者除了测自已跟家人的年龄外,也一定会想恶搞一番,找名人或古人的照片来测试。因此,开发团队再使用了Bing Search API 去搜寻网路上的有趣照片供使用者发挥创意。
3.微软到底会不会把使用者上传的照片存下来?
官网上说:「我们不会储存也不会分享使用者的照片,使用者所上传的照片只供猜测其年龄和性别。只要在网站猜出年龄后,使用者所上传的照片就会从记忆体中去除。即便许多网路服务供应商都在服务条款中表明会搜集并储存使用者的资讯,但微软选择维护使用者的资讯,除了短暂辨识照片年龄的使用时间外,微软绝不会储存或分享使用者的照片。」
4.照片一直不断上传至网站,微软若不存起来要怎么分析、怎么学习呢?
微软回答,分析的关键即是大数据即时分析的神妙之处!资料的汇集跟派送可以用 Azure Event Hubs ,一秒钟可进出几百万份资料,您的照片不会被存下,微软存下的是从照片萃取出来的资料。这又是什么资料呢?据说是名为「颜值」 的资料,或许就是青春的轨迹吧。所以请大家尽管放心,您的照片绝不会被留下来。
5.微软是如何抽取出这些像是性别、年龄资料做即时呈现呢?
微软:这种即时反馈又得靠工具-Azure Stream Analytics 可以让开发者用简单的SQL query 语法捕捉到即时的串流资讯,立马回报!