VR-ZONE/Google 搜寻引擎解秘

文/VR-ZONE

Google 搜寻是许多人每天离不开的工具,不过你知道一个搜寻动作包含那些流程吗?让 Google 人 Jake Hubert 告诉你。

Google 搜寻产品经理 Jack Hubert 将使用者的搜寻动作分成三个阶段,并提供了一张资讯图表解释搜寻的流程。

搜寻前

其实每一段搜寻的旅程在你输入搜寻关键字前就开始了,像 Google 搜寻这种搜寻引擎在平常就会派出它的软体机器人(Software robot)爬梳网际网路,在各个网页联结中移动,将各个网页中的资讯传送回 Google 伺服器,这些资讯除了网页外,也包含了影片和图片等多媒体资讯的索引。截至目前为止 Google 已经投入 100 万个小时建立这些索引。

自动完成在输入较长的关键字时十分方便。

搜寻时

在使用者输入文字时候,Google 就会开始显示预测建议,让使用者可以更快地选择所需要的关键字。而在使用者按下「Enter」键开始搜寻之后,使用者的关键词就会透过封包传送,这些封包会找寻最快到达 Google 资料中心路径。Google 的资料中心可能散落世界各处,这些资料中心内放置了大量电脑,并储存巨量资讯,让搜寻关键字可以获得所需得资讯,平均一次搜寻要经过 2400 公里的旅行,使用者才能够获得答案,这些搜寻以近光速旅行,以每小时数亿公里的速度传送。

▼这不是什么奇怪的军事基地,这是 Google 拥有的其中一座资料中心。

传回搜寻结果

Google 搜寻最后的一个阶段就是传回搜寻结果,这个阶段就是 Google 强大的搜寻演算法发挥作用的时候了。Google 根据关键字找到数千数万个搜寻结果,Google 搜寻就会根据自己的 200 项指标排列相关度高低,Google 称之为「信号」(signals),著名的 PageRank 就是 200 项指标的其中之一。Google 搜寻依据演算法判断出相关结果后,就会依照排名将搜寻结果呈现给使用者。Google 的搜寻结果演算法持续都在修改,光去年就有超过 500 项改进事宜

▼搜寻结果会依相关性排列,这个机制背后有极为复杂的演算法。

Google 最近的演算法更新,可以让近期的事件排名往前移,让使用者搜寻事件时,能够提供最即时的资讯,例如你现在在 Google 搜寻里输入「奥运」,Google 就会显示 2012 年即将举行的伦敦奥运结果。

▼ Google 提供的搜寻资讯图表可以清楚地显示 Google 的搜寻流程。

Google 搜寻新功能

另外在某些地区,Google 搜寻也开始加入 Knowledge Graph 这个功能,将 5 亿个真实世界实体,例如建筑名人或是古迹等,连同 35 亿个事实译成电码。让 Google 搜寻第一次可以认识真实世界的实体,使用者输入的关键字对于 Google 搜寻再也不只是冷冰冰数字,而具有真实的样貌

Konowledge Graph 会在使用者搜寻关键字的同时,即时判断使用者指的是什么真实事件物件,并会将相关资讯随着搜寻结果一起显示,如搜寻名人的名字,就会显示相关简介;搜寻古迹就会显示相关照片历史等。

▼ Knowledge Graph 可以在你输入特定关键字时,显示相关资讯,例如你输入「Abraham Lincoln」的话,就会发现他其实不是吸血鬼猎人

根据 Google 搜寻产品经理 Jake Hubert 表示,Knowledge Graph 严格上来说不算是语意搜寻,不过 Google 以自己的方式,让 Knowledge Graph 具有依使用者语意判断搜寻结果的能力。另外 Knowledge Graph 也支援 Google 搜寻行动版,因此当然也可以和图片搜寻与语音搜寻共同使用,不过未来 Knowledge 是否会加入 Google Glass Project ,Jake Hubert 对此不愿多作表示,需让时间检验

图文来自:VR-ZONE