浅谈Google搜寻与关键字:告诉你平常Google大神怎么帮你找资料

▲5分钟带你了解Google Search。(影片/取自YouTube)

特约记者洪圣壹/综合报导

针对近日多名Google搜寻的用户官网搜寻资料时,出现不相关的「陈菊 善款预测字串民众认为可能是九合一选举过程中,对手阵营刻意操作的结果。对此,Google公司第一时间便回应已经进行修改,目前已经陆续进行修改。本篇想要针对Google搜寻的运作方式进行一个概略介绍。

在PC风行的时代,Google Search以非常精简形式,取代当时Yahoo搜寻,成为百度腾讯「参考」对象,原因别无其他,当然是因为能够在非常短的时间之内帮助用户找到他们想要找的内容

这中间有个基本问题:「找到用户想要的。」

Google的解决方式很暴力(也因此无可取代):从零开始打造资料库,然后用各种复杂的方式解决搜寻需求。前者的资料库叫做GFS(Google File System),后者的方式最初叫做「蜘蛛」(spider)。Google一方面不断翻新资料库内容,蜘蛛们不断的去学习怎么去挖掘网页当中索引,这种索引最多的就是「关键字」。以此为基础,当用户到Google 首页进行搜寻,搜寻的其实是Google的资料库并非搜寻整个网路世界

有空可以查询相关资料,其实Google每隔一段时间就会更新云端资料库、升级超级电脑效能,当用户在搜寻字串之前,Google 就会先汇整搜寻索引中的网页资讯

当然啦!这只是一个简单的概念,为了去「猜对」用户真的所想要的内容(包括拼错字),现在的Google Search导入 AI 演算法,透过机器学习的形式了解用户需求,用户只要打第一个字、第二个字即使拼错,Google Search也可以帮助你找到想要的资讯,其背后依赖的是所谓的「知识图谱」。

还有一个情况就是:我大概知道是什么歌,但不知道歌名,甚至不知道歌词。这种情况你甚至可以把你知道的打入搜寻去找看看,相信也能在「选项」当中找到概略答案,然后再针对初步答案去寻找,相信最终一定可以找到自己想要的。

这边提到的「选项」,就是Google Search的「排名系统」,排名系统的判断非常复杂,这包括「分析」、「比对」、「理解」、「背景资讯」、「资料完整性」,还有很重要的「品质评分」等等。简而言之,搜寻结果会去判断用户的需求,提供最为正确、完整的选项。题外话,当网站经营者本身如果很认真的去更新网站内容,而这些内容又是可信的,那么就很容易成为相对的Google搜寻用户的搜寻结果,这也是新闻网站经营者非常努力的在生产可信任的原创内容、优化SEO,乃至于比较容易成为时事资讯搜寻结果的原因。

至于关键字广告,通常会在Google或Google搜寻网页中呈现,用户会发现在某些搜寻的结果当中,看到「广告」字样,这些就是搜寻广告。广告的形式很多种,基本上不在本篇赘述,但是内容通常会出现在网页的右边、中间或者上方,相关内容的出现,主要会根据用户在搜寻的时候输入的关键字做相对应的广告推送。

换句话说,排名系统其实是非常复杂而且无法轻易更动的,简单判断此次部分用户对于Google搜寻结果是人为操作的争议,基本是不存在的。

完美的搜寻引擎应能完全理解使用者的意思,提供恰如所需的资讯-Larry Page

这边顺带一提,最早最早的排名系统判断基础称为“Page Rank”,姑且称为网页信任值。开发“Page Rank”的人之一,正是鼎鼎大名的 Larry Page,也就是 Google 创办人

如今的搜寻结果更偏向平台整合服务,Google Search 本身就是一个AI的存在。Google Search 的机器学习,不只学习找到资料的结果、学习问题本身、学习用户怎么问问题,也会去学习解决问题的形式。举例来说,当用户想要知道今天天气如何,系统会先判断用户的所在地,然后直接在搜寻结果提供天气状况。当用户想要知道怎么去台北101,系统将会问你要不要开启地图服务,接着点选Google地图,不需要任何操作就进入导航服务。大家没事可以试着拿起手机说:「导航到101」,不管你在世界的哪个地方,都可以很快的做出正确的结果。

最后谈到资安问题,记者曾在2014年访问到Google使用者政策资深专员 Patrick Thomas,根据他的回应,Google内部除了本身的网页资安防护之外,其实还有跟全球超过250个资安社群(也就是骇客)合作,同时也举办各种形式的骇客大赛与悬赏,借此专门找到可能的攻击漏洞以进行修复。换言之,如果能够轻易入侵 Google Search、修改搜寻结果,这个人或者团队将会获得 Google 公司的奖励

本篇刚好就这个机会,结合时事让大家简单了解 Google 搜寻引擎。概略来说,目前要用人为的形式影响Google Search结果,基本上是不可能的。

*相关参考资料:Google Search