披萨加胶水成笑话,数据显示谷歌再次之前就已减少AI概述显示
6月5日消息,谷歌搜索最近推出的“人工智能概述”功能,因其令人啼笑皆非的荒谬答案而引发关注。第三方公司的追踪数据显示,早在该功能引起广泛关注之前,谷歌就已开始降低其显示频率。
近几周来,凡是稍微关注互联网的人都可能注意到,谷歌对其搜索引擎的人工智能全面升级开局并不顺利。谷歌推出的“人工智能概述”(AI Overviews)功能旨在为搜索查询提供人工智能生成的简要答案,但该功能自上线几天后便因生成错误甚至荒谬的答案而备受嘲笑,例如建议用户在披萨中添加胶水,或每天至少食用一块小石头。
搜索引擎优化公司BrightEdge的最新数据显示,谷歌自推出“人工智能概述”功能以来,已显著减少其在搜索结果中的展示频率,并且在广泛批评出现之前,就已开始大幅限制这一功能的应用。自去年测试版推出以来,BrightEdge便开始追踪“人工智能概述”在数万个搜索结果中的出现情况。
5月14日谷歌I/O开发者大会后,“人工智能概述”在美国的英文用户中上线。BrightEdge追踪到的数据显示,人工智能生成的答案只占不到27%。但在“人工智能概述”的错误截图在网络上疯传的前一周,其出现频率便急剧下降。到上周末,当谷歌通过博客帖子承认人工智能功能的失误时,BrightEdge观察到“人工智能概述”仅出现在11%的搜索结果页面上。到了本周一,出现频率基本与上周末持平。
BrightEdge的创始人兼执行主席Jim Yu表示,显示频率的下降表明谷歌决定采取更为谨慎的措施。“显然,他们在努力严格控制相关风险。”他补充说,尽管目前存在问题,但他对谷歌处理“人工智能概述”的方式持乐观态度,认为这些初期问题仅是暂时的小波折,而非系统性的问题。
谷歌发言人内德·阿德里安斯(Ned Adriance)表示:“我们正在持续优化‘人工智能概述’的展示时间和方式,以确保其尽可能有用,包括在过去一周内进行了多项技术更新以提升响应质量。” 谷歌拒绝公开“人工智能概述”在搜索中出现频率的内部统计数据,但阿德里安斯表示,BrightEdge的数据并不反映公司内部观测到的情况。
至于谷歌在功能上线不久后为何决定大幅减少其显示频率,尚不得而知。但公司在上周的博客帖子中承认,数百万用户使用该功能后,为公司提供了关于其性能和错误的新数据。谷歌搜索业务负责人利兹·里德(Liz Reid)表示,谷歌已进行了“十几项技术改进”,例如限制搜索结果中出现讽刺性内容。她的帖子提到,这些更改将触发对“人工智能概述”的显示时机的新限制,但没有具体说明这些限制将如何改变人工智能结果显示的频率。
去年末,当谷歌允许用户选择加入“人工智能概述”功能的测试版时,BrightEdge便开始利用样本查询列表来跟踪该功能的表现。这些测试查询覆盖了九个领域,包括电子商务、保险和教育,旨在涵盖常见及较少见的搜索类型。这些查询被一遍又一遍地测试,有时一天多次。
2023年12月,BrightEdge发现84%的搜索结果中出现了“人工智能概述”。然而,随着时间推移,这一比例开始下降。谷歌的阿德里安斯表示,这并不意味着84%的搜索自动触发了人工智能概述,但他未对公司的内部测量进行详细说明。在谷歌向所有用户开放“人工智能概述”后,BrightEdge继续追踪那些已参与测试版和未参与过测试版的账户显示的情况,但两组之间并无显著差异。
谷歌虽然拒绝透露在公众版本和测试版之间显示“人工智能概述”的数量差异,但阿德里安斯表示,参与测试的用户在更多的查询中看到了“人工智能概述”。
BrightEdge的数据还揭示了谷歌认为“人工智能概述”在哪些主题上最有帮助。在健康关键词搜索中,人工智能生成的答案出现的频率最高,最近为63%。BrightEdge包括的样本查询中有“足部感染”、“肠道出血”和“远程医疗紧急护理”等。相比之下,电子商务相关的搜索显示频率大约为23%,而餐馆或旅游相关的查询很少触发人工智能概述。
Yu对这些结果表示惊讶,因为健康相关的问题特别敏感,而谷歌近年来一直在努力改进对此类查询的展示内容。
搜索引擎优化平台seoClarity高管马克·特拉弗哈根(Mark Traphagen)也对谷歌如何处理医疗保健相关的查询表示关注。为了监控“人工智能概述”的推广情况,该公司正在跟踪一段时间内对数千个搜索词的响应。在包括“如何治疗失眠”和“莱姆病症状”在内的26个流行的健康相关关键词中,谷歌显示的人工智能回答的频率约为58%。
像 Yu一样,特拉弗哈根对“人工智能概述”在这类查询中的出现频率感到意外。但他们认为,谷歌依赖诸如梅奥诊所或美国疾病控制与预防中心等可信网站来回答健康问题的方式是值得称赞的。“他们真的加强了安全措施,”特拉弗哈根说,“所有的来源都是知名且可靠的。”
尽管如此,谷歌的人工智能回答有时仍会出现错误,包括在处理健康问题时。一些专家指出,谷歌声称依据高质量来源回答健康问题的做法并不可靠。搜索引擎优化顾问莉莉·瑞(Lily Ray)表示:“它们经常引用并无排名的网页,包括健康查询。”她的实验显示,“人工智能概述”在处理诸如衰老、增肌和皮肤护理等较为温和的健康护理问题时似乎缺乏权威性,但在处理更为直接的医疗查询时则表现得更为强大。
上周,有报道称人们对谷歌算法用于回答某些健康问题的来源的担忧。报道指出,“人工智能概述”在回答有关巧克力的健康益处的问题时,参考了一家意大利巧克力和冰淇淋制造商以及一家销售家庭“肠道智能测试”套件的公司的网站。
周一上午,当在谷歌查询“巧克力是否健康?”时,所显示的“人工智能概述”引用了同一家意大利巧克力公司的信息,以及一家位于明尼苏达的巧克力商的网站。但在下午重复查询时发现,谷歌已对此做出改进:之前引用的巧克力公司已从引用列表中删除,取而代之的是四家信誉良好的医疗机构网站。尽管如此,答案仍然提到专家建议每天食用一小块黑巧克力,这在医学上至多是一个有争议的总结。
尽管“人工智能概述”的开端并不顺利,但BrightEdge的 Yu认为,从长远来看,人工智能搜索是趋势所在。“从大局来看,搜索领域的人工智能时代不可避免,我认为它会变得更好。”这或许是事实,但是否一个全新且改良的“人工智能概述”能够通过显著的改进来修复其声誉损害,则仍是一个未决的问题。(辰辰)