剑指谷歌!OpenAI与新闻媒体出版商合作 推SearchGPT

▲OpenAI计划推出AI搜寻引擎「SearchGPT」。(图/达志/美联社)

文/CTWANT

美国人工智慧研究实验室「OpenAI」正在测试一款人工智慧(AI)线上搜寻引擎「SearchGPT」,其将使用生成式AI收集资讯并以对话的语气回答问题和搜寻结果,帮助用户更快、更轻松地找到他们的查询内容,目前仅向一小部分用户开放测试,且尚未透露正式的推出时间,预计「SearchGPT」最终可能会整合到「OpenAI」的「ChatGPT」聊天天机器人中。

据科技杂志《连线》(Wired)的报导,「OpenAI」发言人伍德(Kayla Wood)拒绝向《连线》提供演示新工具「SearchGPT」的详细资料,但证实该公司已向若干合作伙伴和新闻媒体出版商取得访问权限,并根据他们的反馈内容改进搜寻引擎的功能,此举被外界解读是正面剑指搜寻引擎龙头「Google」。

「OpenAI」的主要投资者微软(Microsoft)是最早向大众发布生成式AI搜寻引擎的公司之一,该公司于2023年把AI聊天机器人「ChatGPT」背后的人工智慧技术整合到旗下的网路搜寻引擎「Bing」,以及浏览器「Edge」中。微软的人工智慧搜寻引擎现已更名为「Microsoft 365 Copilot」。

随后,「Google」以及由AI聊天机器人驱动的研究和会话搜寻引擎「Perplexity AI」等多个竞争对手,都向用户推出了自己的AI搜寻服务。例如「Google」就在搜寻引擎中推出名为AI概述(AI overview)的新功能,替用户一次整合所有搜寻结果,不需点击多个连结。

而「OpenAI」的「SearchGPT」则看起来与「Perplexity AI」更为相似,其聊天机器人可使用自然语言预测文字回答查询,并使用网路来源产生答案,引用文字回应中的连结。

「OpenAI」在2022年11月首次推出ChatGPT后,许多用户看到聊天机器人从网路中挖掘和总结资讯的能力,预期AI聊天机器人有可能取代传统的网路搜寻引擎。然而,大型语言模型(large language model,LLM)的缺点使得聊天机器人的搜寻功能不完全,这些模型所利用的训练数据通常已经过时数月或数年,因此当不确定答案时,AI聊天机器人就会编造「错误的事实」。

对此,「OpenAI」的「SearchGPT」可能会使用结合了搜寻检索和生成能力的自然语言处理架构「检索增强生成」(Retrieval-Augmented Generation,RAG),来降低聊天机器人的错答率。透过RAG架构,人工智慧工具将引用可信任资讯,例如首选新闻网站,同时将产生搜寻结果的资料和数据来源。

不过这个方法具有潜在的版权侵犯问题。例如「Perplexity AI」就遭到包括《连线》在内的网站或新闻媒体出版商的批评,因为其AI搜寻引擎涉嫌抄袭原创新闻网站的内容,并且刻意忽略资料来源。

因此「OpenAI」改进了这项缺失,并对新闻媒体出版商承诺:「SearchGPT」将透过在搜寻结果中特别引用和连结到出版商的内容,让用户与出版商建立更多联系和浏览。据悉,包括沃克斯传媒(Vox Media)、大西洋月刊(The Atlantic)、新闻集团(News Corp)和金融时报(Financial Times)在内的多家新闻媒体公司,今年都已与「OpenAI」签署了内容授权协议。

延伸阅读▸ 龙舌兰酒厂工安意外!锅炉炸飞100米致6死3伤 66万升龙舌兰流入河▸ 便宜货大健康1/鱼罐头钙质高43倍 颠覆印象!营养价值不输天然食材▸ 台风天提早打烊…客人呛给负评「等一下都不行」 店家:全员工得将就您?