每周更新一次敏感关键字
受此消息影响,港股AI概念股18日走低,百度跌2.40%,报89.45元港币(下同);商汤跌2.24%,报1.31元;阿里巴巴跌1.71%,报77.04元。
综合外媒报导,据多名涉及审查过程的人士表示,审查内容涉及批量测试大型语言模型对一系列问题的答案,其中许多问题与大陆政治敏感性,以及和习近平有关。审查还包括语言模型的训练数据及其他安全流程。相关审查工作由大陆网信办在全大陆各地机构进行。
杭州一间AI公司的员工表示,网信办有一支专门团队负责审查工作,他们进办公室后,会坐在会议室开始审查,「我们公司的大型语言模型第一次审查不通过,原因不太清楚,公司花了几个月时间作出调整,第二次审查才通过」。
另外,一名北京AI初创公司员工指出,该公司的基础模型在回答问题时「十分不受约束」,所以进行安全过滤极为重要,一开始要从用来训练的数据中剔除有问题的资讯,并建立敏感关键字资料库。大陆今年2月发布的人工智慧企业营运指南称,AI企业需要搜集数千个违反「社会主义核心价值」的敏感关键字和问题,例如「煽动颠覆国家政权」或「破坏国家统一」。敏感关键字须每周更新一次。
报导称,经审查的结果是,大多数大陆聊天机械人都会拒绝回答一些敏感话题,例如1989年6月4日发生过什么事;另有业内人士指出,月之暗面的聊天机械人Kimi会拒绝回答大多数与习近平有关的问题。