中國用習思想訓練AI大模型 外媒稱Chat Xi PT

英国金融时报22日报导,中国近期透过官方文件训练人工智慧,欲推出贯彻「习近平思想」的聊天机器人,除了期望与ChatGPT成为竞争对手,更是为了确保严格控制中国言论自由。

中共中央网络安全和信息化委员会办公室旗下杂志「中国网信杂志」20日发文宣布,中国第一个网信研究大型语言模型(LLM)应用已正式上线并内部使用,拥有智慧问答、总结文章及中英文互译等功能。

文章指出,该大型语言模型语料库来源于「网信研究数据库」等七大专业知识库,其中包括「习近平新时代中国特色社会主义思想知识库」,并称语料库的专业性、权威性保证了生成内容的专业性。

金融时报报导,中国政府正尝试推出以「习近平思想」为训练对象的聊天机器人,除了期望与Open AI的ChatGPT竞争,更借此控制人工智慧向中国网友提供讯息的方式,以严格控制中国境内的言论自由。

中国官方最新推出的LLM正在学习「习近平新时代中国特色社会主义思想」,以及中央网信办的其他官方文献。金融时报称之为Chat Xi PT。

据金融时报查阅的部分资料显示,大量培训材料来自政府法规、政策文件、国家媒体报导和官方出版物。

资料的几十份文件当中,约有8万6314处提到习近平,其中有这样一句话:「让我们更加紧密地团结在以习近平同志为核心的党中央周围。」

报导引述一名参与该专案的人士称,新模型目前正在强大的网路监管机构下属的一个研究中心使用,最终可能会被广泛使用。

不过,由于可用于训练LLM的中文数据相对稀少,对模型开发人员形成挑战,大多数小组也使用英语资讯进行训练,但这可能导致人工智慧产生不符合中国规范的回复。

为帮助开发人员解决问题,与中央网信办结盟的非营利组织─中国网络空间安全协会于去年12月发布第一个包含1亿条「高质量、可信数据」的公共数据库,供各团体在模型培训中使用。

中央网信办此前发布生成式人工智慧规则,并引入许可制度,规定生成式人工智慧提供商必须体现「社会主义核心价值观」,并要求生成内容不能包含「颠覆国家政权」的内容,公司须对自家人工智慧产出负责。

百度和阿里巴巴等科技巨头已确保其模型严格控制生成与习近平或其他潜在敏感问题相关的内容。当被问及敏感话题时,这两家公司的聊天机器人会要求用户重启聊天。

中国官方在设立这个LLM前,已用各种形式传播习近平的政治、经济和文化思想,包括习近平出版的书籍长期都是书展焦点;腾讯、网易等新闻平台都将与习近平相关的新闻置顶;以及宣传习思想的「学习强国」App。

「习近平新时代中国特色社会主义思想」于2017年10月中共19大写入中共党章,2018年3月又经第13届全国人民代表大会一次会议通过写入宪法。