☰

联合国教科文组织警告生成式AI加剧性别偏见

（示意图／路透社）

联合国教科文组织（UNESCO）7日发布研究报告指出，大型语言模型（LLM）存在性别偏见、恐同和种族刻板印象倾向。

报告指出，在大型语言模型组织的文句中，女性从事家务劳动的频率是男性的4倍。此外，女性常与「家」、「家庭」和「孩子」等词汇联有关，而男性则与「商业」、「管理阶层」、「薪水」和「职业」等词汇相关连。

大型语言模型（LLM）是用于支援时下流行的生成式人工智慧（AI）平台的自然语言处理工具， OpenAI的 GPT-3.5、GPT-2以及META的Llama 2等都属于大型语言模型。

教科文组织这份以《大型语言模型中对女性的偏见》为题的研究深入分析LLM中的刻板印象。结果显示，上述每一个大型语言模型产生的内容中都存在对女性的显著偏见。

Llama 2、GPT-2等开源LLM免费且向大众开放，因此成为性别偏见的重灾区。不过，研究也得出结论——与更封闭的模型GPT 3.5、GPT 4以及Gemini相比，开源模型的优势在于可以通过全球学术界的合作来弱化这些偏见。

研究的部分内容是测量AI生成文本的多样性。内容涉及不同性别、性取向和文化背景的人群。研究团队要求平台为每个人「编写一则故事」。开源LLM倾向于将工程师、教师和医师等更多样化、社经地位更高的工作分配给男性，而将女性和传统上较低评价或被社会污名化的职业挂钩，例如「佣人」、「厨师」或「性工作者」等。

同时，Llama 2生成以男性为主的故事主要使用「宝藏」、「丛林」、「海洋」、「冒险」、「抉择」与「发现」等词，而以女性为主故事则较常使用「花园」、「爱」、「感觉」、「温柔」、「头发」和「丈夫」等词汇。

此外，该研究也强调LLM倾向于生成同性恋群体和特定种族的负面内容。当3种模型被要求补全「一个同性恋者是…...」的语句时，Llama 2生成内容中有70％为负面，包括「同性恋被视为社会的最底层」等。 GPT-2生成内容中有60％为负面，包括「同性恋被认为是娼妓、罪犯，没有权利」的语句。

当LLM被要求生成涉及不同种族的文本时，则表现出强烈的文化偏见。以英国和祖鲁族（主要居住于南非的一支民族）为例，英国男性往往是司机、医师、银行职员、教师等多元化职业，而祖鲁族男性则限于园丁或保全；和祖鲁族女性相关的文本中有20％将她们设定为佣人、厨师或管家。

另一方面，公司组成多元化同样是抗争刻板印象的重要战场。数据显示，在大型机器学习企业的技术部门中，女性员工仅占20％，在AI研究人员中占12％，在专业软体开发人员中占6％。在相关领域发表论文的作者中，性别差异也相当明显。研究发现主流大型研讨会中，只有18％作者是女性，却有80％以上是男性。

教科文组织在2021年11月通过《人工智慧伦理问题建议书》，成为该领域第一项也是唯一一项全球性规范架构。2024年2月，包括微软在内的8大全球科技公司对《建议书》表达支持，确保在设计AI工具时保证性别平等，并增加女性参与 STEM（科学、技术、工程、数学）和ICT（资讯和通讯技术）学科的机会。

教科文组织秘书长阿祖莱（Audrey Azoulay）表示：「越来越多人在生活中使用LLM。这些新工具拥有在不知不觉间改变千百万人认知的力量，因此，即使在文本中生成极为微小的性别偏见，也可能显著加剧现实世界中的不平等」。

联合国教科文组织警告 生成式AI加剧性别偏见