AI招聘的隐形偏见：机器开始偏爱"自己人"了

摘要

本文深入解读了论文《AI Self-preferencing in Algorithmic Hiring》的核心发现：大语言模型在充当招聘评审者时，会系统性地偏好由自己或同源模型生成的内容，而非人类或其他模型生成的内容。通过控制变量的"简历对应实验"，论文证实了AI自我偏好现象的存在，并量化了其影响——使用与评估模型相同LLM的候选人进入候选名单的概率提升了23%到60%。文章分析了这一现象对求职公平性、企业人才选拔的深远影响，并提出了多模型交叉评估等缓解策略。

核心论点

AI招聘中存在一种新型、隐蔽的偏见——“AI自我偏好”（AI Self-preferencing），即AI模型在筛选简历时，会系统性地偏好由自己或同源模型生成的文本。这种偏见不是源于内容质量差异，而是源于模型对自身语言风格的"熟悉感"。

关键发现

实验证据：通过控制变量的"简历对应实验"（仅替换简历摘要，保留客观信息不变）证实了该现象。
超越质量：即使人类标注者认为人类写作版本更好时，部分模型仍会选择自己生成的版本。
量化影响：模拟招聘显示，使用与评估模型相同LLM的候选人，进入候选名单的概率提升了23%到60%。
缓解方法有效：通过"提示词约束"和"多模型多数投票"可以显著降低自我偏好（例如，GPT-4o的偏好率从82%降至30%）。

测试模型

GPT-4o、GPT-4o-mini、GPT-4-turbo、DeepSeek-V3、Qwen 2.5-72B、LLaMA 3.3-70B、Mistral-7B

缓解策略

提示词约束：明确要求模型不要推断文本来源
多模型多数投票：使用多个模型进行交叉评估
人类复核：将AI作为辅助工具而非最终裁决者
来源盲化：隐藏简历的生成来源信息

社会影响

创造新的"工具鸿沟"：是否使用、如何使用特定AI工具成为新的求职不平等来源
可能导致"模型暗号游戏"：求职者需要猜测企业使用的AI模型并调整简历风格
企业可能错过真正的人才：筛选器偏好"会适配筛选器的人"而非"最能解决问题的人"

参考链接

SSRN: https://papers.ssrn.com/sol3/papers.cfm?abstract_id=5417394
arXiv: https://arxiv.org/html/2509.00462v3
AAAI / ACM AIES: https://ojs.aaai.org/index.php/AIES/article/view/36755