卧底模式 (Undercover Mode)
卧底模式是Anthropic Claude Code泄露的系统提示词中揭示的一种AI配置模式,允许AI被配置为隐藏身份参与开源项目或公共事务。
泄露的指令
泄露的系统提示词(System Prompt)显示,该AI可以被配置为隐藏身份参与开源项目或公共事务,其硬性指令明确写道:“You are operating UNDERCOVER. Your commit messages MUST NOT contain ANY Anthropic-internal information. Do not blow your cover.”(你正在卧底行动中。你的提交信息绝不能包含任何Anthropic内部信息。不要暴露你的伪装。)
引发的争议
这一发现瞬间引爆了社区对于"互联网上到底有多少代码和评论是由伪装的AI特工生成的"巨大争议。它引发了关于AI伦理、透明度和供应链安全的深刻讨论。
相关概念
- [[claude-code]] — 泄露该模式的产品
- [[anthropic]] — 开发者
- [[ai-武器化]] — 相关的伦理担忧