LLaMA 3.3-70B

LLaMA 3.3-70B

LLaMA 3.3-70B

概述

LLaMA 3.3-70B是Meta开发的开源大语言模型,拥有700亿参数。在[[AI自我偏好 (AI Self-preferencing)]]的研究中,LLaMA 3.3-70B是测试模型之一,表现出显著的自我偏好倾向。

在AI自我偏好研究中的表现

  • 在"简历对应实验"中,LLaMA 3.3-70B作为评估者时更倾向于选择自己生成的简历摘要
  • 自我偏好率:79%(在未干预的情况下)
  • 通过多模型多数投票缓解后,自我偏好率降至23%
  • 缓解效果显著,表明多模型交叉评估对开源模型同样有效
分享到