LLaMA 3.3-70B

LLaMA 3.3-70B

概述

LLaMA 3.3-70B是Meta开发的开源大语言模型，拥有700亿参数。在[[AI自我偏好 (AI Self-preferencing)]]的研究中，LLaMA 3.3-70B是测试模型之一，表现出显著的自我偏好倾向。

在AI自我偏好研究中的表现

在"简历对应实验"中，LLaMA 3.3-70B作为评估者时更倾向于选择自己生成的简历摘要
自我偏好率：79%（在未干预的情况下）
通过多模型多数投票缓解后，自我偏好率降至23%
缓解效果显著，表明多模型交叉评估对开源模型同样有效