神经网络丛林 (Neural Thickets)

神经网络丛林 (Neural Thickets)

神经网络丛林 (Neural Thickets)

神经网络丛林(Neural Thickets)是由MIT CSAIL发布的一项理论发现。研究者发现,预训练权重的空间其实像一个"丛林",其中隐藏着无数未经激活的"任务专家"。

核心发现

  • 隐藏专家:预训练权重空间中隐藏着大量未激活的"任务专家"。
  • 随机扰动激活:通过简单的随机扰动(RandOpt),即使不进行微调,也能在特定任务中激发出超越SOTA的表现。
  • 理论支撑:为2026年的模型编辑(Model Editing)和低功耗推理提供了全新的数学理论支撑。

行业意义

神经网络丛林理论挑战了传统微调范式,为更高效的模型利用提供了新思路,可能改变AI模型的部署和使用方式。

分享到