ResBM (残差瓶颈模型) ResBM (残差瓶颈模型) Macrocosmos团队发布的基于残差瓶颈模型(Residual Bottleneck Models, ResBM)的新型架构,专为低带宽流水线并行训练设计,实现了惊人的128倍激活压缩率。 学术争议 该论文在Reddit(r/MachineLearning)上引发了学术争议,部分研究人员质疑其未充分引用此前的RaBitQ研究,且在基准测试中存在单核CPU与GPU的不公平对比。 相关实体 [[macrocosmos]] — 发布团队