二进制视觉Token

二进制视觉Token

二进制视觉Token

二进制视觉Token(Binary Visual Tokens)是一种将图像表示为二进制而非连续向量的编码方式,用于自回归图像生成模型。BitDance论文提出的该方法,相比于传统的连续向量,在保持高清画质的同时将推理速度提升了约4倍。这标志着图像生成领域开始向极简编码转型,通过降低每个Token的信息密度来大幅提升生成效率。

分享到