扩散模型(Diffusion Models)
一种通过从噪声中逐步生成数据(如图像、视频)的生成式AI模型。主流实现包括Stable Diffusion Video和OpenAI的Sora模型。其生成过程:从文本提示开始,使用Transformer架构编码语义,然后通过U-Net结构去噪生成像素。帧间连贯性依赖于光学流算法。
扩散模型存在固有缺陷:在生成人群场景时,由于训练数据集(如LAION-5B)的偏差,AI倾向于复用相似面部和姿态,导致"重复模式"artifact。这正是[[中道改革連合]]视频误认事件中用户质疑的技术基础。