扩散模型（Diffusion Models）

一种通过从噪声中逐步生成数据（如图像、视频）的生成式AI模型。主流实现包括Stable Diffusion Video和OpenAI的Sora模型。其生成过程：从文本提示开始，使用Transformer架构编码语义，然后通过U-Net结构去噪生成像素。帧间连贯性依赖于光学流算法。

扩散模型存在固有缺陷：在生成人群场景时，由于训练数据集（如LAION-5B）的偏差，AI倾向于复用相似面部和姿态，导致"重复模式"artifact。这正是[[中道改革連合]]视频误认事件中用户质疑的技术基础。