幽灵数据
幽灵数据是[[冰山之下-解锁生成式AI在制造业的真正力量-2026-02-09]]中提出的概念,指代那些未经结构化、充满噪声的"脏数据",会导致AI模型产生误导性结果,浪费时间和资源。
核心警告
- 跳过数据基础工作,AI输出就会退化为不可靠的"噪声"。
- “见过工厂在幽灵数据上烧掉数周时间”——来自帖子回复的真实警告。
- AI无法"神奇地"清理脏数据——必须先结构化数据。
与现有维基的连接
该概念强化了[[工业数据治理]]的重要性,强调数据治理不仅是合规要求,更是释放Gen AI价值的前提。