数据来源溯源
数据来源溯源(Data Provenance)是指追踪数据来源和创建历史的技术和实践。在AI领域,它被视为解决[[模型坍缩]]问题的关键,也是未来最有价值的资产。
核心价值
数据质量保证
- 清晰标识人类原创数据(Human-Authored)
- 区分AI生成数据与人类数据
- 确保训练数据的真实性和多样性
资产价值
- 具备清晰人类来源标识的数据价格在2026年2月上涨了300%
- 数据血统成为比算力更有价值的资产
与模型坍缩的关系
[[模型坍缩]]的解决方案(“累积+抽样"策略和"动态熵过滤”)依赖于对数据来源的精确追踪和分类。
相关页面
- [[模型坍缩]] — 核心应用场景
- [[物理ai]] — 数据质量对Physical AI的影响