AI-Ready 数据基础设施
定义
AI-Ready数据基础设施是指满足"易发现、受治理、可重用且适合AI处理"四大先决条件的数据存储和管理系统。NetApp提出,缺乏AI-Ready数据基础设施将导致大量AI科研与工程项目失败。
四大先决条件
- 易发现(Discoverable):数据能够被AI系统和研究人员轻松发现和定位。
- 受治理(Governed):数据有明确的管理规则、权限控制和合规保障。
- 可重用(Reusable):数据能够在不同项目和场景中被重复使用。
- 适合AI处理(AI-Ready):数据格式、标注和质量满足AI模型训练和推理的要求。
重要性
- AI for Science的生命线:NetApp提出警告,到2026年底,如果缺乏AI-Ready数据底层支持,高达60%的AI科研与工程项目将被迫终止。
- 新一代存储架构:促使全新一代解耦式、超高吞吐量的AI存储基础设施加速落地。
与现有概念的关系
- [[AI for Science]] — AI-Ready数据基础设施是AI for Science成功的关键瓶颈
- [[数据要素]] — AI-Ready数据基础设施是数据要素价值释放的技术基础
- [[工业智能]] — AI-Ready数据基础设施是工业智能项目成功的前提条件