高质量数据集
高质量数据集被官方明确为AI大模型的"核心燃料",是数据要素价值释放的关键环节。在2026年"两会"期间,国家数据局将其作为推动数据要素市场发展的核心抓手。
战略地位
- 核心燃料:在"十五五"规划纲要草案中,数据要素被赋予"核心燃料"的战略地位,高质量数据集是其具体实现形式。
- 政策支持:官方明确支持建设国家级、行业级高质量语料库和数据集,为通用大模型及垂直行业大模型提供合规、高价值的数据支持。
建设方向
- 国家级数据集:建设覆盖多领域、多模态的国家级高质量语料库。
- 行业级数据集:针对垂直行业(如医疗、金融、交通、工业)建设专业化数据集。
- 合规与价值:确保数据来源合规、标注准确、价值密度高。
市场影响
- 数据商崛起:截至2026年初,中国已培育出一批年产值超50亿元的数据商。
- 交易活跃:上海、深圳数据交易所成交额保持高位,交通、金融数据产品占比超过55%。
相关页面
- [[数据要素]]
- [[2026年数据要素价值释放年]]
- [[公共数据授权运营]]
- [[国家数据局]]
- [[数据商]]