《高质量数据集质量评测规范》(TC609-5-2025-04) 深度解读

《高质量数据集质量评测规范》(TC609-5-2025-04) 是全国数据标准化技术委员会 (TC609) 于 2025 年 8 月 29 日发布实施的技术文件，为人工智能领域高质量数据集的质量评估提供了统一标准框架。该规范首次明确了 "高质量数据集" 的定义与三维度 (说明文档、数据质量、模型应用) 评估体系，对推动 AI 模型开发和训练的标准化具有里程碑意义。

一、规范背景与核心定位

1. 发布背景

人工智能加速赋能实体经济，数据集作为 AI 模型开发训练的基础，质量要求日益提高
国内高质量数据集质量评测缺乏统一标准，导致评估混乱、质量参差不齐
旨在 "以评促建"，提升数据集优质供给，促进流通使用，支撑 AI 模型高质量发展

2. 核心定位

明确高质量数据集定义：经过采集、加工等处理，可直接用于开发和训练 AI 模型，能有效提升模型性能的数据集合
适用范围：规范高质量数据集的质量评测，为组织机构开展评测工作提供指导
与系列标准协同：与《高质量数据集建设指南》《分类指南》等共同构成完整标准体系

二、三维度指标体系框架（核心创新）

规范构建了三位一体的质量评估体系，要求三个维度均需达到90 分及以上方可认定为高质量数据集，任一指标不达标即被否决。

维度	核心目标	子指标数量	权重建议	核心要求
说明文档	确保数据集可理解、可追溯、可应用	4	各 0.25	完整记录数据集基本信息、内容特征、建设过程和应用说明
数据质量	保障数据本身符合 AI 模型开发基本要求	8	各 0.125	格式规范、安全合规、标注规范、结构完整、内容真实等
模型应用	验证数据集对 AI 模型的实际价值	5	各 0.2	内容多样、规模完整、时效达标、标注准确、模型适配

三、详细指标解读

1. 说明文档指标（4 个子指标）

子指标	核心要求	评估要点	计算方法
基本信息完整性	包含规模、格式、结构、访问渠道、技术支持	数据集规模 (样本数 / 存储体积)、格式规范、文件结构、访问方式、技术支持	X=A/B（A: 满足方面数，B: 总方面数）
内容特征完整性	包含模态类型、数据分布、标签统计、样本示例、局限性	模态类型 (文本 / 图像 / 视频等)、数据分布情况、标签类别统计、样本示例、局限性说明	X=A/B
建设过程完整性	包含来源、采集方法、加工流程、标注规范、版本控制	数据来源 (公开 / 私有 / 生成)、采集方法、加工处理流程、标注规范、版本控制记录	X=A/B
应用说明完整性	包含许可、场景、评估方法、基准测试、案例	使用许可 (开源 / 商用)、目标应用场景、评估方法、基准测试结果、典型应用案例	X=A/B

评分规则：百分制，各子指标权重可调整，建议各 0.25，总分≥90 分合格

2. 数据质量指标（8 个子指标）

子指标	核心要求	评估要点	计算方法
格式规范性	数据格式符合预定标准，可直接用于模型训练	数据格式是否符合相关标准、惯例或自定义规则	X=A/B（A: 符合标准记录数，B: 总记录数）
安全规范性	无违法违规内容，符合社会主义核心价值观	无歧视性、商业违法、侵犯权益等非法内容	X=A/B
标注规范性	标注符合预定规范，遵循标准化流程	标注是否符合相关标准或自定义规则（无监督场景不适用）	X=A/B
结构完整性	数据填充完整，缺失值在合理范围	缺失值比例是否在可接受范围内	X=A/B
内容真实性	数据真实可追溯，无未经说明的篡改	非生成数据可追溯源头，生成数据可追溯算法和过程	X=A/B
内容一致性	关联数据间语义和表达匹配	不同模态和同模态数据间内容一致	X=A/B
类型一致性	符合数据集类型要求（通识 / 行业通识 / 行业专识）	数据内容与数据集类型匹配	X=A/B
内容干净性	经严格清洗，无脏数据	不同模态有专项细则（见附录 A）	X=A/B

评分规则：百分制，各子指标权重可调整，建议各 0.125，总分≥90 分合格。无监督场景标注规范性权重为 0，其余调整

内容干净性专项细则（附录 A）：针对文本、图像、视频、音频等不同模态制定专项指标，如文本困惑度、图像分辨率、视频帧率、音频信噪比等

3. 模型应用指标（5 个子指标）

子指标	核心要求	评估要点	计算方法
内容多样性	数据分布全面，覆盖目标场景	数据集分布覆盖范围与目标场景需求的匹配度	X=A/B（A: 实际覆盖范围，B: 需求覆盖范围）
规模完整性	数据量满足模型训练要求	数据集规模与目标场景所需规模的匹配度	X=A/B（A: 实际规模，B: 需求规模）
内容时效性	数据采集时间和更新状态符合需求	满足时间要求的数据记录比例	X=A/B（A: 符合时间要求记录数，B: 总记录数）
标注准确性	标注精准覆盖模型所需全部信息	标注信息与模型需求的匹配度（无监督场景不适用）	X=A/B（A: 标注准确记录数，B: 总记录数）
模型适配性	能有效提升模型性能	模型实际性能与预期性能的差异	X=A/B 或 B/A（取决于指标类型）

评分规则：百分制，采用特殊计算方法，模型适配性为关键指标，设置指示函数 Fm，其余子指标权重建议各 0.25，总分≥90 分合格

四、评测实施细则与操作要点

1. 评测整体流程

文档审查：评估说明文档四个维度完整性，计算得分
数据核验：抽样检查数据质量八个指标，计算得分
模型验证：使用数据集训练模型，评估五个应用指标，计算得分
综合判定：三个维度均≥90 分则认定为高质量数据集，否则不予认定

2. 关键操作要点

抽样策略：数据质量评估建议采用分层抽样，确保覆盖不同类型和来源数据
权重调整：允许根据应用场景调整各子指标权重，但需在评测报告中明确说明
无监督场景适配：标注相关指标权重设为 0，其余指标权重重新分配
模型适配性测试：建议使用目标场景主流模型进行对比测试，评估性能提升幅度
文档要求：评测报告需完整记录评测过程、指标权重、计算方法和结果，确保可追溯

五、创新点与行业价值

1. 五大核心创新

三维度评估体系：首次将说明文档、数据质量、模型应用三者并重，全面衡量数据集价值
模型驱动导向：突出 "模型适配性" 核心指标，强调数据集对模型性能的实际提升作用
全生命周期覆盖：从数据采集、加工、标注到应用的全流程质量管控
多模态适配：针对文本、图像、视频、音频等不同模态制定专项评估细则
灵活适配机制：支持权重调整和无监督场景适配，兼顾通用性与灵活性

2. 行业应用价值

数据生产者：提供明确的质量标准和评估方法，指导高质量数据集建设
模型开发者：降低数据集筛选成本，提高模型开发效率和性能稳定性
数据流通平台：建立统一的质量评估标准，促进数据集可信流通和交易
监管机构：提供标准化评估工具，助力 AI 数据治理和安全监管
行业用户：保障 AI 应用质量，降低因数据质量问题导致的业务风险

六、实施建议与注意事项

1. 实施建议

分阶段推进：先建立基础文档规范，再逐步提升数据质量，最后验证模型应用效果
工具支撑：开发自动化评估工具，提高评测效率和一致性
行业定制：结合行业特点制定专项评估细则，如医疗、金融、自动驾驶等领域
持续改进：建立数据集质量迭代机制，定期评估更新，保持高质量水平

2. 注意事项

指标权重调整：需基于业务需求和专家共识，避免主观随意调整
模型适配性评估：选择合适的基准模型和评估指标，确保结果客观可信
合规性审查：特别关注数据安全规范性，避免使用侵权或违法数据
局限性说明：数据集说明文档需如实记录局限性，避免过度宣传

总结

《高质量数据集质量评测规范》构建了科学、全面、可操作的质量评估体系，标志着我国 AI 数据集质量评估进入标准化阶段。该规范强调 "数据价值最终体现在模型性能提升上"的核心理念，通过三维度指标协同评估，确保高质量数据集不仅" 看起来好 "，更要" 用起来好 "。

对于 AI 产业而言，这一规范将有效引导数据集建设方向，提升数据供给质量，降低模型开发风险，为我国人工智能高质量发展提供坚实的数据基础保障。

原文链接 https://www.yijunzhao.cn/archives/gao-zhi-liang-shu-ju-ji-zhi-liang-ping-ce-gui-fan-tc609-5-2025-04-shen-du-jie-du

欢迎访问小易撩挨踢

https://www.yijunzhao.cn/

菜单

分享

《高质量数据集质量评测规范》(TC609-5-2025-04) 深度解读

一、规范背景与核心定位

1. 发布背景

2. 核心定位

二、三维度指标体系框架（核心创新）

三、详细指标解读

1. 说明文档指标（4 个子指标）

2. 数据质量指标（8 个子指标）

3. 模型应用指标（5 个子指标）

四、评测实施细则与操作要点

1. 评测整体流程

2. 关键操作要点

五、创新点与行业价值

1. 五大核心创新

2. 行业应用价值

六、实施建议与注意事项

1. 实施建议

2. 注意事项

总结

评论

Hermes Desktop 深度解析：Hermes Agent 的桌面伴侣

2026 年信创国产化产品名录（权威完整版）

新加坡Agnes AI三款核心模型API无限期免费：东南亚AI赛道杀出的"价格屠夫"

DeepSeek-V4-Pro 永久降价至1/4：国产大模型打响"价格战"第二枪

OpenCode爆火：17万Star！开源AI编码Agent的"顶流"是如何炼成的？

《高质量数据集分类指南》(TC609-5-2025-03) 标准规范深度解读

《高质量数据集格式要求》(TC609-5-2025-02) 标准规范深度解读

Nous Research正式发布官方桌面客户端Hermes Desktop：AI智能体有了"原生之家"