首页 > 新闻动态 > 行业资讯

行业资讯
国家数据集管理服务平台正式发布
发布时间:2026-05-08 09:50:48

  日前,国家数据集管理服务平台在数字中国建设峰会上正式发布,并启动试运行,标志着我国高质量数据集建设工作迈入集约化管理新阶段。

  据悉,国家数据集管理服务平台由国家数据局指导、国家数据发展研究院建设和运营,以数据集目录汇聚为基础,构建“物理分散、逻辑集中”的数据集管理体系,提供覆盖数据集全生命周期的公共服务能力,进一步促进高质量数据集有效供给,繁荣产业生态。

  平台服务三类核心用户,一是向数据管理部门提供数据集目录管理、建设情况监测等功能,提升数据集管理效能;二是向数据集供给方提供数据集发布、凭证申领、质量测评等功能,赋能高质量数据集建设;三是向数据集需求方提供查询检索、需求发布等功能,加快数据集流通利用。

  目前,平台已开放供需发布、全域检索、凭证申领等基本功能,并与国家数据基础设施以及安徽省等地方平台完成对接。截至发布当日,平台已认证供需主体200余家,发布数据集1000余个。

  当前,人工智能正处于从“可用”迈向“好用”的关键跃升期,高质量数据集作为大模型训练的“基石”,其供给规模和质量直接决定了人工智能创新高度和产业落地深度。

  根据国家数据局发布的数据,目前我国高质量数据集建设工作取得显著成效。截至2025年底,全国已建成的高质量数据集超过了10万个,总体量超过890PB;到今年3月,我国日均Token的调用量超过140万亿。

  国家数据发展研究院副院长袁军在接受记者采访时表示,我国高质量数据集客观上仍面临三大痛点:一是建设主体分散,导致数据管理部门难以全面掌握资源底数与建设进展;二是供给侧信息不对称,容易出现重复建设、质量参差不齐等问题;三是需求侧获取成本高、周期长,限制技术创新效率。

  “此次发布的平台既不是简单的政府监管工具,也不是新的数据交易场所,而是一个覆盖高质量数据集全生命周期的国家级公共服务基础设施。”袁军表示,平台采用“物理分散、逻辑集中”的汇聚模式,构建全国统一的数据集资源目录与管理体系,推动高质量数据集供得出、流得动、用得好,实现全国“底数一本账、调度一盘棋、协作一张网”的工作格局,为人工智能国家战略提供坚实的数据支撑。

  袁军表示,国家数据集管理服务平台的正式发布,将有效破解高质量数据集建设痛点、打通供需流通堵点,为人工智能应用注入强劲动能。通过持续迭代优化、深化开放协同,全力服务国家人工智能战略,让数据要素更好赋能产业发展、支撑数字中国建设。

  袁军介绍,下一步,将持续扩大用户规模,广泛调动各类重点供需主体,快速提升用户与资源规模。到2026年底,全面建成覆盖数据集全生命周期、贯通各地区各部门的一体化管理服务体系,向人工智能核心领域与重点行业不断延伸,并与地方和行业相关平台全面对接,实现资源全域汇聚、供需高效匹配、管理精准智能、安全可信可控,打造质量可测、权益可保、供需可通的良性生态,成为数据要素赋能人工智能创新发展的国家级枢纽。(苏德悦)

来源:人民邮电报