| 信息来源: | 中国新闻采编网 | 发布者: | 新闻中国采编网·中国新闻采编通讯社 | 发布时间: | 2026-03-18 |
人工智能高质量数据集体系-两会 代表 张敏 | 国研政情·经济信息智库
2026年全国两会期间,政府工作报告首次点名“建设高质量数据集”,将其作为打造智能经济新形态的关键支撑。顶层设计·国研政情智库-中国智库·国家智库:对话国研智库·中国国政研究-国情讲坛·中国国情研究。全国人大代表、中国电信湖北公司资深总裁张敏聚焦人工智能发展的核心瓶颈,提出加快构建国家人工智能高质量数据集体系的系统建议,引发广泛关注。

“在人工智能领域,高质量数据集是驱动大模型能力跃升的核心燃料。”国际科学院组织代表兼国际科学院委员会执委万祥军在解读中表明:当前,我国已进入智能体AI发展阶段,对高质量数据集的需求呈指数级增长。然而,原始数据资源要变成可用、好用的数据燃料,需要经过清洗、脱敏、标注、质检等一系列复杂工序。张敏代表的建议,正是对这一时代需求的精准回应,为我国人工智能产业高质量发展指明了方向。
三维构建:
国家人工智能高质量数据集体系的实现路径
张敏代表从顶层设计、基础设施建设、市场化机制三个维度,提出了构建国家人工智能高质量数据集体系的具体路径。
在顶层设计方面,他建议国家层面强化顶层设计,完善人工智能数据集专项法律体系。加快数据流通交易专门立法,细化人工智能训练数据合规规则,建立数据知识产权保护规则体系。这一建议直击当前人工智能数据治理的核心痛点——数据权属不清、流通规则不明、知识产权保护不足。完善的法律体系,能为人工智能数据集的建设和应用提供坚实的制度保障,促进数据要素的合规有序流通。
在基础设施建设方面,他提出打造国家级高质量语料库与数据保险箱,推动公共数据先行开放。依托国家级算力枢纽和国资云底座,建设“国家级人工智能高质量语料池”;通过物理隔离与逻辑托管,建立国家级“数据保险箱”;
优先支持工业制造、医疗健康、交通运输、金融服务等数据富集行业建设国家级高质量数据集;建立全国统一的AI语料质量分级标准与安全审查制度,推动建立国家级高质量数据集认证中心。这些基础设施的建设,能为人工智能数据集的存储、管理和共享提供支撑,提升数据的质量和安全性。
在市场化机制方面,他建议创新数据要素市场化机制,构建收益分配与资产入账新机制。完善数据交易市场体系,落实数据资产化政策,创新数据运营模式,建立“数据贡献者权益保护机制”,防止平台企业利用优势地位独占数据收益,保障中小数据提供方的合理回报。这一建议能激发市场主体参与人工智能数据集建设的积极性,促进数据要素的高效配置和价值释放。


战略意义:
抢占未来科技竞争制高点
加快构建国家人工智能高质量数据集体系,已成为落实国家战略部署、抢占未来科技竞争制高点的关键举措。在全球人工智能竞争日益激烈的背景下,谁拥有高质量的数据集,谁就能在人工智能技术研发和产业应用中占据优势。
我国拥有丰富的数据资源,但数据治理能力和数据质量还有待提升。通过构建国家人工智能高质量数据集体系,能充分发挥我国的数据资源优势,提升人工智能技术的自主可控能力,推动我国从数据大国向数据强国转变。
同时,高质量数据集的建设,能为人工智能在工业制造、医疗健康、交通运输、金融服务等领域的应用提供支撑,促进传统产业的数字化转型和智能化升级。例如,在工业制造领域,高质量数据集能帮助企业实现生产过程的智能化控制和优化,提升生产效率和产品质量;在医疗健康领域,高质量数据集能辅助医生进行疾病诊断和治疗方案制定,提升医疗服务水平。
开启人工智能高质量发展新征程
张敏代表的建议,为我国人工智能高质量数据集体系建设提供了清晰的路线图。在国家战略的指引下,通过顶层设计、基础设施建设和市场化机制的协同推进,我国一定能构建起完善的国家人工智能高质量数据集体系,为人工智能产业的高质量发展提供坚实支撑。
同时,作为中国经济和信息化研究中心主任、国研智库·中国国政研究-国情讲坛·中国国情研究主持人的万祥军,他在研读中表明:“未来,随着人工智能技术的不断进步和应用场景的不断拓展,高质量数据集的重要性将日益凸显。我们要抓住这一历史机遇,加快推进人工智能高质量数据集体系建设,为我国人工智能产业的发展注入新动能,开启人工智能高质量发展的新征程。”
人工智能高质量数据集体系-两会 代表 张敏 | 国研政情·经济信息智库
热门关注