点击右上角微信好友

朋友圈

请使用浏览器分享功能进行分享

正在阅读:“十五五”新质奔涌丨深化数据科技创新 以高质量数据集驱动人工智能创新发展
首页> 经济频道> 光明独家> 重点策划 > 正文

“十五五”新质奔涌丨深化数据科技创新 以高质量数据集驱动人工智能创新发展

来源:光明网2026-02-09 18:02

  编者按:2025年10月20日到23日,中国共产党第二十届中央委员会第四次全体会议在北京举行。全会审议通过了《中共中央关于制定国民经济和社会发展第十五个五年规划的建议》(以下简称“‘十五五’规划建议”)。对此,光明网采访业内权威专家,推出系列解读稿件,邀请专家围绕“十五五”规划建议的核心内容展开系统阐释、结合实践案例答疑解惑,为读者精准解读“十五五”规划建议背后的发展逻辑与实践路径。

 

  作者:

上海人工智能实验室科研规划中心高级主管,浙江大学博士后、博士 董思怡

上海人工智能实验室科研规划中心负责人,清华大学博士 邱磊

  数据正在成为新一轮科技革命与产业变革的关键战略资源。中美在人工智能领域的竞争,正在从早期的算法能力与算力规模,逐步演进为以高质量数据为核心要素的系统性竞争。这不仅是一场技术赛跑,更关乎未来国际科技格局的重塑。国务院印发《关于深入实施“人工智能+”行动的意见》提出要“持续加强人工智能高质量数据集建设”,重点强调了打造高质量科学数据集。面对历史性机遇,以高质量数据集驱动人工智能创新发展,将成为“十五五”时期支撑人工智能原创性突破和规模化应用的重要“燃料”。

  高质量数据成为中美AI竞争的下一个高地

  从中美布局看,数据上升为国家级战略资产。中美两国均将数据视为人工智能与科技创新的基础性、战略性资源,并通过持续演进的政策规划推动数据由量向质转变。美通过国家人工智能研究资源(NAIRR)等机制,系统性整合科学数据、算力、模型与实验设施,为学术界和产业界提供统一、可复用的研究基础。2025年11月24日美正式启动“创世纪计划(Genesis Mission)”,并将此计划定位为“自阿波罗计划以来最大规模的联邦科学资源集结”,强化数据在科研范式变革中的核心作用。中国从“数据要素×”到“人工智能+”行动部署,确定了以数据为代表的新型生产要素和以人工智能为代表的前沿创新技术的关键作用。两者融合协同,逐步形成了以高质量数据集建设和现代化数据产业体系驱动人工智能发展的创新格局,成为加快形成新质生产力的重要引擎。

  从产业生态看,高质量数据集价值持续释放。数据已贯穿人工智能产业发展的全生命周期,包括数据采集、清洗治理、标注加工、标准化管理、流通交易及模型训练与应用落地。数据质量直接影响模型性能和应用可靠性,是决定人工智能“能不能用、好不好用”的关键变量之一。2025年,我国已建设高质量数据集超10万个,规模超890PB(拍字节),部署了140项先行先试任务,但仍面临数据产权、质量与定价机制有待完善、流通交易活跃度有待提升等挑战。实现高质量数据集的规模化、专业化供给亟须制度与市场协同发力。

  从重点领域看,科学数据对AI4S的价值日益凸显。AI4S(人工智能赋能科学研究)作为人工智能与基础科学深度融合的核心场景,其发展高度依赖高质量科学数据的支撑。当前,美西方国家与中国均在AI4S领域加大科学数据布局,在生命科学、新材料、能源与气候模拟等领域持续推动科学研究范式变革,取得一系列突破性进展。以蛋白质结构研究为例,国际蛋白质数据银行(PDB)、英国生物样本库(UKB)等科学数据库,为后续基于深度学习的结构预测模型提供了关键训练数据基础,显著加速了科学发现与工程应用转化。我国已有科学数据银行(ScienceDB),专注提供符合主流数据标准或惯例的高质量科学数据。但当前科学数据多由湿实验环境收集,未针对多模态、跨尺度等需求进行预处理与结构化改造,难以直接用于科学推理,AI就绪程度(AI-ready)有待加强。

  以高质量数据集驱动AI创新发展的策略

  面对全球数字竞争的新形势和我国高质量发展的内在需求,应立足高质量数据集的核心价值,从基础制度建设、市场生态培育、重点领域赋能三个维度,制定针对性发展策略,推动高质量数据集与人工智能深度融合,抢占全球AI竞争制高点,助力“十五五”时期人工智能产业实现跨越式发展。

  夯实高质量数据集建设基础,完善制度、标准与工具体系。一是加快建设统一、规范、开放的数据市场制度体系,围绕数据产权、授权运营、流通交易、估值定价、质量管理、安全治理等关键环节建立制度框架,为数据开发利用提供稳定市场环境。二是加快制定并推广数据质量与元数据标准,重点对科学数据和产业数据统一规范,将数据管理计划和数据质量要求纳入科研项目和重大工程的全过程管理。三是支持数据治理和质量评测工具研发,通过量化数据集质量等级与AI模型性能提升的关联关系,用对AI模型贡献度量化数据价值。例如上海人工智能实验室研发的OpenDataArena开放数据竞技场,作为全球首个数据评估平台,平台已覆盖4个以上专业领域,完成20多项基准测试,支持超过20种数据评分维度。四是深化数据领域国际合作。积极参与全球数据领域科技治理,加强数据领域的国际标准制定与引领,稳妥推进国际科学数据和产业数据合作,提升我国在全球数据科技创新中的参与度和话语权。

  完善数据流通服务体系,打造专业化数据市场生态。数据流通服务机构作为链接数据供需、促进数据流通交易、推进数据要素市场化价值化的重要主体,是高质量数据集的关键组织者。一是不断健全和畅通公共数据资源授权运营机制,鼓励有条件的数据商通过授权运营等方式,利用公共数据资源建设高质量数据集。二是持续深化数据流通服务机构的专业化分工,适配人工智能发展需求提供数据治理与模型训练等服务,实现高质量数据集的加工、处理并稳定输出,提升其可用性。三是探索多样化数据流通交易模式,突破传统交易范式的局限,提出符合人工智能产业实际的数据交换方式和价值实现路径,以激发高质量数据集的可持续供给。

  以高质量数据集赋能科学重点领域,服务国家重大战略需求。“十五五”规划提出要加快人工智能等数智技术创新,全面实施“人工智能+”行动,以人工智能引领科研范式变革,加速“从0到1”科学发现。围绕“十五五”时期国家科技与产业发展重点,将高质量数据集作为人工智能赋能实体经济和前沿科学的重要抓手。一是将科学数据资源建设纳入国家科研基础设施整体布局,推动重大科研设施、国家实验室数据的分级开放与合规共享。二是在生命科学、材料化学、能源与环境等领域,布局“数据+模型+应用”的示范工程,形成可复制、可推广的应用范式。三是通过科研资助政策,引导产学研合作中形成稳定的数据共享和成果转化机制。

  策划:赵刚

  文字整理:刘晗旭

[ 责编:杨亚楠 ]
阅读剩余全文(

相关阅读

您此时的心情

光明云投
新闻表情排行 /
  • 开心
     
    0
  • 难过
     
    0
  • 点赞
     
    0
  • 飘过
     
    0

视觉焦点

  • 习近平在北京考察科技创新工作

  • 从地方两会看开局之年谋篇布局

独家策划

推荐阅读
工业和信息化部等五部门近日印发《关于加强信息通信业能力建设支撑低空基础设施发展的实施意见》。加强监管能力体系建设,规划无人机专用号段,推动“一机一码一号”能力建设,探索标识解析在无人机领域的应用,形成无人机通信资源精细化管理。
2026-02-11 09:25
全球森林逐渐被快生树木主导,而稳定生态系统的慢生树种正在消失。“我们关注的是极为独特的物种,它们主要集中在生物多样性丰富、生态系统联系紧密的热带和亚热带地区。“此外,在现在和未来受到干扰的地区,非本地物种可能会加剧对光、水和养分的竞争,从而使本地树木更难生存。
2026-02-11 09:32
中国科学院动物研究所研究员王红梅带领的“灵长类胚胎发育的规律解析与体外模拟团队”,用27年的接力攻坚,把灵长类早期胚胎发育这个看不见、摸不着的“黑匣子”,变成了清晰可见的“生命剧本”。
2026-02-11 09:32
截至1月28日,“横竖都是世界第一”的贵州花江峡谷大桥累计接待游客突破130万人次,通行车辆超20万辆次,持续为区域发展注入新动能。大桥带来的发展溢出效应令人瞩目,而深入大桥肌理探查,你会发现,支撑起这座庞然大物的每根细钢丝,全部都是“中国造”。
2026-02-11 09:31
针对常见的饮食误区,杨爱明特别提醒,不建议采用“不吃主食”或“用水果代替主食”的方法来控制体重。对于肠胃功能较弱的人群,应避免过冷、过烫、过辣、过咸食物的刺激,切忌暴饮暴食,并尽量保持规律的进餐时间,以防加重原有胃肠问题。
2026-02-11 09:24
近日,市场监管总局(国家标准委)批准发布《中医体质分类与判定》推荐性国家标准。
2026-02-10 09:44
聚集相关企业300余家,机器人产业链规模超百亿元……北京亦庄,为何扎堆这么多机器人企业?
2026-02-10 09:42
“十四五”时期,我国全社会研发经费投入年均增长10%,研发经费投入强度提高0.44个百分点。
2026-02-10 09:41
日前,我科研团队在国际学术期刊《科学》发表论文《多尺度泛基因组图谱赋能混合倍性甘蔗的基因组解析》,为甘蔗高产优质育种提供了全新“基因资源地图”与核心分析工具。
2026-02-10 09:34
日前,南海区域海-气双向耦合智能大模型“飞鱼-1.0”在广东广州正式发布。“
2026-02-10 09:33
蓝天、绿林、碧水、清波……冬日的广东东莞松山湖科学城,温暖、惬意。
2026-02-09 10:00
这声呼唤,穿越漫长岁月,凝结着人类对这位地球近邻永恒的好奇与梦想。而今,随着新一轮探月热潮在全球兴起,这句“去月球”已不再仅仅是浪漫的诗意表达,更成为科技前沿竞相追逐、国家实力与创新精神交汇的生动实践。
2026-02-09 09:57
特种机器人技术与数智系统创新团队成员张平点击一键启动指令后,雷达驱动、定位算法、规划与控制算法等模块被加载。在系统支持下,无人机能够精准定位、自主导航与实时避障,像一位不知疲倦的巡检员。
2026-02-09 09:53
深耕西南高原山区二十余载,于富强与真菌为伴,在种质资源保护与产业富民之间架起桥梁,把论文写进泥土中,把科研做进农户的大棚里。3年间,于富强往返昆明与水城数十趟,硬是帮着水城从零起步,建成了食用菌研究所、日产50万袋的菌种厂和鲜菇冷链物流集散中心。
2026-02-09 09:53
研究团队将这一环境效应与黑洞双星轨道偏心率的演化同时纳入统一模型,并将理论预测与北美纳赫兹引力波天文台合作组15年的观测数据进行对比分析。陈一帆表示,尽管当前的不确定性仍然较大,但该研究已经表明,引力波观测开始携带关于星系中心环境的可测信息。
2026-02-09 09:53
近日,国家管网集团西部管道公司成功完成所辖新疆段天然气、原油、成品油管道输送全生命周期碳足迹核算,获得中国质量认证中心颁发的“产品碳足迹证书”。
2026-02-06 09:18
近日,中国农业科学院蔬菜花卉研究所蔬菜分子设计育种创新团队研发出新型植物基因研究工具——对目标DNA序列的邻近空间蛋白标记系统。
2026-02-06 09:38
因为像了解自己的孩子一样了解黑土地,韩晓增有个外号——“黑土地的营养搭配师”。他带领团队精心配制出一套营养搭配的“秘方”。
2026-02-06 09:33
蚊种与病毒之间存在高度匹配关系。1901年,公共卫生与热带医学领域先驱沃尔特·里德证明,蚊子是传播黄热病的元凶。科学界传统观点认为,病毒以颗粒形式在蚊子体内传播,却始终不知道真正的“病毒受体”是什么。
2026-02-06 09:31
科技创新和产业创新的深度融合,不仅是构建现代化产业体系的战略举措,更是贯彻新发展理念、推动高质量发展、加快构建新发展格局的重要抓手。
2026-02-06 09:13
加载更多