点击右上角
微信好友
朋友圈

请使用浏览器分享功能进行分享

光明网讯(记者 刘晗旭)2026年的春天,“十五五”开局之年的全国两会如期召开。今年的政府工作报告明确提出“深化数据资源开发利用,健全数据要素基础制度,建设高质量数据集”,同时将“深入推进数字中国建设,数字经济核心产业增加值占国内生产总值比重达到12.5%”列入“十五五”发展的重大战略任务。
当算力通过“东数西算”工程日益集约高效,当算法通过DeepSeek等创新实现“平权”,制约人工智能进一步发展的关键,正从“怎么算”悄然转向“用什么算”。数据,正迎来一场关于“质量”与“活化”的大考。
数据的“觉醒时刻”
“它让沉睡的数据火起来了。”全国人大代表、华中科技大学副校长冯丹在接受记者采访时,用一句话概括了人工智能与数据双向赋能的精髓 。
然而,现状并不乐观。中国人工智能产业发展联盟的测试数据指出,智能体在处理超过72小时的连续任务时,记忆能力下降幅度超过60%。冯丹代表在调研中发现,传统的数据平台往往习惯于“等待人来查询”,如同一个被动的仓库管理员。然而,在“人工智能+”时代,智能体需要的是能主动进行“关联思考”和“知识供给”的数据基座。当前的平台设计逻辑,正面临着从“服务于人的查阅”到“服务于AI的认知”的深刻转变。
“十五五”规划《纲要(草案)》提出要“强化算力算法数据高效供给”,并强调“深化数据资源开发利用”。在国研新经济研究院创始院长朱克力看来,“高质量数据集”首次写入政府工作报告,标志着数据要素开发利用进入了精细化、标准化的新阶段 。过去散、乱、低的数据资源,必须经过精加工,才能成为AI吃得下的“精细口粮”。
破解“数据孤岛”与“记忆短板”
数据不仅要“有”,还要“流得动”“存得久”。中国科学院大学经济与管理学院教授孙毅指出,数据是智能经济发展的基础资源和关键要素,只有流动才能创造价值,只有合规才能确保安全。在冯丹代表看来,行业大模型要落地,面临的首要难题就是行业数据供给不足,且呈现碎片化。“我们在调研中发现,企业要做大模型训练,数据基本上是“孤岛”的,还要自己进行清洗、规整,效率极低。”
为此,冯丹代表在今年两会带来了《关于实施高质量数据集设施化专项工程的建议》。她提出建设“数据工厂”的构想——通过国家层面的专项工程,将这些孤岛数据汇集起来,进行标准化地清洗、标记和规整,在保障安全与隐私的前提下,实现高效共享。这正呼应了政府工作报告中“健全数据要素基础制度”的要求。
同时,针对智能体的“记忆短板”,冯丹提交了《关于加快发展高质量数据平台,构建人工智能新基座的建议》。她解释,未来的数据平台不能只是冷存储,而要像人类大脑一样,具备关联查询和常识记忆的能力。“我们需要通过向量数据库、知识图谱等新技术,让数据平台不仅存得快,还能‘思考’,让智能体拥有长期记忆。”
夯实“数智新基座”
如果说数据是燃料,算法是引擎,那么存储就是承载这一切的“油箱”和“输油管”。在《关于建立和发展数据存储产业链的建议》中,冯丹代表指出,存储产业已从简单的数据存放,升级为事关国家战略的“数智新基座”。
从蓝图到现实,智能基座正在加速落地。位于察哈尔工业园区巴音大数据产业园的博大数据内蒙古乌兰察布智算基地,地处“东数西算”八大枢纽之一——内蒙古枢纽核心区,是京津冀蒙经济圈的重要算力枢纽。按国标A级标准建设,整体IT装机容量达150MW,并规划实现100%绿色电力供应。该项目将夯实京津冀蒙算力调度走廊,助力打造“草原云谷”名片,目前已与国内头部互联网公司签订长期服务合同,成为“存算协同”赋能数字经济的鲜活样本。
“十五五”规划《纲要(草案)》明确提出要培育壮大“新兴支柱产业”,其中集成电路被列为面向中期的重点打造领域 。国家信息中心研究员朱幼平分析指出,与战略性新兴产业相比,新兴支柱产业更强调成熟度和支撑作用;与未来产业相比,更看重当下的落地转化。冯丹对此深有感触:“我国存储产业链经过20多年发展,从芯片到系统已实现三级突破,但核心技术与高端产品对外依存度依然存在,产业生态呈现碎片化。”她建议,实施“存储强国”重大科技工程,建立国家级产学研用创新平台,通过解决企业真问题,培养出更多能攻克“卡脖子”技术的高端人才。
“中国存储已成为全球科技竞争新名片。” 冯丹说道。 站在“十五五”的起点,只有让每一比特数据都存储在安全的基座上,让每一份高质量数据集都成为智能的源泉,才能真正实现从“数据大国”向“数据强国”的跨越,这既是两会代表委员的共同期待,更是数字中国建设面向未来的坚定回答。
