点击右上角微信好友
朋友圈
请使用浏览器分享功能进行分享
作者:徐宁
数据作为一种记录客观物理世界与人类行为活动的载体,其数字化本质决定了其在要素开发利用过程中各个方面都具有“薛定谔的猫”的不确定性特征。具体来说,体现在权属关系、使用主体、供给形态、技术选型、价值实现等五个方面,这些属性在现实中相互依存、交织影响,成为开发利用数据要素价值必须弄清的前置条件。
一是权属关系不确定。数据产生于客观世界和人类活动,却又记载并表达于数字化设备之中。从权属关系看,这些数据要素是归活动创造者所有还是设备载体归属者所有,这本身难以明确说清。对于记录客观物理世界的数据而言,将权属归结为采集者和记录者尚能理解,但对于记录人类活动的数据,从个体权益和个人隐私的角度来看,就需要十分细致谨慎。例如,一个人的交通出行信息被互联网平台和政府有关部门所记录掌握,初始数据存储于采集部门,而记录反映的又是个体活动的情况,信息本体和记录本体不一致的情况下归属权如何确定?在归属权不确定的情况下,后面的定价、交易等环节就无从谈起,这也成为阻碍数据要素开发利用及产业化首个要解决的重要问题。
二是使用主体不确定。数据要素可以在不损耗价值的情况下被多方同时使用,具有很强的外部性和公共品特征,这是区别于土地、劳动等其他传统生产要素的鲜明特征,这导致使用主体的不确定。比如,一块土地被用于建设成公园,就不再可能同时建为住宅供人们居住。但类似于人们出行记录、购买行为等数据,则可以被多元主体根据自身需求开发使用,包括用于用户分析的商业机构、风险衡量的金融机构、学术研究的科研机构等等。该属性一方面可以无限扩展开发使用数据要素的想象空间,促使其使用价值在多维场景下得到实现,极大提升了资源利用效率并促进创新;但从另一方面来说,随着使用场景的不断拓展,数据定价、交易的复杂程度可能呈指数级增长。
三是供给形态不确定。土地、劳动等传统要素受限于物理形态制约,其供给形态有限且固定,存在开发利用的机会成本问题。而数据不存在该问题:一方面,数据几乎可零成本无限供给,只要数字化设备采集不停,供给可持续无上限;另一方面,生成的数据可通过数字介质进行无限复制和传播,也可以根据需求进行删改、计算、加工。在暂不考虑权属关系和隐私保护等因素的影响下,这种无限供给和多重形态的特性使得数据要素形态各异,各需求主体结合自身需求,都可以任意对数据进行开发利用。从供求关系来说,数据要素具备无限想象空间和无穷市场容量,并且不同开发形式和需求之间也不存在竞争,这形成了截然不同的经济学理论范式。
四是技术选型不确定。数据天然依赖数字技术,可以说,数据要素和数字技术就是一个硬币的两面,这也跟其他生产要素截然不同。数字技术贯穿于数据的采集、存储、传输、计算、分析、应用、安全等全生命周期各环节,主要包括云计算、大数据、人工智能、区块链等。其中,最近迅猛发展的人工智能,大幅度提升了人们开发利用数据要素的效率和智能化程度,成为数据产业发展的关键性技术。然而,使用什么样的技术来对数据要素进行开发利用?这个问题本身也存在很大不确定性,高度依赖于数据的应用场景。例如,在运用AI大模型进行各种文本知识处理时,用于法律判决和社科研究这两个不同领域,在调参、算法等具体技术上就会存在较大差异,选择DeepSeek、豆包、元宝等哪个大模型能力也需要根据要求有所考虑。最后需要说明的是,由于数据对技术高度依赖,一个国家或区域数字技术的发达程度决定了其数据产业的发达程度,科教资源发达、数字人才集聚的地方具备发展数据产业的天然优势,但其中需要着重解决如何根据需求场景更好将技术能力落地转化应用的问题。
五是价值实现不确定。生产要素的价值开发都依赖于应用场景,与其他要素不同的是,数据从产生到价值实现全流程都对场景高度依赖,再叠加上其低成本无限供给及形态多变的特性,就决定了数据价值高度复杂性和实现的不确定性。其一,同一时空的数据价值多元,不同场景下差异巨大。例如,医疗影像数据对于医院而言几乎没什么再利用价值,而对于药品研发或者科研机构则具有重大价值。其二,从理论上讲,数据可以被无限拆分、随意组合或深入演算,每一次的形态变化都将产生投入和成本,其价值也将随之发生改变。其三,由于数据在确权、交易、定价等环节中均不明确,其价值复杂性就贯穿于整个生命周期,并且其价值未必直接体现在数据本身,而是基于应用场景的使用方式。由此可以推断,未来的交易对象将不再是数据本体,定价标的物可能表现为各种算法、技术、模型、工具等软硬件载体,而数据则化身为一种可供调用、读取、计算并生成结果的公有资源。
这五个方面的不确定性,决定了我们无法依照传统要素的惯性思维来开发利用数据要素。传统要素的价值实现遵照诸如“确权-核算-定价-上市-交易”的线性流程,在时间上和空间上各环节是分离的。但数据则不能这样处理,其“确权-核算-定价-上市-交易”等流程并非时空序列线性关系,也无法明确各环节的处置主体。只有当应用场景明确的前提下,才能以此为逻辑起点倒推开发数据价值的所有流程,且这些环节可能是瞬时同步完成。因此,我们大致可以推演出一个结论:数据的开发利用是以应用场景为牵引的非线性非连续过程,一旦明确了数据用来做什么,其权属、定价、技术、交易形式等问题便同步明晰。
基于以上特性,数据要素的开发利用方向和形式,便不能再仿照传统要素那样,以交易场所的形式进行互换交易。据信通院有关数据显示,我国数据流通交易仍以场外交易为主,场内数据交易只占数据交易市场总规模的4%。国家大数据局去年发布的《可信数据空间发展行动计划(2024—2028年)》,本质上是在充分考虑到数据要素特殊性的基础上,对数据交易形式与机制的创新和重构。数据交易的场所应该处于一种以数字技术为底座、具有明确统一的底层规则和标准的虚拟、无边界“空间”,“空间”不应有区域差别(就像此前的WWW万维网和TCP/IP协议一样),具有可信、易交互和价值共创等特征。在此基础上,还应培育大量深谙各行各业需求且具备技术能力的数据服务公司,这些“数据经纪人”是促进数据要素开发利用十分重要的中间主体,是促进数字技术创新并产业化的重要力量,更是数据要素和数字技术赋能千行百业的强大推动力。(作者单位:南京大学长江产业发展研究院)