点击右上角微信好友

朋友圈

请使用浏览器分享功能进行分享

正在阅读:扩内需 畅循环:一个数据产品的交易历程
首页> 经济频道> 经济要闻 > 正文

扩内需 畅循环:一个数据产品的交易历程

来源:人民日报2022-11-28 08:54

数据,作为一种新型生产要素,已快速融入生产、分配、流通、消费等各个环节。

党的二十大报告提出,构建全国统一大市场,深化要素市场化改革,建设高标准市场体系。

数据交易是构建数据要素市场的关键一环。今年2月至7月,通过北京国际大数据交易所(以下简称“北数所”),北京海天瑞声科技股份有限公司和禾多科技(北京)有限公司完成了一笔人工智能算法训练数据产品交易。一个数据产品从采集、处理到交易、应用的过程是怎样的?如何探索建立合规高效的数据要素流通和交易制度?记者近日追踪了这次数据产品交易的全程,一探究竟。

数据采集——

数据越真越全越精,越能提升人工智能“聪明”程度

打左转向灯起步、遇到过路行人减速绕行……在北京市石景山区的首钢园自动驾驶服务示范区内,一辆辆自动驾驶汽车可以精准识别路况,做到安全起步、行驶、落客。

“只要在手机应用程序上下单,车辆就自动开到眼前来;点击小程序的‘开始行程’按钮,车辆就启动了。”北京市朝阳区居民王女士对自动驾驶技术既赞叹不已,也十分好奇,“这左拐右拐、上坡下坡的,它是怎么判断的呢?”

“自动驾驶的实现,是基于人工智能技术、先进传感器、高精地图等进行的技术‘大综合’。人工智能技术就相当于自动驾驶系统的‘大脑’。”海天瑞声是一家人工智能数据资源和服务提供商,公司副总经理李科告诉记者,为了使这个“大脑”更“聪明”,就需要运用各类数据来训练人工智能算法,“人工智能算法做出判断大致要经历‘接收数据’‘总结规律’‘形成判断’3个环节,数据样本类型越全、精度越高、针对性越强,算法就会越聪明,自动驾驶系统的智能化水平就会越高。”

这次数据产品交易中,自动驾驶解决方案提供商禾多科技公司需要自己采集真实场景的原始数据,这些数据由海天瑞声进行专业处理后,形成人工智能算法训练数据,用于自动驾驶系统研发。

如何保证数据“原材料”的高质量?有效采集至关重要。

“数据采集要尽可能接近真实路况。”禾多科技副总裁戴震介绍,在近期的一次数据采集中,工程师驾车从北京市顺义区出发,途经望京区域、机场高速和4个停车场,行驶路程100多公里,现场采集到了道路状态、交通信号和标识、车辆和行人目标以及天气环境等信息。

“多位专业工程师驾驶数据采集车,车上安装了雷达、摄像头和传感器用以收集数据。采集到的数据经过合规处理,会被记录在车载硬盘内,之后通过网络闭环上传至数据处理系统,为下一步的筛选、标注做好准备。”戴震说。

据介绍,海天瑞声与禾多科技今年完成交易的数据产品,其中许多涉及停车场景。“为人工智能算法提供的训练数据,针对性越强,越有助于提升其在特定方面的智能化水平。”戴震说,有时根据客户的需求,为了提升场景的针对性,团队还会专门设置一些具体的情境。

“例如,为了提升自动泊车系统对三轮车这类交通工具的感知能力,我们会故意在停车场内布置一些三轮车,然后安排工程师驾车前去采集数据,再将这些数据处理后用于人工智能算法迭代。”戴震说。

数据处理——

由专业团队协作完成,创造规模可观的就业岗位

采集原始数据只是第一步,接下来需要技术人员对数据进行处理,让人工智能算法可以“读懂”这些数据。

处理数据的办法主要是进行数据标注。“虽然我们可以在原始视频上看出哪里是车道线、哪里是停车位,但如果不加以标注,人工智能算法是无法读懂这些数据的。”李科说,数据标注的基本原理是将原始视频数据分为若干帧,由技术人员运用公司自研的智能化数据处理平台及相关标注工具在每一帧上标注出相应内容,“例如,标出汽车的位置在哪里,某个交通标志是什么意思,等等。”

在海天瑞声公司总部,计算机视觉业务部高级项目经理秦子雄向记者现场演示了数据标注的步骤:

“我们使用这个矩形框将这辆汽车框起来,算法后期就会读‘明白’。”

如何精确定位这辆汽车?

“那就要使用接地线这个辅助工具,先确定几个汽车轮廓上的关键点,再画出数条接地线垂直于地面,这样就可以确定汽车轮廓投影在地面上的具体位置。”

…………

几番操作下来,经过各种线和框“勾勾画画”,一帧视频图像标注完成。

数据标注不是一项轻松的工作,需要专业的技术团队协作完成。“为了顺利完成这次与禾多科技的交易,我带领100多人的数据标注服务团队工作了近5个月,标注完成了十几万帧的原始视频数据。”秦子雄说,在这个过程中,需要通过培训帮助团队人员熟练掌握规范,还要依靠公司平台管理团队、追踪工作进度、交付最终成果,“数据标注是一个既有技术含量,也需要较多人力投入的工作,下一步公司将继续加大数据处理平台的研发力度,提升数据标注的智能化水平。”

从宏观层面上看,人工智能产业的快速发展催生了对数据标注服务的庞大需求。《2022人工智能基础数据服务产业发展白皮书》显示,2022年,我国人工智能基础数据服务市场规模将达47.8亿元,预计2025年这一数字将突破120亿元。目前,许多数据服务企业在中西部地区建立了数据标注基地,为当地创造出可观的高质量就业岗位。

数据交易——

建立数据流通信任机制,实现数据“上市有审核、采买有资质”

海天瑞声与禾多科技能顺利完成这次数据产品交易,离不开北数所的撮合与服务。

“在去年3月底北数所成立之初,我们就受邀加入了其牵头成立的北京国际数据交易联盟,并在去年9月至10月上线了几款数据产品。”李科说,数据交易所在国内还属于新生事物,海天瑞声作为首批“尝鲜”的企业之一,在与北数所的交流合作中,也在不断更新对数据交易模式的认知。

“过去,我们寻找客户主要靠广告推广、参与展会等方式,得一个客户一个客户地谈,属于‘点对点’的模式。”李科说,近一年多来,随着买家在北数所数据交易平台上相继出现,企业有条件从“点对点”过渡到“点对面”模式,依靠交易平台提供的撮合服务来获取客户。

北数所相关负责人郎佩佩介绍,这两家企业都是北数所的合作伙伴。了解到海天瑞声在数据领域的综合实力后,禾多科技决定与其开展合作。相关数据处理产品于今年2月至7月分两期交付完成,合同在北数所进行了备案。

除了撮合供需双方外,北数所还要对数据交易主体、数据来源、交易产品、数据用途等进行合规审核。郎佩佩说:“北数所要研判这些人工智能训练数据的来源是否合规,数据产品交付后的用途是否正当等。”

目前,北数所构建了由数据提供方、购买方、中介服务方和交易场所组成的北京国际数据交易联盟,合力打造数据要素市场体系。统计显示,北京国际数据交易联盟已吸纳大型商业银行、电信运营商、互联网企业、跨国机构等150多家机构或企业。“只有实现确权、流通和交易后,数据资源才会转变成可以量化的数字资产。”北京金控集团党委书记、董事长、北数所董事长范文仲表示,数据交易所要做的不仅是撮合交易,更应该建立一套技术、规则、机制、流程健全的数据流通信任机制,实现“上市有审核、采买有资质”的数据交易良性生态。

数据应用——

训练人工智能算法,赋能实体经济、提升用户体验

在地下车库,上海市长宁区居民沈先生体验了一把爱车的“记忆泊车”功能。

“开启‘记忆泊车’功能后,我驾车从地下车库的入口出发,先完整地进行了一遍泊车入库。这时车辆的自动驾驶系统已经‘记住’了泊车路线。待再次出发时,车辆便由系统自动操控,按照设定的路线从车库入口驶入车位。”沈先生说。

“记忆泊车”“跨层泊车”等高阶自动驾驶功能的实现,是人工智能算法通过训练不断“进化”的结果。“经过几个月的迭代升级,我们的人工智能算法在泊车等场景上的智能化水平有了较大提高。”戴震说,目前企业研发的自动泊车系统已经在广汽集团的量产车上得到应用,将为消费者带来更好的出行体验。

将采集到的原始数据进行筛选、标注,把处理完成的数据用于训练人工智能算法,最终赋能实体经济、提升用户体验。业内人士表示,数据流通的这一过程折射出近年来我国数字经济的蓬勃发展态势,也将促进各行业更好地应用数据要素。

“当前,我国数字经济发展成效显著,但适应数字经济发展的规则制度体系仍有待健全。” 浙江大学国际联合商学院数字经济与金融创新研究中心联席主任盘和林说,下一步,应加快出台数据要素基础制度及配套政策,推进公共数据、企业数据、个人数据分类分级确权授权使用,构建数据产权、流通交易、收益分配、安全治理制度规则,统筹推进全国数据要素市场化配置改革。

培育数据要素市场逐步取得了成效。“有了这次成功交易,我们和海天瑞声将继续深化合作,未来双方有望达成更大量级的合作。”戴震说。(本报记者 葛孟超)

[ 责编:张慕琛 ]
阅读剩余全文(

相关阅读

您此时的心情

光明云投
新闻表情排行 /
  • 开心
     
    0
  • 难过
     
    0
  • 点赞
     
    0
  • 飘过
     
    0

视觉焦点

  • 大陆海事部门在台湾海峡西侧水域开展联合巡航

  • 陕西清涧寨沟遗址

独家策划

推荐阅读
万兆元年,谁来领航?是更智慧AI,是更领先的Advance,是刷新极限的速度,还是升级多维的体验?中国移动5G-A商用发布会,重新定义数智新时代,邀您共同见证!3月28日15:00-16:00
2024-03-28 12:36
作为中国大科学装置之一,高能同步辐射光源是由中国科学院、北京市共建的怀柔科学城大科学装置集群的核心装置。
2024-03-28 09:54
2022年8月15日,国际天文学联合会小天体命名工作组发布公告,将国际永久编号为192353号的小行星命名为“王大中星”。围绕大学的根本任务是育才造士这一核心要义,王大中归纳并紧抓建设一流大学的三大要素:大师、大楼和大学精神。
2024-03-28 09:34
坎潘特强调,最新观测表明,精确的星震学技术可用于探测表面温度低至4200℃(比太阳表面低约1000℃)的矮星,为天体物理观测开辟了一个新领域。这一最新结果表明,星震学技术有望详细表征这些恒星及其宜居行星的细节,而精确确定附近冷矮星的年龄对于阐释系外行星上发现的生物特征可能至关重要。
2024-03-28 09:33
记者从自然资源部3月27日召开的例行新闻发布会上获悉:今年是极地考察40周年,自然资源部将开展一系列活动纪念这一重要时间节点。7月北极黄河站建站20周年时,在黄河站举办招待会、研讨会等相关活动,中国第四十一次南极考察期间将在长城站、中山站举行招待会、研讨会等相关活动,“雪龙”号、“雪龙2”号船停靠外港时举行公众开放日活动。
2024-03-28 09:32
联合国教科文组织执行局27日批准18处地质公园列入世界地质公园网络名录,其中包括中国的6个地质公园,分别是长白山世界地质公园、恩施大峡谷-腾龙洞世界地质公园、临夏世界地质公园、龙岩世界地质公园、武功山世界地质公园、兴义世界地质公园。
2024-03-28 09:31
据介绍,除了服务于中国探月工程四期,后续鹊桥二号中继星还可为国内外月球探测提供中继通信支持。
2024-03-28 09:25
涂白防虫、修剪树枝、引水灌溉……每当春天到来,在祖国西北边陲新疆托里县老风口,生态造林工作就紧锣密鼓地开始了。
2024-03-27 10:22
今年我国纪念“世界水日”“中国水周”的活动主题为“精打细算用好水资源,从严从细管好水资源”。
2024-03-27 10:21
在齐齐哈尔市甘南县宝山乡巨宏村,村民苑忠国正在准备春耕,多年来通过参与县里的培训,春耕物资的采购对他来说已是轻车熟路。
2024-03-27 10:20
在开展调查监测,评估新污染物环境风险状况方面,《行动方案》提出建立化学物质环境信息调查制度、建立新污染物环境调查监测制度、建立化学物质环境风险评估制度、动态发布重点管控新污染物清单等具体措施。
2024-03-27 10:18
一群“麦哲伦”式的实验物理学家正在高能物理的版图上开疆拓土。而玻色子的发现,正在指向新的“盛宴”。
2024-03-27 10:16
作为古生物学家,徐星是中国科学院院士、中国科学院古脊椎动物与古人类研究所研究员,同时也是云南大学教授,主要从事中生代陆相脊椎动物化石及地层学研究。
2024-03-27 10:15
近期,12P/Pons-Brooks彗星(以下简称12P彗星)成为全球瞩目的对象,我国不少天文爱好者成功观测并拍摄到这位“天外来客”。
2024-03-26 03:25
日前,中办、国办印发《关于加强生态环境分区管控的意见》(以下简称《意见》),明确提出到2025年,生态环境分区管控制度基本建立,全域覆盖、精准科学的生态环境分区管控体系初步形成。
2024-03-26 03:20
眼下正值春耕备耕的关键阶段,突如其来的天气变化,是否会对春耕、农作物造成影响?
2024-03-26 10:16
3月24日是世界防治结核病日。南开大学饶子和院士团队与上海科技大学免疫化学研究所张璐研究员团队合作,首次揭示了抗结核新靶标Rv3806c的冷冻电镜三维结构。
2024-03-26 10:16
25日,中国海油发布消息,我国在渤海超5000米的地层钻探发现一口高产油气井,测试日产油气当量近1400立方米,创造了我国海上深层油气探井日产最高纪录。
2024-03-26 10:15
“绝对安全”的通信是千百年来人类的梦想之一,从摩斯电码到电报、传真,从移动电话到网络通信,通信技术的发展同时带来了各类安全隐患,与通信安全相关的技术一直是科技界、产业界的重点攻关方向。
2024-03-25 10:47
记者从中国科学院近代物理研究所获悉,该所研制的中国超重元素研究加速器装置(CAFE2)取得重大突破,成功实现了14.8粒子微安流强、224兆电子伏能量的束流在靶稳定运行,创造了国际同类装置运行束流参数的最高流强纪录。
2024-03-25 10:07
加载更多