自2020年4月中共中央、国务院在《关于构建更加完善的要素市场化配置体制机制的意见》中首次将数据列为继劳动力、土地、资本、技术后的第五大生产要素之后,“加快培育数据要素市场”就成了全社会高度关注的话题。2022年12月,中共中央、国务院发布《关于构建数据基础制度更好发挥数据要素作用的意见》(“数据二十条”),围绕数据产权、流通交易、收益分配、安全治理等方面构建起了数据要素市场的“四梁八柱”。进入2023年以来,国家数据局正式成立、财政部《企业数据资源相关会计处理暂行规定》正式实施、国家知识产权局在8个地市的数据知识产权试点工作正式启动、全国40多个地市开通建设数据交易市场…….。一系列政策措施的密集出台,标志着我国数据要素市场建设进入快车道。
尽管“数据二十条”已搭建起了我国数据要素市场的建设框架,相关部委和地方政府也出台了一系列促进数据要素市场化发展的政策措施,但是,目前这些框架和政策距离具备可操作性的落地实施还有很多瓶颈需要克服,数据产权、流通交易、收益分配、安全监管等基础制度尚未建立,突出表现在数据权属的理论和实践还未取得重大突破,数据的统计核算、授权运营、价值评估、跨境流动、合规安全等实际操作环节,还未找到数据安全与数据发展之间的平衡点。北京交通大学信息管理理论与技术国际研究中心(ICIR)认为,突破数据要素市场化建设关键瓶颈环节的基础和先决条件是,对数据这种新型生产要素的特性要有深入透彻的了解和认识。不同于土地、劳动力、资本等传统生产要素,数据具有的独特特性,对传统经济理论对生产要素的解释、生产要素促进经济增长的机理、以及不同主体对数据要素的处理方式等方面,都提出了全新的挑战,只有对数据的特性全面了解、准确把握,才能建立能真正落地实施、具有可操作性的数据要素基础制度,也才能促进数据要素作用的进一步发挥。数据具有虚拟性、非稀缺性、易复制性等20个独特的特性,每一个数据特性对数据产权、生产加工、流通交易、收益分配、安全监管等方面都有不同的影响。
1. 虚拟性
含义:数据的虚拟性主要指不同于土地、劳动力、资本等可见的、具有物理形态的传统生产要素,数据具有不可见、没有具体实物形态的特性。尽管数据需要依附于各种实物载体,但数据作用的发挥和数据价值的大小取决于数据本身。
影响:数据的虚拟性几乎是数据其他所有特性的根源,也是区别于土地、劳动力、资本等其他传统生产要素最根本特性。数据要素在确权、流通、定价、入表、交易、收益等方面出现的各种新问题、新挑战,几乎都源于数据的虚拟性特点。其直接影响有两方面:一是导致数据的无消耗性,即数据不会因为使用频率的增加而磨损、消耗;二是导致了数据交易的复杂性,即买方在数据到手之前往往不能准确地判断数据的真实性,往往只能依赖于交易机构或者卖方的声誉来实现交易的传统质量控制机制,交易双方的信任危机影响着价值评估的准确性。
2.非稀缺性
含义:数据的非稀缺性也称数据的无限性,主要指不同于土地、劳动力等传统生产要素,数据不仅不会因使用而耗费,反而会在使用过程中产生新的数据,并随着被使用次数的增多而新创造的数据量越来越多,因此数据是非稀缺的,数据供给也是无限的。数据已成为当今数字社会最基本的客观产物,人们无论做什么都在产生数据。消费者通过手机、汽车、音箱、电视等智能设备使用互联网服务时,会不停地产生上网记录、支付交易等个人信息数据;企业的生产设备、管理系统、营销系统等智能装备开机时,就会持续产生装备状态、产能利用、故障报警等企业生产经营数据;政府为社会提供衣食住行、经营管理、宏观决策等公共服务过程中,也会每时每刻产生交通、电力、自来水、医疗等各种公共数据。全球数据量每年都增长27%左右,每4年新增加的数据量都将超过人类有史以来积累的数据总量。
影响:数据的非稀缺性将造成两方面突出影响:一是打破了传统经济学“资源稀缺”的基本假设,突破了传统要素有限供给对增长的制约,将重塑世界经济增长理论,并为可持续发展提供了可能。二是对数据定价和交易造成困难。
3.原始性
含义:数据的原始性是指数据是构成人类知识体系中最底层、最原始、本身不具有实际价值的最基本单元。人类的知识体系由知识—信息—数据三层架构构成。其中,数据位于知识体系最底层,本身价值很低,甚至没有实际意义;信息位于知识体系中间层,是通过对数据进行提炼、处理、分析后,形成的对人们有用的信息;知识位于知识体系最顶层,是人类对信息进一步深度分析、处理、加工后,形成的体系化、结构化、系统性的知识。
影响:数据原始性的特点具有两方面影响:一是有助于为数据确权提供理论依据。即由于原始数据是没有价值的,因此,产生原始数据的个人或组织,只有查询、修改、删除、迁移等原始数据的有限所有权,不能享有对数据的最终收益权。数据持有者对分析、生产、提炼过的数据享有除原始数据主张权利以外的其他所有权利,包括数据的生产权、流通权、收益权、处置权等,数据持有者可以自已行使这些权利,也可以通过委托代理、委托经营等方式交由其他机构行使这些权利。二是有助于确定区分不同数据形态。人类知识体系的数据、信息和知识三层次形态基本上与数据资源、数据产品和数据资产相对应,在实际操作中,数据资源层次需要解决的主要问题是数据来源的合规合法,数据产品层次需要解决的主要问题是数据的算法、模型、场景等各种技术应用,数据资产层次需要解决的主要问题是数据的体系化、涌现性和泛在能力。入表的数据主要以自产或外购方式获得的数据产品或数据资产,而数据资源一般不包含在入表范围之内。
4.易复制性
含义:数据的易复制性是指数据可以快速地以近乎零成本的方式进行复制,供多人同时使用,多次循环使用,一个人的使用可以不排斥和妨碍别人对其使用,不同人之间在使用上不存在直接的利益冲突。
影响:数据易复制性特点对数据确权、定价、交易等方面都会产生直接影响。一是在数据确权方面,数据被复制流动后,由于其传播速度很快,往往无法确定真正的数据源头,造成数据持有人或数据经营者权益的损失;二是在数据定价方面,数据一旦被复制盗取,数据持有者拥有的数据门槛会顷刻丧失,数据价值跳水贬值甚至价值归零,对高价值数据定价影响巨大;三是在数据交易方面,数据的易复制性大大增加了数据的保护成本,加上数据生产加工过程中已付出的成本,数据在交易行为实现前必须严格保密,但是,数据买方又需要对交易的数据对象有充分了解,数据买卖双方由于数据易复制性特点形成的这种行为反差,大大增加了数据交易成本,甚至会导致交易无法实现。
5.多环节性
含义:数据的多环节性是指数据价值的形成需要经过采集、存储、加工、流通、应用以及生态保障等不同环节,而各类不同主体在不同环节数据形成的丰富信息中做了不同程度的贡献,数据价值分属于多个主体。
影响:数据的多环节性特点对数据确权、定价、收益分配等三方面产生直接影响:一是在数据确权方面,数据的多环节性直接导致数据的多元主体性,在数据采集、存储、加工、流通、应用等不同环节有不同的主体;二是在数据定价方面,不同环节对数据价值的贡献度不同,变现的难易程度也有很大差异,不同环节数据的价值很难确定;三是在收益分配方面,数据价值是由不同环节的不同主体共同创造形成的,导致一个数据的不同主体间的权利很难区分。
6.非消耗性
含义:数据的非消耗性是指数据不仅可以无限制地重复使用,不会因为使用而减少其价值,而且数据在使用过程中不仅不会产生消耗,反而会在数据的生产、共享和交换产生更多数据和更大的价值。
影响:数据的非消耗性对数据确权、定价、交易、应用等方面都有重要的影响。首先,由于数据的非消耗性,多人可以同时使用同一份数据,这使得数据的权属问题变得更加复杂。需要建立有效的数据确权制度,明确数据的所有权、使用权和经营权等,保护数据主体的权益;其次,由于数据的非消耗性,数据的定价不同于传统商品的定价方式。需要考虑数据的稀缺性、市场需求、数据质量等多方面因素,制定合理的定价策略。第三,由于数据的非消耗性,数据的交易可以通过复制和传递来实现,这使得数据的交易更加便捷和高效,同时也促进了数据共享和交换的发展,使得数据可以更好地被利用和开发,产生更多的价值。最后,对于数据应用来说,数据的非消耗性使得数据可以重复使用,这可以大大提高数据的使用效率和应用价值。例如,在人工智能领域,可以使用同一份数据进行多次训练和测试,从而提高模型的准确性和稳定性。
7.非排他性
含义:数据的非排他性也称非竞争性,是指同一个数据可被不同主体重复采集,存储在各家数据中心,数据被一个主体使用时并不影响其他主体的使用。数据不仅可以被一个主体多次重复使用。数据非排他有两方面突出表现:一是不同数据平台公司对同一个人用户数据的重复采集和使用。个人用户在使用各种智能终端设备接受购物、学习、旅行、行车、医疗等各种互联网服务时,产生的各种数据可以被不同的服务提供商采集、存储和使用;二是数据易被非法获取或使用。对数据拥有持有权的机构或个人的控制数据手段被攻破时,这些原先被管控的数据将很快复制传播,众多主体能对这些数据实行采集、存储和使用等行为,因而产生数据的非排他性。
影响:数据的非排他性对数据确权、定价、交易等方面有重要的影响。首先,数据的非排他性使得数据的权属更加复杂。由于数据在使用中不会消耗,多人可以使用同一份数据,导致数据的权属问题变得更加复杂。这就需要建立有效的数据确权制度,明确数据的所有权、使用权和经营权等,保护数据主体的权益。其次,数据的非排他性对数据定价有着重要的影响。由于数据可以无限制地重复使用,数据的价值不会因为使用而减少,因此数据的定价不同于传统商品的定价方式。需要考虑数据的稀缺性、市场需求、数据质量等多方面因素,制定合理的定价策略。最后,数据的非排他性对于数据的交易也有重要影响。由于数据在使用中不会减少其价值,数据的交易可以通过复制和传递来实现,这使得数据的交易更加便捷和高效。同时,数据的非竞争性也促进了数据共享和交换的发展,使得数据可以更好地被利用和开发,产生更多的价值。
8.非均质性
含义:数据的非均质性特点具有三两方面含义,一是数据价值因不同数据质量而异,相同单位量纲下的不同数据的价值完全不同;二是数据价值因应用场景而异,同一份数据对不同应用场景的价值不同;三是数据价值因使用对象而异,同一份数据对不同人的价值也不一样。
影响:数据的非均质性对数据定价、运营、交易等有重要影响。一是在数据定价方面,数据价格的高低并不取决于数据规模的大小,更重要的是数据质量的高低;二是在数据运营方面,数据价值因场景而异的特性,使目前各地探索实践的公共数据授权运营方式有很大不确定性。不同数据运营机构的场景应用开发能力差异很大,到底采用一揽子委托给一个机构统一运营,还是委托给多家机构竞争运营?如果委托多家运营,运营授权费用是否应该统一?是将所有数据统一打包委托,还是分行业、分领域、分类型分别委托?三是在数据交易方面,数据价值因人而异、因使用对象的特性,使数据交易很难以统一公允价值入市交易,同一种数据对不同交易对象的交易价格可能有很大差异。
9.边际效应递增性
含义:数据边际效应递增性是指不同于土地、资本和劳动力等传统生产要素随着使用量的增加,使用效用越来越小的边际效应递减特性,即数据作为新型生产要素,随着数据使用量和使用次数的增加,数据规模会越来越大、种类会越来越多、使用效用越来越大,具有边际效应递增特性。
表现:数据的边际效应递增性主要表现在以下两个方面:一是随着对数据的使用,数据的规模和种类不断增加,数据所能产生的生产力作用也越来越强大。这意味着,在数据的生产和消费过程中,越生产、越消费,数据资源越多。二是在市场交易、企业经营等经济活动中,随着参与者或供给量的增加,所产生的效果比上一步增加的效果要大,这就是数据的边际效应递增。
影响:数据的边际效应递增性对数据价值有三方面影响。一是会增加消费者和企业收益。即随着消费者的增多,原先的消费者获得的消费体验和服务品质会得到更大改善,提高了消费者的消费收益,反过来又能够激励企业投资更多,扩大市场化效应,提高社会效用和经济效益。二是引发新的数据产权不清问题。数据在大规模应用过程中由于其泛化能力和涌现能力产生的新数据,既不属于个人、企业和政府等原始数据所有者,也不属于数据产品持有人等数据委托经营的委托人,而数据使用者在数据使用过程中已经获得了收益,而在使用过程中产生的新数据属于附产品,也不应该属于数据的使用者。三是增大个人隐私泄露、甚至公共安全等风险。数据在大规模应用过程中由于其泛化能力和涌现能力,会关联产生大量新数据,而这些数据极有可能会涉及到个人隐私、企业秘密和国家及公共安全。由于这种新信息不是非法收集获取的,因而不适合相应的《数据安全法》《个人信息保护法》,成为数据安全面临的新挑战。
10.交易不确定性
含义:数据交易的不确定性是指由于数据质量不可见、人为因素不可控、数据质量预期模糊等因素,而在数据交易过程中易产生的逆向选择、道德风险及交易对象不清等三类交易成本,造成数据交易的不确定性。
影响:由于逆向选择、道德风险及交易对象不清等造成的数据交易不确定性,对线上和线下数据交易市场的建立具有极大的负面影响。逆向选择和道德风险可以通过不断强化信息披露、标准化、激励机制、监督和惩罚等方式加以控制,而由于交易对象不清导致的交易不确定性目前还无法解决,是进一步完善数据交易市场必须解决的问题。
11.时效性
含义:数据的时效性也称为易腐性,有两方面含义:一方面是指数据是一种易腐品,数据蕴含的经济价值会随着时间的流逝而迅速贬值。根据IBM研究结论,60%的非结构化数据在几毫秒内就失去真正价值,超过一半的数据在产生的那一刻就不再有价值,能得到分析处理并产生实际效用的数据非常少,全球90%的数据从未得到分析使用。2020年被创建或复制的数据中,只有不到2%被保存并保留到2021年。谷歌广告数据中未经加工的原始数据中,有70%超过90天就会过时;另一方面是指数据的贬值速度取决于数据类型、用途和具体业务场景等。如股票数据对于证券市场从业者具有较高的价值,但对于出海捕鱼从业者价值就很低,但是天气数据对于出海捕鱼从业者价值就很高,而对于证券市场从业者价值则较低。
影响:数据的时效性对数据确权、入表、交易等方面都有很大影响。一是在数据确权方面,由于原始数据贬值最快,因此,原始数据所有者对数据的权益最小,甚至可以忽略不计;二是在数据定价和入表方面,由于数据贬值速度快,当企业将数据产品以无形资产或存货科目计入企业资产时,应该计提相应的大比例的无形资产减值准备或存货减值准备;三是在数据交易方面,对数据卖方来说,数据交易的前期沟通时间越长,其拥有数据的价值就越低,而对于数据买方来说,交易的数据对象如果没有及时交付,其价值就会大打折扣,因此,数据的时效性对数据交易时间和交易方式都提出了新的挑战。
12.场景依赖性
含义:数据的场景依赖性有两方面含义,一方面是指同一项数据在不同应用场景下的价值完全不同,在一种应用场景下能带来巨大价值的数据,在其他应用场景中可能一文不值。如保险公司和出租车公司都需要司机的驾驶习惯数据,但这些数据对保险公司比出租车公司更重要;另一方面是指在一种场景下的应用功能,可能会通过不同来源的数据实现。如银行对个人用户的征信水平评估,既可以根据其水电煤气等日常消费数据进行评估,也可以根据其收入水平、兴趣爱好等其他数据进行评估。
影响:数据的场景依赖性特点对数据授权运营方式具有很大影响。目前很多地方探索实践的公共数据授权运营,其中一个重要原则就是按场景授权,即数据运营机构必须说明数据的应用场景,以及应用场景对需要什么样的数据,数据持有机构才能进行有限授权,这种方式确实有效避免了数据的滥用和超范围使用,但同时也限制了数据的涌现性创新和泛在性创新,可能会导致数据使用方通过其他关联数据源实现场景应用的同一功能,一方面导致数据持有者原先数据价值贬值,另一方面因数据使用方从其他来源获取数据而增加了数据成本。
13.“阿罗信息悖论”
含义:“阿罗信息悖论”是诺贝尔经济学奖得主肯尼斯.阿罗于1963年在《不确定性与医疗保健经济学》中提出的。其基本含义是交易需要披露信息,但披露信息即意味着数据价值的丧失。无论是交易前要求部分数据内容的披露,还是交付后对交易数据不断使用与泄露,都会或多或少减少数据价值,造成数据贬值甚至数据交易买方从其他渠道低成本获取数据。
影响:阿罗信息悖论对数据定价和交易具有至关重要的影响。一是在数据定价方面,如果卖方不披露数据的信息,买方无法知道数据的真实价值,无法达成双方共同接受的市场公允价。但是,一旦卖方披露数据的信息,或者只披露了部分关键信息,买方就可能以更低成本从其他渠道获取功能相同或相近的可替代数据,卖方持有的数据价值就会贬值甚至完全失去价值;二是在数据交易方面,交易行为发生前,数据买方需要了解卖方持有数据的质量状况,而数据卖方也需要知道买方的应用场景。但是,当买方了解了数据的质量时,可能会从其他渠道获取可替代数据,而卖方了解了应用场景时,也可能与其他应用场景开发者达成交易,最终导致数据交易无法实现。
14.价值不确定性
含义:数据价值不确定性也称数据价值易变性,指数据价值受多种因素影响而表现出两种变化,一是随着时间推移变化,一些当前没有价值的数据可能会产生更大的价值;二是随着技术的进步或者可替代性数据的出现,尤其是生成式人工智能产生的大量涌现性和泛化性数据,可能会导致数据资产出现无形损耗,表现为价值降低。
影响:数据价值不确定性为数据定价、交易、入表等落地实践带来很大困难。一是在数据定价方面,由于数据价值变化频率快,变化幅度大,传统的收益法和成本法都不能准确确定数据的实际价值;二是在数据交易方面,数据价值上涨的预期可能会让数据持有者产生“惜售”心态,而数据价值贬值的预期也会让数据购买者产生“观望”心态,都不利于数据交易的达成;三是在数据入表方面,无论是以无形资产形态还是以存货形态列入资产,由于数据资产价值的波动性,都可能造成企业资产短期的大幅变动,不利于企业长期稳定经营。
15.功能替代性
含义:数据的功能替代性是指不同的数据在功能上可能是相互替代的,主要有两方面的表现:一方面是不同数据采集机构采集的很多数据项是相同的。如尽管各类数据采集机构的客户规模、业务类型、服务场景不同,但采集的用户身份、上网终端、浏览日志等数据项是相同的;另一方面是来源不同的数据,其实现的功能可能是趋同的。大量研究发现,利用搜索记录来揭示用户的音乐偏好,与利用其社交记录揭示的音乐偏好基本类同,而使用亚马逊购物记录与使用谷歌搜索记录,在提升广告精准化方面的效果也完全相同。
影响:数据功能替代性特征对数据定价、交易、运营、入表等方面影响巨大。一是在数据定价方面,替代性数据的出现可能会造成原先高价值数据的剧烈贬值,甚至价值归零,给数据生产企业造成巨大损害;二是在数据交易方面,数据持有人所持有数据的关键信息发生泄露,或在交易前被数据购买人知道,则很容易在市场上找到可以替代的其他来源数据,导致交易无法达成;三是在数据运营方面,目前社会上持有大量高价值数据的政府机构、行业企业和平台企业,正在探索通过委托经营、信托代理等方式实现数据运营变现,但由于各种因素限制,现在各种机构能提供出来供公开、共享和交易的数据比例还非常小,大量数据仍然沉淀在各机构内部。而另一方面,中小企业平台、生成式人工智能等其他渠道产生的数据呈现爆炸性增长态势,对原先的高价值数据形成很高的功能替代,造成沉淀在各机构中的数据快速大量贬值;四是在入表方面,数据入表制度的施行,将可能引发大量数据产品以资产方式进入企业报表,尤其是大量高评估值的数据产品一旦入账,当替代性数据出现时,将直接引发数据资产泡沫,并存在洗钱风险。
16.协同性
含义:数据的协同性也称关联性,即来源不同的异质性数据可以带来不同的价值,由异质性数据组成的维度不同的数据集,其价值常常会超过单一数据生产价值的总和。例如身份数据能反映个人特征,位置数据能提供地点信息,支付数据能体现交易规模,将这些数据汇集成用户综合画像,其商业价值往往比单一的身份数据、位置数据、支付数据更高产生的价值总和更高。
影响:数据协同性特点对公共数据授权经营方式的探索具有重要的启示。目前各地探索实践的公共数据授权运营模式往往对公共数据的应用场景和公共数据与其他来源数据的组合设置了许多限制条件,这样确实对防止滥用公共数据和保护公共数据安全起到了较好的作用,但同时也大大降低了公共数据的价值,限制了公共数据与其他商业数据自由组合的应用创新。应鼓励探索公共数据在多种场景中的应用,鼓励探索公共数据与其他来源数据组合创新,形成更有价值的新的数据集。
17.多样性
含义:数据的多样性是指数据有单一形态数据和融合形态数据,而单一形态数据的表现形式多种多样,可以是数字、表格、图像、声音、视频、文字、光电信号、化学反应、甚至是生物信息等,融合形态数据的表现形式则更为丰富,有数字、表格、图像、声音、视频、文字等的多模态数据,也有通过数字媒体与数字制作特技产生的各种融合数据等。随着数字技术的快速进步,不同形态的数据可以互相转换。
影响:数据多样性对数据直接带来数据使用方式的不确定性、数据价值的不确定性和数据的关联性等方面的影响。一是导致数据使用方式的不确定性。尽管数据可以有各种不同的表现形态,但不同形态的数据可以通过不同的方法进行互相转换,从而满足不同数据消费者的需求,这种数据表现形态的转换,导致消费者使用数据的方式发生变化,引发数据使用方式的不确定性;二是导致数据价值的不确定性。不同形态数据具有不同的处理方式,同一数据也可以有多种使用方式,数据处理方式和使用方式的不同,会导致数据资产的价值变化波动较大。三是为数据生产加工提供了更多选择。数据的多样性表明同一项数据有多种来源途径,这就意味着要数据加工生产不仅仅是对单一形态的数据进行分析处理,而是要在种类繁多的数据间发现其内在关联;不仅仅要做简单的文本分析,还需要对传感器数据、音频、视频、日志文件、点击流以及其他任何可用的信息进行分析。例如在客户数据库中不仅要关注名称和地址,还包括客户所从事的职业、兴趣爱好、社会关系等。
18.规模性
含义:数据的规模性有三方面含义:一是指数据的数量,数据的数量越大,其价值越高;二是指数据的质量,数据越完整,其价值越高;三是指数据速度,包括数据的加工速度和数据的流动速度,数据的加工速度越快,其价值越高,而数据的流动速度越快,数据就越容易贬值。
影响:数据的规模性特点对数据的生产加工、资产入表、数据应用等方面有较大影响。一是在数据生产加工方面,数据的加工处理技术、网络宽带等基础设施、以及社交网络技术等技术成为数据生产加工企业的竞争要件,数据生产加工技术基础薄弱的企业,很难快速采集和处理海量数据,也很难提供快速响应的、质量完整的数据产品,在竞争中必将处于劣势;二是在资产入表方面,数据入表价值的确定与数据的数量级关系不大,而主要取决于数据质量完整性、数据生产加工速度、数据流动速度等因素,因此,不同企业入表的数据资产价值的差异性较大,具有很大不可比性;三是在数据应用方面,对大规模海量数据的分析加工,可以对个人的学习状况、生活习性、社交交友、习惯爱好等方面进行准确画像,对企业供应链管理、客户管理、员工管理等方面进行精准分析,尤其是对一些有大量数据输入或需要立即决策的事项等时间敏感性和决策性的分析,具有重要意义。
19.可加工性
含义:数据的可加工性是指,虽然数据只是由0和1两个二进制数字组成的数字串和其他虚拟形态,但是,数据可以被编码、标注、记录和还原,打造一个与现实世界并行的数字虚拟世界;也可以被维护、更新、补充,增加数据规模;还可以被删除、合并、归集,提高数据质量;并还可以被分析、提炼、挖掘,形成各种层次的数据资源、数据产品和数据资产。
影响:数据的可加工性是数据价值的根本源泉,可以说,如果没有数据的可加工性,数据是毫无价值的。因此,数据可加工性对数据确权、定价和交易有巨大影响。一是在数据确权方面,在数据资产的全产业链上,应按照“谁生产、谁受益”、“谁加工生产、谁收获权益”的原则开展数据确权的探索实践,特别是要明确原始数据的所有者不享有数据收益权;二是在数据定价方面,不同环节上数据的价格应该不同,经过生产加工的数据,以及经过复杂场景融合、提炼、训练过的数据,理应具有比原始数据或初步标识过的数据有更高的价格;三是在数据交易方面,按照“原始数据不出域,数据可用不可见”的原则,交易的数据对象主要形式是数据集、API、模型、算法等经过加工的数据产品,但这些经过脱敏和加工过的数据,往往失去了数据原本含有的内在价值,大大降低了数据的使用价值。因此,探索形成既不影响数据隐私和安全,又保留了数据价值的数据交易产品,是发扬光大数据可加工性特征的重大机遇和挑战。
20.流动性
含义:数据的流动性有两方面含义:一是数据流动起来后,能够有效贯通生产、分配、流通、消费等全过程,优化各类要素的配置组合,从而实现对经济的放大、叠加、倍增效应;二是数据流动汇聚起来后,能够呈现和反映个人、企业、社会和国家的整体整体动态和需求,为个人更便捷生活、企业更有效运营、社会更有效运转等方面提供更加全面、完整的决策依据。
影响:数据流动性是有效发挥数据价值的助推器,数据只有流动起来才能将其价值发挥出来,不管数据的潜在价值有多大,如果不能有效流动起来,这些数据的价值就不能体现出来。目前,在政府机构、行业企业和平台企业中都有庞大的高价值数据,但是囿于这些数据的权属还没有法律的定性确认,而涉及到的相关个人隐私、公共数据安全、国家网络安全等方面的数据边界还不清晰,导致政府机构和行业企业积累的数据长年沉淀在机构内无法应用,平台企业积累的数据也只是在企业内部使用,造成数据资源极大浪费,也从整体上降低了全社会的福利水平。因此,建立全国统一的数据交易市场体系,让这些沉睡的有价值数据流动起来,是当前数据要素市场急待解决的首要问题。
作者:涂群 张茜茜