数据资产化“三步蒸馏法”及其企业案例解析

本报告以企业数据产品赋能实体经济的具体应用场景为基础,以企业数据资源开发利用形成数据资产的路径为核心,探讨企业数据资产入表和估值的实践与操作。

数据资产化“三步蒸馏法”及其企业案例解析
出处:数据资产入表及估值实践与操作指南

数据作为生产要素,在政府、企业、社会、个人之间有序流通,实现与其他生产要素的有机融合,提高生产效率,通过对内服务或共享和对外流通交易实现数据资产价值流通变现,为企业等各方创造更高的价值与收益。

黄丽华和吴蔽余等(2023)提出的数据要素流通价值链模型,结合数据资源到数据产品,再到可交易数据产品和数据资产凭证的演进过程,总结了数据资产运营的三个阶段和相应的可操作性流程,以保证数据要素流通价值实现的规范性和统一性。

图 1 数据要素流通价值链模型

1. 数据资产化路径

上海数据交易所根据企业数据资产形成路径的研究,结合场内登记挂牌的业务实践,创新性提出企业数据资产化三部曲:数据资源化、资源产品化和产品资产化,并认定数据产品可以进入数据资产凭证有三个条件,又称之为“三步蒸馏法”。

  • 第一步是数据产品的认定要有条件的;
  • 第二步需要认定成为可交易的数据产品;
  • 第三步是数据产品要入资产凭证。

经过三个蒸馏形成的数据资产凭证,其可清晰辨认、应用场景明确、价值可以计量,更好赋能数据资产化。

数据资产凭证是一种用于记录数据资产交易、交付、权属等信息的电子凭证,该凭证依托于全国数据交易链,基于不同的应用场景发挥相应的作用,可用于各层次数据要素市场。依托全国数据交易链的数据资产凭证生成标准化协议与智能合约,结合交易链上数据产品挂牌、数据产品交易存证,实现数据资产凭证发放“智能生成,全链共识”的全国统一的认证、发放与验证机制。数据资产凭证通常包括记录数据产品登记;每一次链上交易信息,并将电子订单、数字签名、发票等信息上链保存;同时包含价格、交易量、复购率、使用场景、用户评价等参数的指标清单。

数据资产凭证的内容可以追踪数据的来源、类型、权属、质量等关键信息,同时凭证与数据产品关联起来,真实记录了数据产品交易合同、交付情况以及清结算情况,提供可追溯的证据,确保数据产品交易的完整性、真实性和相关性,为数据交易参与者提供信任和保障。

数据资产凭证是上海数据交易所在数据资源确权方面的探索,也有很多学者参与探讨数据资产凭证的应用场景和功能定位。首先,数据资源持有权的确权途径是数据资源登记,数据资产凭证登记了数据资源用于形成数据产品或服务的相关信息,可作为数据产品经营权的确权凭证。数据资产凭证包含了数据资源的来源,通常可分为公共数据、企业数据两类,采集这两类数据后进行加工可以形成具有资产价值的数据资源。

对于授权运营的公共数据,凭证记录了被授权企业进行数据资源登记,并与公共机构分享数据资源持有权的情况。对于企业相关业务自主生产的数据,可以进行数据资源登记,由企业取得数据资源持有权。

其次,对于通过爬取的公共数据,不宜登记取得数据资源持有权,企业只要遵循行业规则,没有采用非法侵入计算机信息系统和非法获取计算机信息系统数据等非法方式,就可以获得数据加工使用权。对于通过交易市场采购的数据,在签订数据交易合约时,便赋予数据购买方数据加工使用权。对于企业间委托加工的数据,要求在合约允许范围内加工数据,形成数据产品,可以获得数据加工使用权。由于数据加工使用权是一种灵活的、有限的“防御性权利”,不能作为资产性权益,也无需登记机构颁发确权凭证。最后,企业对数据资源需要付出了实质性加工和创新性劳动,从而形成可交易的数据产品。数据资产凭证记录企业加工使用数据的过程,可以作为企业可以登记取得数据产品经营权的重要依据。

综上所述,数据资产凭证有可能成为企业数据资产化应用场景的基础要件,并进一步加速推进数据交易市场互联互通的实现。

从企业数字化转型角度去规划企业数据资产形成的路径,最重要的工作是做好前期的业务流程规划,一方面要明确数据产品开发管理流程,为合理归集开发阶段成本奠定基础,另一方面要明确数据产品的应用场景,合理定价并推进市场相关工作。

2. 数据资源化

《暂行规定》作为一般性的会计准则,使用“数据资源”一词确定企业数据资产入表的范畴是一种审慎的做法,与《中共中央 国务院关于构建数据基础制度更好发挥数据要素作用的意见》(简称“数据二十条”)保持高度一致。

从数据资源的来源来看,企业可能通过公共数据授权、自身运营产生、交易市场采购等多种渠道获得数据资源,因此,推进以数据分类分级确权授权制度为基础的数据资源入表,是有效提高数据要素市场化流通效率、促进数据使用价值充分释放的起点。

数据资源化的过程是企业通过上述一种或多种方式结合获取的原始数据,经过脱敏、清洗、整合、分 析、可视化等加工步骤,在物理上按照一定的逻辑归集后达到“一定规模”,形成可重用、可应用、可获取的数据集合后,形成数据资源的过程。原始数据是经济社会活动产生的附属品,数据资源并不是生产出来的,而是企业通过安排相应的人力、组织、技术、系统等对原始数据进行系统性梳理整合加工出来的。数据资源化是企业挖掘原始数据使用价值的过程,也是企业数据资源实现资产化的第一步。一般来说,数据资源化的过程可能是企业数据产品的研究阶段,也有可能是企业数据资产的开发阶段,取决于企业在具体产品研发之前有没有针对目标场景进行深度的调研学习。以下将从企业实践角度分析数据资源化过程。

中债金融估值中心有限公司(简称“中债估值中心”)是中央结算公司的全资子公司,是中央结算公司基于中央托管机构的中立地位和专业优势,历经二十多年精心打造的中国金融市场定价基准服务平台。1999 年,中债估值中心编制发布中国第一条国债收益曲线,之后不断完善数据产品服务体系,围绕定价基准服务职能,打造出中债价格指标、中债指数、中债 ESG 产品、中债分析工具、中债咨询解决方案等数据产品体系,覆盖标准化债权资产、非标资产、权益类资产及金融衍生品四大类资产的数据服务,为超过 150 万亿金融资产提供定价参考基准数据服务,建立了中国最完整最连续的债券市场数据库、中国债券市场定价模型 库、高效支持海量数据运算的算法库,形成差异化竞争优势。

金润征信的数据由外部采集和内部加工两部分组成。外采来源的数据包括全国 ETC 车辆高速通行数据、重卡全路段通行数据(北斗+GPS)、车联网数据、主机厂数据等四类,其中全国 ETC 车辆高速通行数据投放市场实践运用两年,很受相关行业欢迎,调用量近两千万次。内部采集的数据主要是由企业自身多年交通行业经营积淀形成的车辆运营相关数据。该企业及其下属商业保理公司拥有十年的客货车 ETC 记账卡金融服务运营经验,并与超过十个省份的高速方合作开展 ETC 发行服务,其中包括山东、江苏、福建、云南、浙江、广东、江西、贵州等,所服务的全国车辆已近百万。

以上海合合信息科技股份有限公司(简称合合信息)旗下全资子公司生腾的数据产品启信宝为例。启信宝是一款企业商业信息查询 APP,其汇集境内 3.1 亿家企业等组织机构的超过 1,000 亿条实时动态商业大数据,提供包括工商、股权、司法涉诉、失信、舆情、资产等超过 1,000 个数据特征标签;可对数据进行深度挖掘,为客户提供企业关联图谱、舆情监控(情感及语义分析等)、风险监控(经营异常、司法涉诉等)、商标及专利信息、深度报告(信用报告、投资及任职报告、股权结构报告)等多种数据查询、挖掘和智能分析服务。

某上市公司的数据团队约 3,000 人,该公司通过对原始数据的采集、编制、发布三大流程,每日发布近千种商品、400 多座城市和港口、10 万条基准价格及数万条调研数据,覆盖黑色金属、有色金属、能源化工、建筑材料等八大板块百余条产业链。该公司数据资源化环节必须经过八步标准化数据采编流程,通过市场调研、建议样本库、采集与入库、验证与分类、样本标准化、离群值处理、数据编制、数据发布几个步骤,最终形成符合公司标准化的数据资源。

某案例企业基于机器学习技术实现数据自动化量产,将数据提取、清洗、标准化、质检等流程无缝衔 接。公司通过 DAS 智能化数据工厂、SmartTag 实时资讯解析以及利用 NLP 对信息进行智能提取,形成可分析的结构化数据,形成数据资源。该公司凭借数据自动化量产、精准实时资讯解析、数据有效编制三大可相互反哺的核心能力,以人工智能驱动的数据自动化生产体系针对多种决策场景提供数据服务。目前公司形成的数据资源包括 SAM 产业链图谱数据,企业图谱数据和 SmarTag 舆情及标签数据。如标签数据,公司精准高效地对各类资讯进行实时解析,把资讯中蕴含的主体,事件及情绪精准提取,并经过公司、人物、事 件、行业、产品、概念、地区等直观精细的多维度标签,加工成高价值的定制化数据资源。

最后一家案例企业的数据主要来源于加密脱敏后的业务数据。通过使用自研的数据中台,实现数据的采集、元数据管理、大数据计算、数据检查、数据加解密、数据流转、数据备份等工作,基于数据规范、生产规范、安全及数据治理等领域的实战经验自主研发的一站式数据开发、治理体系。通过标签管理平台,实现新标签开发、标签优化等功能。标签分为画像特征及基础特征两类,画像特征包括用户属性、风险类标签、预测类标签,基础特征包括用户信息、用户行为、营销活动等。搭建了超过 500 台高性能服务器组成的大数据运算集群,通过一系列数据清理的方法对业务数据进行了治理,分析数据源特征,实现 T+1 准确及时更新。

3. 资源产品化

资源产品化是企业数据资产化的第二步,是数据资源为企业创造交换价值的核心环节。企业通过对数据资源赋予创新型劳动和实质性加工,形成满足特定应用场景需求的数据产品。数据产品是指以数据集、数据信息服务、数据应用等为可辨认形态的产品类型。数据产品是数据要素参与实体经济运行的重要载体。

任何一个产品都会经历从产生到消亡的过程,数据产品也不例外。与传统产品类似,数据产品也会经历导入期、成长期、成熟期和衰退期。由于数据本身具有高重塑性的特点,数据产品在导入期和成长期即可批量生产,边际成本几乎为零,不受限于传统产品规模经济的特点,因此数据产品的生命周期较传统产品会呈现跳跃式、价值时变性等特点。

数据资源化后,在明确的应用场景中,将有价值的数据内容通过与服务终端或算法等相结合,以数据产品作为载体,通过内部使用或对外交付客户使用。在这一个阶段,企业根据产品的应用场景,梳理数据集的形式、分类等,并根据应用场景开发相应的服务终端或算法程序等。根据数据产品持有目的不同,数据产品一般会通过自用、共享、开放以及对外交易方式实现其价值。企业形成的标准化数据产品可重复使用,能满足不同客户的需求;企业为某个客户开发定制化的数据产品将向客户整体出售,其服务客户的数量有限。

基于需求特征和服务方式不同,可以将数据产品形态分以下三类。

  • 形态一:数据集,即以数据库的形式提供,以满足客户模型化需求的数据产品。
  • 形态二:数据信息服务,即以数据资源库为基础,为客户提供满足其特定需求的信息类服务;
  • 形态三:数据应用,即指以应用程序的方式,基于统一的用户界面,提供基于数据资源和模型应用的数据产品。

需求特征包括模型化需求以及非模型化需求。

  • 模型化需求:数据用于训练和优化使用者的模型或算法,提高模型算法的性能。
  • 非模型化需求:使用者利用分析(模型)形成的结果 (信息或知识),支持企业的日常生产经营决策。

服务方式包括界面类方式和非界面类方式。

  • 界面类方式:界面类方式通常是用户主动操作的界面,实现人机交瓦的过程来获得数据或信息,例如搜索软件、SaaS 等应用。
  • 非界面类方式:通过某个软件程序的功能, 实现程序间交互方式例如 API、文件配送、受控沙箱、联邦学习等。

以中债估值中心的中债指数数据产品服务为例,中债指数是中国境内历史最为悠久、应用最为广泛、产品数量最多的人民币债券市场代表性指数品牌。中债指数数据产品服务包含 12 大指数族系数据,目前已突破 1500 只,实现了境内人民币债券全覆盖,并拓展至权益资产与境外资产指数数据领域。为响应国家战略需求,紧随市场发展,中债估值中心先后推出了碳中和、ESG、长三角、京津冀、科创主题等指数,为投资人提供债券市场价格走势的检测数据指标、表征和预测宏观经济运行的参考数据、债券投资组合业绩评估的参考基准数据以及指数化投资产品跟踪标的数据等应用服务。

金润征信的数据产品按产品内容可分为高速通、车辆通、路径通、核验通、司法通、工商通、税务通 等,按运用类型可分为查询类、核验类、模型类。上述产品主要的应用场景包括:

(1)物流,如车队运力综合评估、单车运力情况分析;
(2)交通管理,如稽查打逃高速费、车流量分析等;
(3)金融,包括银行信贷业务、非银行金融业务(商业保理、融资租赁等);
(4)保险,如保险定价(网约车识别、货车识别)、理赔的补充等。公司产品均采取按次收费方式,根据不同的查询内容定价不同。

启信慧眼是基于公司商业大数据平台,结合人工智能技术,融合多种细分业务场景,打造的标准化 SaaS 云平台,覆盖“拓客-尽调-风控-管理” 为企业客户实现商业调查、风控管理、营销拓客等多场景数字化管理,帮助企业进行快速智能地发展业务、管控风险。启信慧眼金融版,服务于银行、融资租赁、商业保理等金融行业的垂直版 SaaS 产品,遵循“数据—信息—商业智能—价值”转型路径,构建数字金融服务模式,助力解决“营销拓客、尽职调查、风险预警、客户管理”等问题。启信慧眼客商版针对生产制造、贸易经销、能源化工等行业,为国企、央企、私企、外企等企业多部门提供风险自主可控的数字化客商管理。公司还为客户提供商业全景数据库服务,采用先进的数据库设计技术,为客户在企业尽调、信用审核、风险监控、智能拓 客、供应链管理、企业数据大屏等方面提供全面的数据支持。

某案例企业的数据产品主要包括数据订阅以及研究咨询服务。其中数据订阅服务下分黑色金属(包括钢材、铁合金、焦煤、废钢、铁矿石等)、有色金属、能源化工、建筑材料、农产品、新能源、新材料和再生资源八大类别,通过网页端、移动端、终端数据服务三种界面对外提供服务。研究咨询服务主要系通过定制化加工形成的的数据产品,为用户提供战略规划、经营管理、市场研究、投资可研等定制化的决策支持服 务,其产品形式主要是定制化报告。

另外一家案例企业通过对数据资源的进一步加工、整合和分析,推出了以下几大类数据产品,包括产业链、企业图谱等产品。公司通过打造标准化产品组件,并根据客户的需求开发不同的系统界面,公司按数据接口收取年费;或者公司将数据资源加上算法一并交付客户,由客户结合自身的数据资源进一步加工处理形成自己的数据产品,公司一般按项目收取年费。

最后一家企业经过十年的应用实践,对原始业务数据的内容、质量及行业应用的延展性都非常熟悉,积累了丰富的产品、服务及合作模式经验,在应用产品及咨询服务中有能力最大化发挥数据资源的优势。目前企业的产品类别可分为风险类数据产品、营销类数据产品。企业通过综合自然语言算法(TF-IDF 提取、朴素贝叶斯等)、神经网络技术等技术,对全量商户数据进行了清洗和治理,完成商户名称、行业标准化处 理。企业的数据产品包含十一个维度 1000 多个特征。通过形成标准化的基础数据库,可供客户自由组合选择,满足不同客户对不同标签、不同特征的多元化需求。企业的产品一般分为按年包收费或按条计费两种方式。

4. 产品资产化

产品资产化是企业运用数据资产开展经济活动的过程,充分体现了数据资产的金融属性,也是数据产品从账面价值转向市场价值的重要一步,是探索数据资产公允价值的重要环节。

促进数据要素市场的交易与流通,市场主体一方面沿着数据要素价值链,正向推动数据资源化过程,提升数据资源的使用价值和交换价值,推进以数据产品为载体的数据资产入表;另一方面要积极研究数据资产创新应用,以数据资产经济价值的显性结果反向推动产业链各主体积极参与市场各项规则的建设。

中债估值的多种数据产品已形成公司稳定收入来源,客户覆盖境内各类大中型金融机构,服务包括境外央行、国际金融组织、主权基金和商业银行等境外客户。在数据产品开发过程中,估值公司在产品数据模型开发、自动化生产系统建设等方面大量投入,包括数据采集、清洗、加工流程、架构设计,计算公式开发,系统建设所需的数据、人工、系统资源等“数据产品生产线”的开发费用,均为数据产品成为资产前的必要投入,符合资本化条件。公司在管理数据产品时,在公司“数据血缘”、“公式血缘”等基础上,形成了“作业消耗资源,产品消耗作业”的“两步法”归集分摊原则,与上海数据交易所所提“三步蒸馏法”高度契合。

金润征信在物流运输、供应链管理、信贷、保险等行业不断深挖客户需求,在快速实现产品市场化的同时,不断实现产品的价值化。2022 年 2 月,金润征信的产品“高速通”正式在上海数据交易所挂牌,是首批挂牌的数据产品之一。截至目前,该企业已经在上海数据交易所挂牌了高速通、路径通两个系列共计 58 个产品,其中高速通产品 48 个。

合合信息自主研发的领先的智能文字识别及商业大数据核心技术已形成了丰富且广泛的产业化应用成果,C 端产品覆盖了全球百余个国家和地区的亿级用户,B 端服务覆盖了近 30 个行业的企业客户。公司的数据产品已经形成稳定的收入并持续为公司带来现金流入,从会计确认的角度看,合合信息在数据产品启信宝和启信慧眼开发过程中的投入,包括数据采集、购买、清洗、加工、算法等等相关的人力投入、设备投入、维护投入、安全投入,是属于该数据资产达到预定可使用状态的直接相关且必须投入,均符合资产化条件。

最后一家案例企业的产品可广泛应用于包括银行、持牌消费金融等各类型金融机构的贷前贷中风险识别及授信管理、存量客户经营、客户价值细分等多维场景,充分补充金融机构内部数据信息量及数据维度,有效提升金融机构风险管理水平及客户运营能力。在实际应用中,在风险层面上,多家金融机构贷前风险模型的模型效果平均提升 30% 左右,贷中风险模型的模型效果平均提升 25% 左右。营销层面,丰富的客户画像体系有效提升金融机构的客户精细化运营能力,基于消费偏好及消费能力的精准营销效果提升近 20%。

本文摘编自上海数据交易所发布的《数据资产入表及估值实践与操作指南》,全文下载:

更多标准、白皮书、报告等高质量纯净资料下载,在文末扫码关注官方微信公众号“idtzed”,进入公众号菜单“治库”,或按自动回复发送引号内关键词。

欢迎平台、工具、应用及案例入库、发布和召募,立即订阅数字推广DigiPacks 套餐,我们的目标是潜在客户,扫码添加老邪企业微信:

一条评论