随着“数据二十条”的发布,数据要素被赋予了空前重要的地位,如何激活数据要素潜能,做强做优做大数字经济成为了各方关注的要点。数字经济的发展须依赖供给和需求的良性循环,数据服务作为连接数据资产运营方和数据消费者的关键环节,在数据要素市场化发展的过程中有着至关重要的作用。完善的数据服务体系能使数据更好地服务于具体业务,为数据消费者创造更多的价值,数据资产服务化也成为了必然的趋势。由于企业对数据资产的管理和利用往往是通过数据中台(即企业围绕数据所做的一系列工作的集合)的方式,本文将依托《数据中台能力成熟度模型——数据服务》标准,重点围绕数据中台语境下的数据服务进行展开,旨在为机构规划数据服务体系建设提供参考。
数据服务是数据中台运营方进行数据相关能力输出的统称,是数据中台能力建设过程中的最后一公里。数据服务体系的构建存在着一定的复杂性,其复杂度主要来源于数据消费者的多元化:一方面,数据消费者可细分为多个群体,如数据分析师、产品经理、决策层用户等,不同群体的能力和诉求均有不同;另一方面,数据消费者可以来自于机构内部的其它部门,也可以是其它机构,各机构的数据应用方向以及数据流通、应用方面的合规性要求也存在差异。根据数据消费者的不同,企业进行数据服务的方式也须存在一定的多样性,以满足各方的不同诉求。
数据服务的四个层级
按照数据服务的方式可将其分为四个层级,其中数据即服务(Data as a Service, DaaS)、分析即服务(Analytic as a Service, AaaS)是数据服务的直接方式,也是现阶段各数据中台运营方普遍具备的服务层级,本文将详细进行说明;同时,本文也对知识即服务(Knowledge as a Service ,KaaS)、智能即服务(Intelligence as a Service ,IaaS)等数据服务发展趋势进行了探讨。须强调各层级的数据服务能力并非相互取代的关系,而是各有其适用的场景。
图1 数据服务的四个层级
数据即服务(DaaS)
DaaS形式的数据服务即是将用户需要的数据提供给用户,这里的数据可以是未经加工处理的数据,也可是加工后的指标和标签,用户得到数据后可根据自身的需求进行后续的分析挖掘等工作。这种方式的优点是可以让用户更加灵活地使用数据。DaaS形式的服务适用于技术实力较强的用户群体,在互联网、电子商务等数据密集型行业中,业务部门通常具备较高的数据分析、应用能力,数据中台以DaaS的形式支撑业务部门是最为常见的形式。如用户需进行多个外部数据源的联合分析,DaaS服务也是必备的服务形式。在轻量化的数据中台项目中,DaaS形式的数据服务通常也是建设方的首选。DaaS服务需要两方面关键的能力:
- 数据目录:用户在获取数据前须确认哪些数据是需要的,这就要求中台运营方能够以用户友好的形式将数据相关的信息展示出来。数据目录即是将数据进行分类后,以目录的方式进行呈现,这样能够更好的体现不同数据的业务含义,辅助用户快速定位所需数据,用户可以通过查询的方式筛选数据集,并通过浏览元数据、探查样例数据等方式了解数据集的细节信息。完备的数据目录具备血缘解析、智能搜索、智能推荐等能力,进一步优化用户定位数据的体验。
- 数据获取:由于用户所需的数据在体量、类型、敏感程度等方面均存在差异,数据中台通常需要提供多样化的自助取数服务(如下载,导出至目标库、目标工作环境,API传输等),供用户获取数据。对于周期性的取数要求,中台须支持数据的周期性推送。数据获取服务中的限制因素很大一部分是在安全方面,通常会依据数据的分级情况设定不同的权限审批流程、脱敏策略、传输安全策略等。
分析即服务(AaaS)
AaaS形式的数据服务即提供对数据进行分析挖掘的能力,用户可使用中台提供的数据分析挖掘工具栈,对数据进行分析洞察。AaaS形式的服务可以单独提供(例如各大云厂商提供的分析云平台),也可结合DaaS服务一同提供:以DaaS形式服务外部客户会涉及到很多数据开放流通过程中的安全合规等问题,这使得很多数据资产运营方选择以DaaS+AaaS相结合的形式提供服务,即在数据资产运营方的平台上为用户建立数据沙箱,提供数据及分析服务,确保用户能在数据不流出平台的情况下使用数据。AaaS服务包括提供自助分析、分析模型的管理及运行支持等方面:
- 自助分析:用户可使用中台提供的分析算法、分析模型等能力实现对数据的自助分析,对于较为复杂的数据分析挖掘任务,用户也可在中台提供的环境中自行建模。自助分析能力的差异性主要体现在两个维度:广度方面,完备的自助分析须贴合各类用户群体的实际业务场景,从而赋能于更加广阔的用户群体,也可采用增强分析、可视化交互、低代码开发等方式降低使用门槛。深度方面,完备的自助分析服务也须具备更具深度的分析能力,包括预测性分析、规范性分析等,同时支持多样化的分析算法,用户也可自行构建分析模型。
- 分析模型管理:用户可使用中台进行分析模型的管理工作,包括对模型的分类管理、版本管理、模型分享等。通过对模型进行标签化、分类分层的管理使用户能够更好地定位所需要的模型,并实现模型的共享和复用,从而提升分析工作的效率。
- 模型运行能力:用户可使用中台运行分析模型,中台须提供模型的运行环境,提供模型运行的调度模式、资源、安全等方面的管理能力。并对模型运行结果进行分析展示。
知识即服务(KaaS)
KaaS形式的数据服务不直接提供给用户数据和分析能力,而是将数据转化成知识,以知识咨询服务的形式对外提供。典型的代表企业例如大数据公司Palantir,其典型案例包括帮助美军成功定位和击毙基地组织首脑本拉登、帮助美国证监会发现麦道夫“庞氏骗局”等。有别于其它大数据公司,Palantir采取了知识咨询而非直接提供数据及分析能力的服务方式,通过直接派遣训练有素的分析师提供驻场分析咨询从而更准确地识别客户痛点。KaaS的服务形式具备的优势体现在多个方面,一是可以避免数据流通过程中存在的安全问题,用户也无需投入资源进行外部数据源的开发管理;二是对于数据应用能力不足且无需发展相关能力的用户群体,KaaS的服务形式将对用户更加友好。大数据相关企业提供KaaS服务也具备一定的门槛,一是需要具备经验丰富的分析咨询团队,二是需要在中台能力中加入配套的知识管理、知识挖掘体系,实现对知识的高效管理、分析挖掘和共享复用。
智能即服务(IaaS)
IaaS形式的数据服务不直接提供给用户数据和分析能力,也不直接向用户提供知识咨询,而是提供由数据训练而来的AI模型。在风控、营销等领域,已有通过API的形式提供人工智能决策支持的案例。随着ChatGPT等生成式AI技术的逐步发展,IaaS的数据服务形式将更多地出现在公众的视野中。在专业领域,以谷歌发布的Med-PaLM、Nuance 发布的DAX为代表的医疗大模型以初步具备市场化能力。以数据训练AI模型,再以AI模型提供服务的形式将具备广阔的发展前景。
影响数据服务效果的关键因素
上文说明了数据服务须做到服务类型和用户群体的匹配,除此之外,一些其它因素也会影响数据服务的效果,这里主要列出了三大关键因素。
指标及标签体系管理
为用户提供指标和标签的能力支持是数据中台的重要职能之一,其中指标是对一些重要业务事实的描述,标签是一些业务实体的抽象特征,两者均和实际业务场景关系密切。这就要求数据中台的运营方和用户之间在指标及标签体系构建方面建立起有效的交互机制,否则将导致供给侧和需求侧的脱节,致使中台方大量指标和标签无人使用,徒耗算力,用户也难以找到合适的指标和标签。构建较为完善的指标及标签体系须注意以下两点:一是需要在中台运营方和用户间建立一套统一的指标管理规范、命名、术语及单位规则,确保信息交互通畅;二是需要具备指标及标签生命周期的闭环管理,覆盖需求征集、开发、上线发布、运营运维、下线等环节。
数据服务运营
数据服务的运营能使服务更好地赋能于用户,提升用户数量和使用频率,数据服务运营不仅局限于对用户需求反馈的被动响应,也体现在宣传、推广、举办培训及竞赛等主动运营方面。在数据服务方面,数据中台运营方常常会出现”重技术、轻运营“的问题,这在对内服务的数据中台运营过程中尤为明显。构建完备的数据服务运营体系须注意以下几点:一是建议以统一的数据服务门户对服务进行管理,并以此为基础进行运营活动。对用户来说,数据服务门户类似于电商的门户网站,能给人带来直观的体验。围绕门户进行运营和宣传对构筑品牌效应来说能起到事半功倍的效果;二是建议以用户工作中遇到的实际业务场景为出发点,结合企业的数据战略宣传开展运营活动,这样可大幅提升活动参与的积极性,并获得用户高层的支持;三是须建立服务运营活动的闭环管理机制,包括运营策划、用户激励、活动情况分析、优化提升等环节。
数据服务接口
由于大量的数据服是以API的形式对外提供,对数据API的支持能力也是影响数据服务效果的重要因素。数据服务API常常会面临服务连续性的问题,也易成为网络攻击的目标,其安全性和稳定性将在很大程度上决定数据服务的质量。供需双方在数据服务API的使用计费、易用性等方面也易产生分歧。
本文作者: