数据协作平台落标的一般规则、角色与流程

基于区块链的数据协作平台是指在区块链网络环境下,通过隐私增强技术在多方主体之间对数据进行共享计算,且不泄露隐私数据的信息化平台。

数据协作平台落标的一般规则、角色与流程
出处:可信区块链推进计划

基于区块链的数据协作平台是指在区块链网络环境下,通过隐私增强技术在多方主体之间对数据进行共享计算,且不泄露隐私数据的信息化平台。数据协作平台应在数据安全和个人信息保护条件下,实现数据流通和数据挖掘。数据协作平台可包含区块链系统、隐私计算系统、服务管理系统以及数据协作组件,如图 1 所示。

图 1 基于区块链的数据协作平台参考框架(一)

  • 区块链系统

区块链系统用来保障数据协作全流程的可验证、可审计和可追溯。区块链系统包含对等网络接入、分布式存储、共识机制和智能合约等功能,可通过集成一个或多个隐私增强技术保护链上数据的安全性和隐私性。同时,区块链系统可为隐私计算系统提供机构管理、数据目录管理、身份权限管理、计算流程管理、计算资源管理、数据生命周期管理和计费管理等多种服务。

  • 隐私计算系统

隐私计算系统应满足在数据提供方不泄露原始数据的前提下,对数据进行使用、分析、共享和流通。隐私计算系统可通过结合区块链技术保障数据的可控可追溯、数据计算过程的可验证以及计算结果的可度量。隐私计算系统可包含多方安全计算、联邦学习和可信执行环境等技术中的一种或多种。

  • 服务管理系统

服务管理平台包括账户权限管理、服务访问管理、安全管理、分布式身份管理、互操作管理、运维监控管理、数据协作配置组件等功能。

  • 数据协作组件

根据实际应用场景需要,数据提供方和数据需求方可灵活并组合使用的数据协作组件,降低数据协作的技术对接成本。数据协作组件包括但不限于联合查询、联合统计、特征工程、联合建模、联合预测等功能。

a) 联合查询:支持匿踪查询和隐私求交。通常匿踪查询应用于实时查询场景,隐私求交应用于离线批量查询。匿踪查询应用服务应满足数据提供方无法获知具体查询 ID 信息,数据需求方仅能获得查询 ID 对应的查询结果,不能获得其他信息;隐私求交应用服务应满足数据需求方只能获得交集信息,所有参与方均无法获得非交集的其他参与方信息;
b) 联合统计:支持方差、中位数等统计运算。联合统计应用服务的算法安全性应满足在计算过程中没有泄露用户输入数据,没有暴露各数据方本地或全局的中间数据等要求;
c) 特征工程:支持如预处理功能、特征相关性分析、特征选择等处理能力。特征工程应用服务的算法安全性应满足在计算过程中没有泄露用户输入数据,没有暴露各数据方本地的中间数据;
d) 联合建模:支持二分类算法、多分类算法、回归算法等多种常用机器学习算法;宜支持无监督学习算法、深度学习等算法。联合建模应用服务的算法安全性应满足在计算过程中没有泄露用户输入数据,没有暴露各数据方本地或全局的中间数据等要求;
e) 联合预测:支持离线预测和实时预测。联合预测应用服务的算法安全性应满足在计算过程中没有泄露用户输入数据,没有暴露各数据方本地或全局的中间数据等要求。

图 2 基于区块链的数据协作平台参考框架(二)

一、数据协作平台的一般规则

  • 安全隐私原则

a) 数据协作平台应采取个人信息安全保护技术和管理措施,确保各角色的身份真实可信,同时避免个人信息的非法收集、滥用、泄漏等安全风险,切实保护个人权益;
b) 数据协作平台应具备数据存储、传输及应用的安全保障机制,保障数据提供方按照平台要求在数据不泄露的前提下提供数据,数据需求方按照数据提供方声明的方式使用数据;
c) 数据协作过程不应泄露数据提供方提供的原始数据;数据提供方提供的原始数据,在隐私计算任务执行过程中不应以明文形式或可被其他参与方解密后导出将数据交互给其他参与方;在数据协作任务执行过程中,隐私计算过程的中间结果、链上计算过程的中间结果、链上存储的数据内容均应不包含原始数据、不能反推得到原始数据;
d) 数据协作过程采用的设计方案或协议原理应满足各自技术领域的安全模型设计,并结合具体业务场景需求,满足不同层级要求的抗恶意攻击行为;
e) 数据协作任务的结果仅允许数据需求方获取,其他参与方无法直接查看或反推计算结果。

  • 分级授权原则

a) 数据协作平台应建立用户的账户管理体系,提供便捷、易用、可靠的分级授权方法,采用多角色授权机制,根据不同数据访问权限和级别,向不同业务相关方提供数据服务;
b) 数据分级分类应综合考虑数据属性、特点、数量、质量、格式、重要性、敏感程度等因素,对数据资源进行分类分级,并针对不同等级的数据,配备合规的安全保护措施;
c) 数据协作平台应具备针对数据需求方和数据用途的鉴权和授权机制,仅当数据提供方明确授权后,数据才能用于隐私计算;隐私数据应只授权给职责范围内、使用期限内或应用场景涉及的相关方;
d) 平台存储的所有数据应遵循审慎管理的原则,即按需最小存储,对平台服务过程中涉及到的数据收集、存储、传输、处理、使用等过程都应满足相应的平台安全等级的合规要求;
e) 保证输入数据和计算任务的独立性,多个数据提供方在构建输入数据时相互独立,多个计算任务在执行时相互独立。

  • 明示同意原则

a) 数据需求方使用数据时必须明示数据提供方(包括实体和个人),数据提供方有选择权;
b) 平台服务提供方、数据需求方应依据所声明的处理目的和隐私主体的授权,保留和更新必要的隐私数据,处理目的达成或授权时效过期后应及时删除隐私数据;
c) 数据提供方应有权审核和修改自身提供的隐私数据;
d) 数据需求方应仅按照明确声明和授权用途使用隐私数据;
e) 在涉及到可能出现的安全风险并可能导致数据泄漏时,应立即上报主管单位,并及时通知各相关方,同时采取最妥善措施消除安全隐患;
f) 未经授权不得擅自留存及使用数据供方或需方的数据或数据衍生品。

  • 公开透明原则

a) 应向数据提供者告知其服务原理、安全等级、局限性和可能存在的风险;
b) 对相关业务服务过程中产生所有数据和行为进行签名,数据协作过程应通过区块链对数据使用等关键信息进行记录,保障数据行为可追溯、可审计;
c) 数据的使用情况及变更情况需及时告知数据提供者与数据需求方;
d) 当数据协作平台出现安全风险并可能导致敏感信息泄漏时,应及时通知相关方。

  • 合规审计原则

a) 数据协作应遵守我国关于数据安全管理的相关法律法规,尊重社会公德,不得损害国家利益、社会公共利益和他人合法权益;
b) 数据协作平台应根据国家相关规定取得有关认证资格,应按照有关部门出台的业务规则要求对外提供服务,积极公布、备案业务规则,事先考虑监管需求并接受监督管理;
c) 数据协作平台应支持对数据协作过程的可审计,将必要的关键环节在链上进行存储,审计日志应至少包含隐私计算过程中的密文输出、中间因子、关键指标的校验值等信息;
d) 隐私数据在上链前,应对其进行主动检测,如发现违规内容,进行上报,同时不予上链;
e) 应对上链后的隐私计算数据进行管控,达到有害信息屏蔽,防止对公众暴露。如针对违规内容进行巡查,发现违规信息,进行上报,并对违规信息进行屏蔽或过滤处理,阻断继续传播;
f) 在数据协作过程中均能产生对应过程的日志且日志记录正确,同时保存的日志中在非必要的情况下不允许包括关键/敏感等信息,如果必须包含关键/敏感等信息,需要对日志采用密码技术或脱敏技术进行保护,且采用的密码技术应符合国家密码管理部门相关要求,日志保存期限应满足6个月以上。

二、数据协作平台的相关角色

图 3 展示了数据协作平台的相关角色以及他们之间的活动。根据数据协作平台开发、研制、使用和管理运维过程,参与数据协作平台的角色主要包括数据提供方、数据需求方、平台服务提供方、技术提供方和第三方协作方。

图 3 数据协作平台相关参与方关系图

1. 数据提供方

数据提供方是指在数据协作平台上提供数据资源的主体。数据提供方的活动包括但不限于:

a) 注册与实名认证:使用组织机构代码、统一社会信用代码、证件三要素(姓名、证件类型和证件号码)和移动电话号码等方式进行真实身份信息认证,并经数据协作平台审核通过;
b) 签订服务协议:与平台服务提供方签订服务协议,明确双方权利和义务,遵守数据协作平台的安全管理制度和流程,承诺并遵守国家相关法律法规和平台安全原则;向数据协作平台提供书面的安全承诺,遵守数据协作平台的安全原则,提供数据来源合法性证明、数据质量评估等材料,接受数据协作平台安全监督;
c) 提供数据产品:数据提供方可通过技术提供方或平台服务提供方提供的客户端 SDK、应用程序、用户图形接口、命令行界面等工具在数据协作平台上登记、发布、准备、授权自己的数据产品。

2. 数据需求方

数据需求方通常也叫数据使用方,是指在数据协作平台中使用数据的主体,通过平台直接或间接使用数据提供方的数据。数据需求方的活动包括但不限于:

a) 注册与实名认证:使用组织机构代码、统一社会信用代码、证件三要素(姓名、证件类型和证件号码)和移动电话号码等方式进行使用方的真实身份信息认证,并经数据协作平台审核通过;
b) 签订服务协议:与平台服务提供方签订服务协议,明确双方权利和义务,遵守数据协作平台的安全管理制度和流程,承诺并遵守国家相关法律法规和平台公约;向数据协作平台提供书面的安全承诺,接受数据协作平台的安全监督、遵守与数据供方约定的数据安全要求、对所持有数据提供充分的安全保护、未经明确授权不公开或转交数据给第三方等;
c) 使用数据产品:数据需求方可通过技术提供方或平台服务提供方提供的客户端 SDK、应用程序、用户图形接口、命令行界面等工具在数据协作平台上使用或购买数据产品;数据需求方须按照约定的使用目的、范围、方式和期限使用数据产品。

3. 平台服务提供方

平台服务提供方通常也是主体责任方,负责集成区块链、隐私计算和服务管理等系统,封装数据提供方和技术提供方的相关资源、算力和服务,提升平台管理、部署和运维水平,统一的对外输出数据协作服务能力,直接或间接为数据提供方和数据需求方提供服务。平台服务提供方的活动包括但不限于:

a) 节点运营:负责数据协作平台的运维管理,维护数据协作平台的长期稳定运行,保障数据协作平台的可用性、安全性和高效性;直接或间接为数据协作平台的终端用户提供服务;
b) 任务调度和执行:负责接收数据交付任务请求、分解计算任务、调度分配计算任务、执行计算任务、聚合中间结果并可靠投送计算结果给数据需求方;如果计算任务执行方不是平台服务提供方(有代理模式),平台服务提供方只担当计算任务协调方,平台服务提供方负责调度分配计算任务给计算任务执行方,要求计算任务执行方不可以获取到隐私数据的原文(包括解密结果和中间结果);
c) 服务管理与监控:管理计算、存储、网络和软件资产及相关的基础设施;对数据协作平台运行的状态进行实时监控,随时发现服务的运行异常和资源消耗情况,输出重要的日常服务运行报表以评估服务整体运行状况,发现服务隐患;
d) 故障响应与处理:确保快速、有效和有序地响应并处理故障,尽可能避免问题的扩大化甚至中止服务,在必要的时候需要与数据应用提供方及技术提供方一起协调解决。针对各种类型的网络攻击采取防护措施,保障提供安全可信的服务,防止隐私数据泄露;
e) 信息服务备案:在提供数据协作平台服务之日起十个工作日内应通过国家互联网信息办公室区块链信息服务备案管理系统填报服务提供者的名称、服务类别、服务形式、应用领域、服务器地址等信息,履行备案手续;对开发上线的新产品、新应用、新功能,按照有关规定报国家和省、自治区、直辖市互联网信息办公室进行安全评估;
f) 服务备案变更:在变更许可链服务项目、平台网址等事项时,于变更之日起五个工作日内在区块链信息服务备案管理系统办理变更手续;
g) 服务备案注销:在终止数据协作平台服务时,于终止服务三十个工作日前在区块链信息服务备案管理系统办理注销手续,并作出妥善安排;
h) 违规举报与处理:对违反法律、行政法规规定和服务协议的节点运营方、应用服务提供方和使用方,依法依约采取警示、限制功能、关闭账号等处置措施,对违法信息内容及时采取相应的处理措施,防止信息扩散,保存有关记录,并向有关主管部门报告;
i) 配合监管:配合网信部门依法实施的监督检查,并提供必要的技术支持和协助;应当记录区块链信息服务使用者发布内容和日志等信息,记录备份应当保存不少于六个月,并在相关执法部门依法查询时予以提供;接受社会监督,设置便捷的投诉举报入口,及时处理公众投诉举报。

5. 技术提供方

技术提供方是指支撑数据协作平台技术迭代、系统和功能实现的一个或多个主体方,技术提供方可包括区块链技术提供方和隐私计算技术提供方。区块链技术提供方是指提供区块链平台或技术支持的机构或者组织,负责开发区块链及其应用程序,创建和维护代码以及专用设备,提供相关技术支持和服务。隐私计算技术提供方是指隐私计算平台开发、运维部署方,以及隐私计算算法协议设计开发者。隐私计算技术提供方同时负责隐私计算平台与其他平台(如区块链)的合规互通。技术提供方的活动包括但不限于:

a) 技术开发:负责设计和研发区块链功能及相关应用程序,提供区块链的相关技术支持,创建和维护代码以及专用设备;
b) 功能实现与测试:负责收集数据协作平台运营方、数据应用提供方和终端用户的业务需求和技术需求,并根据需求分析的输出,设计并开发出符合需求的、完整的、可供交付的数据协作平台系统及工具;在测试环境下,对数据协作平台进行功能验证,以确保满足需求;
c) 系统维护:根据使用方需求反馈、技术进步以及各种异常情况,维护和更新数据协作平台;
d) 应用开发:基于行业背景、业务需求等因素与数据协作平台建立业务关系,可以通过使用数据协作平台进行服务开发、测试业务应用。

6. 第三方协作方

第三方协作方是指负责对数据协作平台进行审计或评估的第三方机构或者组织,主要包括审计机构、评估机构和监管机构。审计方通常负责检查相关的审计准则是否得到满足,覆盖功能、运营、性能和安全等方面。审计方需遵循独立性、客观性原则,运用系统化和规范化的方法,通过监督、评价和咨询等方式,促进数据协作平台建立并持续完善有效的风险管理、隐私管控、内控合规和治理架构,实现数据协作的业务目标;监管机构依照相关政策和法规对平台进行监督检查,维护平台的合法、安全、稳健运行,与系统部署管理者等合作提供监管技术和接口。第三方协作方的活动应包括:

a) 组织调研:与主体责任方、技术提供方和节点运营方相关人员面谈并查阅相关技术与应用的基本资料,归纳出数据协作平台审计的重点和特点;
b) 数据资产评估:从成本角度及收益/效益角度对数据资产价值进行全面分析,对数据资产进行描述和展示,揭示和发现数据资产的价值;
c) 内控审查:对数据协作平台内部控制、治理、风险管控的健全性和有效性进行评估;促进数据协作平台主体责任方、技术提供方、节点运营方、应用服务提供方之间建立并持续完善有效的风险管理、内控合规和治理架构,实现数据协作平台的开放与合规业务目标;
d) 合规审查:对数据协作平台的运营和安全进行合规审计,检查相关审计准则是否得到满足,对数据协作平台的合法性、可靠性、安全性、账本记录的完整性和准确性进行审查;
e) 输出审计报告:以文档报告的形式向主体责任方、节点运营方、治理委员会提供审计或评估结果;向监管机构呈递威胁情报、风险评定结论;
f) 监管审查:如果数据协作平台的应用服务所属行业领域有明确的法律规定需要引入监管机构, 则需引入监管机构参与监管;监管机构负责依照相关政策和法规对数据协作平台进行监督检 查,维护数据协作平台的合法、安全、稳健运行。

三、数据协作平台的业务流程

图 4 基于区块链的数据协作平台参考业务流程

1. 用户准入

数据提供方、数据需求方、第三方协作方等相关方在注册成为数据协作平台的用户前需要发起身份认证,提交所需材料进行身份认证,如组织机构代码、统一社会信用代码、证件三要素(姓名、证件类型和证件号码)和移动电话号码等,并经数据协作平台审核通过后才可进行操作处理。

数据协作平台为终端用户提供的接入方式包括但不限于:

a) UI界面或客户端:通过前端用户界面或应用软件客户端等方式完成用户准入、数据产品登记、数据上传和下载、数据加密和解密、产品上架和下架及授权使用;
b) 隐私计算节点:负责对数据产品进行隐私计算,包括密文计算、多方安全计算和联邦学习等方式;隐私计算节点可分别在区块链平台中发布数据产品;
c) 区块链节点:执行智能合约,包括数据产品凭证合约、数据交付业务存储合约和密文计算合约, 数据使用方可在区块链平台中查看被发布的各个原始数据的描述信息。

2. 数据登记

数据提供方出于维护合法权益的需要,依照法规规定在数据协作平台上将所持有数据的控制状况(包括数据的内容范围、使用范围、使用期限等)予以记载,并通过区块链系统进行公示的行为。登记的目的在于合法性确认,数据提供方自愿将数据产品和操作记录在区块链系统上备案存证,为潜在的数据权益纠纷和数据来源争议留存证据,并发挥唯一标识数据产品的作用。

3. 数据准备

用户在数据协作平台上对数据产品进行管理,方便数据协作过程中数据的灵活使用。数据协作平台应提供原始数据的处理和分析工具,支持数据提供方在线完成数据准备工作,为数据协作平台提供高质量的接入数据。

4. 数据检索

数据协作平台应对已登记的数据产品上链形成链上的数据资源管理目录,并支持用户快速检索匹配自身需求的数据产品。

5. 数据申请

当数据需求方发现符合自己需求的数据产品时可申请使用该数据产品。数据需求方可根据需求选择数据产品并发起数据使用申请,数据协作平台收到数据提供方的授权同意后,根据数据交付模式发起数据交付任务,并将任务信息进行上链存证。

6. 授权审批

数据提供方在收到数据需求方发起的数据使用申请后,可查看数据交付任务或项目的基础信息以及申请的数据产品对象,并对数据申请进行审批及管理操作。数据提供方从数据提供的角度,评估合作价值,并对数据交付进行授权;平台服务提供方从数据管理的角度,评估数据安全风险,并对数据交付进行授权审核。审批通过后,数据需求方可发起数据交付任务并使用数据产品。

7. 数据交付

数据提供方在数据协作平台上发布数据产品可包括API接口、数据集和数据增值服务等,也可为文档、视频、音频、图片等其他格式数据。数据需求方可通过数据协作平台提供创建待执行数据交付任务。数据交付模式可包括委托加工模式、交易撮合模式和计算交付模式:

a) 委托加工模式:数据提供方采用加密方式将数据密文托管给数据协作平台,如对称加密、代理重加密、同态加密等密码学方案。数据协作平台依据数据提供方托管的数据进行加工处理,再寻求数据交付可能性的一种协作模式;
b) 计算交付模式:数据协作平台协商数据提供方和数据需求方需求,按协商结果提供数据加工及交付服务的一种协作模式。数据提供方和数据需求方采用联邦学习、安全多方计算、可信执行环境等方式参与数据协作;数据交付任务可为多个可信执行环境中的子任务;或者多个多方安全计算子任务;或者多个模型训练的子训练任务。在该模式下,数据提供方的原始数据始终并未真正发送至数据协作平台,即原始数据并未出数据提供方的私有域;
c) 交易撮合模式:数据协作平台依据数据提供方和数据需求方需求,为双方提供撮合服务,数据交付由双方直接完成或第三方参与完成的一种协作模式。数据提供方和数据需求方之间以数据产品作为交易对象,进行的以货币或货币等价物交换数据产品的行为。数据产品可包括用于交易的原始数据或加工处理后的数据衍生产品。

8. 数据审计

数据审计是对数据协作过程中的关键行为进行日志记录,并向数据提供方和数据需求方提供日志查询服务,便于对数据交付任务进行跟踪和事后审计;数据协作平台应根据数据提供方或数据需求方的要求,对数据协作过程进行追溯性处理,并将追溯性处理结果同步至数据提供方或数据需求方。

本文摘编自可信区块链推进计划发布的《基于区块链的数据协作平台能力要求与评估指南》,全文下载:

更多标准、白皮书、报告等高质量纯净资料下载,在文末扫码关注官方微信公众号“idtzed”,进入公众号菜单“治库”,或按自动回复发送引号内关键词。