和每个人都有关的消费者数据流通利用再分析

消费者数据空间基于一致的规则、标准和架构,以数据流通基础设施为驱动,以垂直场景为切入,以消费者同意为前提,实现市场参与者之间安全可信数据流通的生态体系。

和每个人都有关的消费者数据流通利用再分析
出处:数据流通利用研究报告(2024年)

消费者数据流通利用是我国数据产业和数字经济发展的重要突破口,我国应当积极借鉴各国成功经验,积极探索基于可携带权的消费者数据要素流通利用新模式,此前在《数治长文 | 可携带!四大逻辑让你的消费数据活起来》一篇中已提到。

消费者数据是标准化程度最高、商业变现能力最强、最为活跃的数据类型之一,具有巨大的分析价值,海量、高质量的消费者数据由政府、公共企事业单位,金融、电信、互联网行业等企业掌握。但由于激励不足、存在合规风险、缺乏统一可信环境等原因,导致各方不愿、不敢、不会将数据供出或加工使用,造成当前“无数流通”的局面。

为促进以上问题的解决,消费者数据空间基于一致的规则、标准和架构,以数据流通基础设施为驱动,以垂直场景为切入,以消费者同意为前提,实现市场参与者之间安全可信数据流通的生态体系,真正实现“还数于民”。在保障消费者数据权利的同时,极大推动商业创新和经济发展,随着信息技术发展,以及法律、监管、商业模式层面的突破,破解了个人数据保护、持有者权益和数据产业发展的不可能三角。

1. 参与方/主体

消费者数据流通的各主体包括数据消费者、数据持有者、数据接受者、数据监管者。

表 1 消费者各个主体和权利

主体类型 主体范围 权利
数据消费者 任何主体,包括个人、个体工商户、中小微企业等 可以确认数据持有者掌握的与本人或本企业相关的数据,获取数据副本或者指定传输至可信第三方,行使同意、拒绝、撤销等权利,一站式使用基于本人或本企业数据开发的 APP 应用,充分享受数据红利
数据持有者 政府部门(包括社保、税务、公积金、学历教育、婚姻等领域数据)、公共企事业单位(包括供水、供电、供气、通信等领域数据)、金融机构、大型平台公司等 可以发布数据目录和 API 服务,并对数据传输进行监测统计
数据接收者 公共服务、普惠金融、医疗健康、社会管理等领域的大数据公司、科技公司、初创公司等市场创新主体 可以发布面向消费者的创新应用,按照三方电子合约要求使用数据,对数据传输进行检测统计
数据监管者 / 可以实时掌握消费者数据的分布、流向、使用情况、用途等,必要时可对三方电子合约和日志记录进行取证

2. 数据介绍

所谓的消费者数据,是指消费者在使用政府部门、公共机构、企业等组织的提供服务过程中,产生的与本人或本组织相关联的电子数据,这些数据一般由提供服务的组织持有。

从数据主体角度,消费者数据有两种分类方式。

个人消费者数据是指“与已识别或可识别的个人(数据主体)有关的任何数据”。包括但不限于以下类型的数据:

  • 用户生成的内容,包括博客和评论、照片和视频等。
  • 活动或行为数据,包括人们在互联网上搜索和查看的内容,网上购买的商品,支付的金额和方式等。
  • 社交数据,包括社交网络站点上的联系人和朋友。
  • 位置数据,包括居住地址、GPS 和地理位置(例如来自手机的位置数据)、IP 地址等。
  • 人口统计数据,包括年龄、性别、民族、收入等具有统计属性的数据。
  • 具有官方性质的身份数据,包括姓名、银行账号、健康信息、社会保障号码、警务记录等。
  • 企业(含个体工商户)消费者数据,指“与已识别或可识别的企业(数据主体)有关的任何数据”。包括但不限于以下类型的数据。
  • 登记数据,包括成立时间、注册资本、在营状态、企业类型等。税务数据,包括税务登记、税务许可、纳税信用等级、欠税、涉
    税处罚等。
  • 知识产权,包括专利、著作权、商标等。 交易数据,包括招标、采购、政府合同等。
  • 金融数据,包括开立账户、贷款、支付流水等。
  • 资信数据,包括行政许可、资格资质、行政处罚、司法判决等。

从数据流通利用角度,消费者数据有三种分类方式。

按权利主体划分:反映利益相关者

消费者在享用数字服务过程中,数据被不同组织采集、存储和处理。消费者数据的利益相关者划分为持有主体(DataHolder)和数据主体(DataSubject),持有主体是消费者数据的实际控制者,包括政府、企业等。数据主体是消费者本人。

无论是政府、企业,其持有的消费者数据受隐私和商业秘密保护制度约束。同时,不同持有主体会有不同的利益诉求。例如企业对消费者数据的聚合加工形成的数据资产,通常认为企业应该享有知识产权和财产收益权。而在政府领域,对于匿名化后的消费者数据,通常认为政府应该具有开放义务。

按识别程度划分:反映伤害风险

ISO/IEC 20889:2018 区分了五个个人数据可识别性类别或状态,包括(按可识别程度逆序排列):

  • 识别数据:可以明确地与特定人员相关联的数据,从中可以直接观察到个人身份信息。
  • 假名数据:所有标识符被别名替代的数据,其别名分配方式是,除了执行该操作的一方之外,其他任何人都无法通过合理努力进行逆转。
  • 未链接的假名数据:所有标识符被擦除或替换为别名的数据,其分配函数被擦除或不可逆,以至于包括执行该操作的一方在内的任何人都无法通过合理努力重新建立链接。
  • 匿名数据:未关联的数据,其属性被更改(例如,属性值被随机化或泛化),以使人们有信心认为,仅凭数据本身或与其他数据结合,个人身份无法直接或间接地被识别。
  • 聚合数据:不包含个人级别条目的统计数据,由足够多的不同人员的信息组合而成,个人级别的属性无法识别。

五种分类反映了数据可追溯到身份(包括个人或组织)的程度,有助于评估隐私风险的程度,进而确定法律和技术保护的必要程度,包括所需的访问控制程度。数据与身份相关联性越强,隐私风险就越高,再利用性也会随之增加。

按来源方式划分:反映对数据创建的贡献

在数据的生产过程中,通常会涉及多个利益相关方。上述讨论的分类未能区分不同利益相关方如何共同创造数据。根据数据的生成或收集方式,可将数据分为以下几类:

  • 提供数据,是消费者主动且有目的地分享的数据。
  • 观察数据,在活动被捕捉和记录时创建的。与提供数据不同,数据持有者扮演着积极的角色,数据主体的角色是被动的。
  • 派生数据及推断数据,通过数据分析生成。在这一过程中,数据处理者扮演着主动的角色,数据主体对于他们的信息如何被推断通常毫无所知。

3. 流通利用模式

消费者数据流通采用 API 交互方式实现数据流通,即数据接收者通过应用程序接口调取数据持有者的数据,这种模式允许不同的应用程序或系统之间进行数据交换和集成。不同于“数据交易”,API 本质上是一种数据服务交付方式,数据持有者可以通过 API 实施多种限制,包括用户身份、数据项、数据范围、时间段等,以更好地控制数据访问。

消费者数据空间中数据消费者、数据持有者、数据接收者之间的数据流和交互流程如下:

  • 数据持有者与数据接受者执行接入注册流程,数据流通平台进行用户的数字身份认证与发放。
  • 用户向数据接受者(如金融科技公司)请求服务,例如贷款服务等。
  • 数据接受者处理请求,在其流程中,需要访问保存用户信息的第三方数据持有者。数据接受者向数据消费者显示需要添加信息的来源列表(银行、保险公司、政府机构等)。
  • 数据消费者同意访问所请求来源的数据。
  • APP 应用连接到后端服务器,该服务器与数据流通基础设施具有安全、私密和加密连接。后端服务器向数据流通基础设施发送令牌请求。
  • 数据流通基础设施对后端服务器进行身份验证和验证,并生成一个令牌。APP 应用接收到令牌。
  • 后端服务器通过API 与数据持有者建立直接连接,使用提供的令牌。
  • 数据持有者连接到数据流通基础设施以验证令牌。
  • 数据流通基础设施回答令牌验证。
  • 如果令牌有效,则数据持有者返回数据接受者请求的数据。令牌可以在较长时期内保持有效(到期)。该过程包括时间戳和密码学等安全机制,以确保步骤 8 和 9 的安全可信。

2021 年 11 月 1 日起施行的《中华人民共和国个人信息保护法》中明确规定了“个人请求将个人信息转移至其指定的个人信息处理者,符合国家网信部门规定条件的,个人信息处理者应当提供转移的途径”,这就赋予了个人主动流转个人信息的权利,为消费者数据应用场景提供了坚实的法律保障。2022 年 12 月 2 日,中共中央、国务院印发的《关于构建数据基础制度更好发挥数据要素作用的意见》对于健全个人信息数据授权同意机制和保护各方合法权益提出明确要求。

在建立健全个人信息数据确权授权机制方面,明确提出要推动数据处理者按照个人授权范围依法依规采集、持有、托管和使用承载个人信息的数据,规范对个人信息的处理活动,不得采取“一揽子授权”、强制同意等方式过度收集个人信息。

在建立健全数据要素各参与方合法权益保护制度方面,明确提出要保障数据来源者享有获取或复制转移由其促成产生数据的权益;同时,要充分保障数据处理者使用数据和获得收益的权利。这为构建基于个人同意、可持续发展的消费者数据应用体系指明了前进方向、提供了根本遵循。

消费者数据空间实现了一种以用户为中心的闭环模型,在其中,数据消费者是个人数据流通的发起者,也是最终服务的受益者,最终形成逻辑闭环。在消费者数据流通利用生态中,所有角色均能充分享受数据流通所能带来的红利。

对于数据持有者而言,促使其进行数据分享的内驱动力不应仅仅是为了履行法定义务,因为数据分享需要实实在在的投入,包括 API 开发、目录注册发布、 软硬件和数据维护等成本。因此数据持有者在个人数据流通中,可以收取一定费用,以弥补相关投入成本。同时,也需要依法保护数据持有者对持有数据资产进行加工利用和产品经 营的权利。履行提供数据义务并不妨碍数据持有者对数据的加工使用权和产品经营权。此外,政府可以对履行义务较好的企业进行荣誉表彰或给予一定程度的政策优惠,从而激励数据的供给,让数据从源头实现“供得出”。

对于数据接受者而言,接入消费者数据流通生态可降低获得数据的成本,通过创新产品设计和数据服务形成收益,增加用户黏性,获得发展动力,让数据在流通路径上实现“流得动”。

对于数据主体而言,可实现对个人数据的自决权,享受更加便捷的数字服务,通过个人数据获得真实的收益。在医疗场景中,消费者可以授权数据接收方对医疗机构所持有的个人数据进行加工处理,从而进行疾病预测、诊断、治疗和康复等工作,提高医疗服务的效率和质量。例如,通过对个人病史、家族病史、过敏症等信息的分析,制定形成个性化的治疗方案,降低医疗风险和经济负担;在消费场景中,消费者可以通过相关机构处理形成的个人信用评分获得享受更大的 折扣,减免押金,先用后付等服务。让数据在最终用户端实现“用得好”。

消费者数据空间的建立使个人数据不再是静态的,而是成为推动个性化服务和产品创新的动力,在数字经济中创造平衡、公平、多样性和竞争,从而增加消费者福祉、繁荣数据产业、促进经济增长。

4. 举例:个人出行数据助力社会精准治理

政法机关在犯罪调查时,需要通过海量个人出行数据追踪犯罪嫌疑人行踪,以便及时采取打击措施。犯罪嫌疑人信息为高机密数据,故现公安部门等执法部门向民航、铁路、公路、水路获取全量旅客出行数据,进行犯罪嫌疑人实时追踪和轨迹分析。全量旅客数据规模大、实时性强、涉及大规模个人隐私数据,对政法机关的数据治理能力要求非常高;同时海量数据汇聚导致原始数据出域,数据安全风险骤增。

本项目的运营试点工作依托民航、铁路和高速的数据中台、相关数据产品和山东区块链研究院隐诺隐私计算平台,打破传统数据脱敏和归集等共享方式,构建多机构协同、安全合规的数据应用方式,实现“原始数据不出域、数据可用不可见”。

在数据安全流转过程,在保证公安与个人出行原始数据不出域的前提下实现嫌疑人布控数据与个人出行数据周期性对齐,通过匿踪查询实现嫌疑人出行情况的实时布控预警。匿踪查询条件通过密文方式在公安内部存证,并将日志存证数据同步至个人出行数据运营方,用于进行联合审计。个人数据运营方与公安可定期进行数据监管与安全审计,通过智能合约在公安内部验证匿踪查询数据是否存在违规使用情况。

该项目为执法机关、数据所有方构建一种新型、安全、双赢的数据共享方式,最大可能避免全量个人出行与执法数据出域,执法机关可以按需、实时、可监管地获取执法线索,大幅度降低因海量数据汇聚、省市多层级数据分发的耗时,进一步保证线索的高时效性。此模式已经在民航领域落地,为交通数据、能源数据、运营商数据和互联网零售等个人数据打造数据共享模式。

本文摘编自大数据技术标准推进委员会、隐私计算联盟发布的《数据流通利用研究报告(2024年)》。

在此声明以上观点和内容,仅代表原作者和出处,与数治网DTZed 无关,如有出错或侵害到相关合法权益,请通过电邮与我们联系:cs@dtzed.com。

在文末扫码关注官方微信公众号“idtzed”,发送“入”直通相关数治x行业共建群、AIGC+X 成长营,@老邪 每周免费领取法规、标准、图谱等工具包。

欢迎先注册登录后即可下载检索公共数据等相关标准、白皮书及报告。更多高质量纯净资料下载,在文末扫码关注官方微信公众号“idtzed”,进入公众号菜单“治库”。