防范人为杀熟、赢家通吃以及阻碍创新 才是真正的数据驱动型市场

如何理解数据使用产生的风险?大数据应用是否会带来“赢家通吃”的市场现象,从而妨碍竞争,损害消费者和整个社会的利益?

数字时代的数据和隐私
出处:阿里罗汉堂

我们如何在大数据时代保护个人隐私?数据使用创造的价值归谁所有,该如何分配?如何理解数据使用产生的风险?大数据应用是否会带来“赢家通吃”的市场现象,从而妨碍竞争,损害消费者和整个社会的利益?

数字技术正在重塑经济格局,数据驱动的商业行为在竞争中会扮演越来越重要的角色。因此我们需要理解数据驱动的市场行为会如何影响竞争。竞争法的核心目标是:“确保消费者可以从竞争的力量中受益”(Shapiro,2018)。要判断竞争是否被扭曲,消费者的利益是否受损,我们要用事实说话,深入理解行业结构、企业的商业行为,并评估其市场表现。

我们先回顾一下交易对竞争以及国家的企业竞争力的正面影响。在中国,线上市场的出现让买卖双方的平均距离从 10 公里上升至 1000 公里。在 1776 年出版的《国富论》中,亚当·斯密指出,垄断力量是“良好管理的大敌”,而交易范围的扩展会打破这种垄断:

“状况良好的公路、运河、船只往来的河流,这些大大降低了货运的开支,将一国偏远的地方与城镇周边置于同一发展水平上。它们都得到了最好的交通改善。这将刺激边远地区——一国最偏远一环的发展。通过打破本地商人的垄断,对城镇的发展多有裨益,也对国家的其他地区有益。尽管交易扩张在旧市场中引入竞争性的商品,但也为旧产品带来了新的市场。此外,垄断是良好管理的大敌。只有在自由和全面的竞争下,市场中的每个人为了自我防御都要遵循规则,好的管理制度才能建立起来。”

如同亚当·斯密时代的“公路和运河”延伸了贸易距离,打破了垄断,提升了偏远地区商家的竞争,21 世纪出现的平台数字网络也打破了本地垄断力量,建立了一个更健全、更具竞争性的商业环境,只不过两者的速度和效率无法同日而语。

所以,采用适应这些行为的竞争政策是大数据时代“善治”(good governance)的重要组成部分。其关键是要了解这些新的市场行为中,有哪些可能会促进或阻碍竞争。具体而言,大数据正在多大程度上被用来损害消费者?大数据正在多大程度上妨碍竞争和创新?

竞争或反垄断政策的目标很清晰,就是促进竞争和提高市场效率,从而确保消费者从各方的竞争中获益(Shapiro,2018)。例如,如果数据相关的市场份额或准入壁垒优势是激烈市场竞争的自然结果,那么数据上的“先发优势”会促进产品质量提高和价格降低,使消费者受益;相反,如果该优势实际上减少了市场竞争,阻碍了创新,就会伤害消费者,需要竞争政策的干预。因此,制定合理的竞争政策,需要深入了解商业实践的细节,以及具体分析某个商业行为潜在的危害和好处,同时有能力评估该行为对市场效率的影响,即是否有利于提高生产和销售商品的数量和质量,是否以更低的价格提供 商品和服务。

大数据正在多大程度上被用于损害消费者利益?

商家今天获得关于客户的信息前所未有,无论数据量还是数据种类都远超前人想象。从理论上讲,企业通过数据更懂消费者,是有可能成体系地对消费者采取价格歧视,攫取消费者利益。在实践中,我们也会在不同国家看到“大数据杀熟”的个别案例。但总体而言,和蓬勃发展的大数据运用相比,大数据杀熟的案例要少得多。也没有任何国家的研究发现大数据杀熟的广泛现象,反而免费、普惠成为更加普遍的时代特征。这是为什么呢?

一个可能的解释是,数字技术改变了生产者和消费者的关系。其中一个结果,随着累积这些高颗粒度的数据,商家已经不再追求从单独的产品或服务中获取最大利润,而是追求提供一个以客户需求为中心的综合服务,建立更高的客户忠诚度。普惠性就是尽可能扩大客户的多样性和数量,今天已经成为越来越多企业核心的商业目标。例如Ichihashi 在 2020 年的研究显示,很多数字平台希望向平台上的卖方公开买方的特征信息,而不是将买家隔离开,进行经济学家所谓的“价格歧视”——以不同的价格向不同的群体出售类似的产品,以便从支付意愿最高的消费者身上获取最大的利润。实际上,要成功地进行价格歧视,卖方需要有能力将不同群体的消费者隔绝开。而今天的互联网让信息隔离越来越难,消费者可以在非常广阔的范围内搜索不同的卖家和价格,让竞争越来越激烈。

理论上,卖家掌握的消费者信息越多,就越有能力向消费者收取差异化的价格,经济学术语称之为价格歧视。在极端情况下,如果一个卖家垄断市场,垄断者能够从消费者身上榨取所有“消费者剩余”(consumer surplus),即向每位消费者收取他们愿意支付的最高价格。而在充分竞争的市场中,来自其他卖家的竞争会极大地限制某个卖家的提价行为,也会限制卖家在不同情况下对同一商品收取不同价格的行为。因此,某个商业行为是否通过阻碍竞争提高了价格,或者得以随意进行价格歧视,赚取垄断利润,常常被当作判断垄断的简化标准。但对于“垄断”的判断,往往不能停留在简化的、“一刀切”的层面,而需要基于具体证据具体分析。

以价格歧视为例,在有些领域中,公司需要价格“歧视”才能生存,也更有助于提高社会福利。这听起来似乎不合逻辑,但公用事业,例如供水、供电等行业,是典型例子。在这类行业中,初始投入巨大,但后续生产的单位成本低(即边际成本低)。一方面,如果市场竞争让价格被拉低至单位成本,那么巨大的初始投入无法被弥补,预见到这种情况,就没有企业愿意投入。另一方面,如果对所有消费者收取同样的价格,那么高额的初始成本会抬高单价,只有极少数消费者可以负担。因此,通过对消费意愿和能力更高的消费者收取高价,价格歧视不仅让提供这类产品的企业得以生存,也同时让更多的人能够参与消费,对整个社会而言,提升了消费者福利。在某种程度上,恰当的价格歧视,事实上起到了促进社会公平、弥合贫富差距的作用。类似的价格歧视现象,在很多其他行业广泛存在,例如,对同样的座位在不同的时间收取不同价格的航空公司,电影院等。

价格歧视并非唯一的顾虑。美国的消费者保护机构,例如联邦贸易委员会担忧“企业可以使用大数据,让那些低收入、缺乏服务的群体失去获得信用服务和就业的机会”,并表明要对这种不公平的行为进行指控。但现实中数字金融不断增强的普惠特性,将缓解这样的担忧。至少在肯尼亚、中国和其他很多国家,普惠金融取得了突飞猛进的发展。所以,在我们关注大数据杀熟的案例的同时,我们也不应该忘记这样的案例并非多数,也要具体分析其背后的原因。

此外,对市场中的不同消费者群体收取不同的价格,有时也可以增进民生福祉,比如剧院、餐馆和其他很多企业对婴幼儿、学生和老年人收取的价格更低,或者制药公司以较低价格向世界贫困地区的公民销售“救命药”。

虽然差异化定价广泛存在,但是一种越来越被社会关注和担心的现象,是基于大数据,对完全相同的产品和服务,只是因为用户身份的不同,就收取不同的价格,这就是所谓的“大数据杀熟”。各国都存在大数据杀熟的个案,引发了社会讨论以及治理机构的关注甚至干预。但一个更重要的问题是:大数据和杀熟的关系有多紧密?在多大程度上,大数据杀熟正在成为普遍的趋势?

为了回答这个问题,我们首先需要强调,市场竞争的本质,是通过设计、生产出不一样的、更好、性价比更高的差异化产品,因为满足消费者需求而获益。换句话说,价格和产品结合的差异化是最健康的趋势。这也正是约瑟夫·熊彼特称之为的“创造性破坏”(creative destruction):

经济学家总算从唯价格竞争的束缚中挣脱出来。一旦质量竞争和营销术被容许进入理论圣地,价格变量的统治地位就会不保⋯⋯但资本主义的现实景象并非如教科书所描绘的那样,是一种数量竞争。相反,竞争来自新商品、新技术、新的供给来源、新型组织——这种竞争要求的是成本和质量的决定性优势,所打击的并非现有企业的利润率和产量,而是其生存基础。这种竞争的威力更大,更像是炮轰,而非敲门,其重要性足以令常规竞争的效力变得无足轻重;长期提升产量并拉低价格的杠杆总是由其他因素构成(熊彼特,1962)。

在大数据时代,虽然杀熟的个案存在,但是鲜有证据表明,这已经成为任何一个国家的主要趋势。一个合理的解释是,消费者通过分享大量的个人数据让商家更了解自己,然而这并非一定会带来更多的不利于消费者的价格歧视行为。这是主要因为商家与消费者的关系正在被数字技术所改变,进而导致了竞争模式的转变。今天的生产者和消费者有着前所未有的直接、高频、长期的连接和互动。普惠性,即以实惠的价格向更多的消费者提供商品和服务,而不是赚尽有限几个消费者的每一分钱,正在成为企业的首要目标(罗汉堂,2019)。最近的研究发现,数字平台对消费者披露而不是隐瞒信息进行价格歧视,会有助于建立信任,长期来讲对平台是最优策略(Ichihashi,2020)。还有证据表明,“网络的透明性限制了实体零售商在不同地区实行价格歧视的能力⋯⋯这(表明),随着传统零售商与在线零售商的竞争越来越激烈,其地域价格差异将继续减小”(Cavallo,2018,对 Cavallo、Ater 和 Ribgi 的研究总结,2018)。

大数据是否在妨碍竞争,让市场出现赢家通吃的局面?

有观点认为,在数据驱动的市场中,由于网络效应(直接或间接)以及随之而来的规模经济,市场壁垒会滚雪球一样越来越高,从而造成了赢家通吃的结果。那么实际情况是怎么样的呢?实证数据表明,至少在中国,与赢家通吃的假设相反,数据驱动型市场事实上竞争激烈,准入壁垒低,呈现高竞争行业的特征。

一是行业头部集中度逐步降低。例如在网络电商行业,尽管阿里巴巴通过不断创新继续增长,但其早期在线上销售领域占据的领先地位,并未阻止新进入者在四处蓬勃增长,在 2015 年至 2019 年的四年时间里,阿里巴巴市场份额下降了 22 个百分点。拼多多销售额在三年内增长了 100 多倍(图36a),吸引了超过 4 亿用户,目前用户规模已经达到最头部电商的同等水平。京东销售额占中国电子商务销售额的 17%,最近成为“家电市场所有渠道中市场份额最大的平台”。

(a) 拼多多年度交易总额(单位:亿元人民币)

(b) 抖音全球首次安装量(全球,单位:百万)

图 36: 新应用可快速崛起
资料来源:感应塔;罗汉堂。

注:(1)抖音于 2016 年面世。2019 年,抖音是下载量第三大的应用(仅次于 WhatsApp 和 Messenger,领先于 Facebook)。(2)抖音的安装量未计入中国和其他地区的第三方安卓下载量。

二是,企业崛起快,衰落也快。Friendster 原本是社交网络行业的“市场领导者”,很快被 MySpace 取代,而 MySpace 在 Facebook 的打压下,几乎已被完全淘汰。2010 年,百度是中国在大数据和人工智能领域的领导者,市值超过腾讯和阿里巴巴,但它现在已经远远落后。抖音的母公司字节跳动则异军突起,用户数迅猛增长,取代百度成为广告收入的市场领导者(图36b)。

图 37: 中国移动支付市场份额
资料来源:iResearch;罗汉堂

另外一个案例是支付宝和微信支付的竞争(图37)。作为中国数字支付的先行者,支付宝在 2014 年占线上支付总量的近 80%。但到 2019 年,随着微信支付迅速赶上,其市场份额逐渐降低到 43%。同样,在诸多领域,大数据并没有让早期优势的壁垒越来越高。市场占有率的趋势和赢家通吃的假设背道而驰。

在过去的十年间,标准普尔 500 指数企业的平均寿命呈缩短的趋势,而新入公司的数量却在不断增加,这表明竞争越来越激烈(图38)。随着数字技术的发展,全球商业正进入一个竞争日益激烈的熊彼特世界,一方面是新企业崛起越来越快,一方面是企业寿命越来越短。任何公司想要像过去一样,在某一领域长期保持“高枕无忧”的优势地位,将会越来越难。

图 38: 标准普尔 500 指数公司的平均寿命
资料来源:标准普尔指数,QAD 博客提供的预测 。

所以至少在大部分领域,大数据并没有造成赢家通吃,大数据可能带来的网络效应和规模效应远不如想象的那么明显。我们认为这是因为以下几个原因:

首先,大数据可以从连接、决策、信任三方面提高生产效率,具有明显的商业价值,但大数据只是商业模式的一部分,必然受制于商业模式。例如,虾米音乐最初靠大数据算法推荐得到了许多深度音乐用户的认可,占据用户规模的优势,积累了大量用户数据,但最终由于缺乏盈利的商业模式,在 2021 年关闭。数字经济的发展历史表明,通过移动互联,市场上的新进入者能够以极低的成本互相连接,使得各种细分市场(niche market)频繁、出人意料地出现,技术和新商业模式的结合带来占领市场的机会,然后扩展,威胁到现有公司的市场地位。

第二,数据和有商业价值的信息之间存在巨大的距离,需要数据能力和商业判断力才能发挥数据的价值,存在很大不定性。尽管 Facebook、Instagram 等互联网巨头都拥有广大的用户基础和海量的数据,但仍然难以阻挡抖音在海外市场迅速增长的势头。

第三,互联网用户可以同时使用多个平台,在享受服务的同时在多个平台上分享个人数据。一旦创新者提供新服务满足未被满足的细分需求,就可能成功破局,并迅速积累数据和用户形成正向反馈。拼多多和抖音就是典型的例子。

第四,大数据的有效生命周期很短。新数据源源不断生成,其价值随着时间的推移而下降。相对于现有企业,新进入者不需要创建“相当于现有者规模”的数据存储;相反, 他们只需要设计一个策略来积累高度相关和及时的数据(Schepp and Wambach,2016)。

许多研究表明,数据量的优势很少会对竞争对手产生实质性影响。例如,Bajari 等(2019)使用销售数据证明,虽然拥有特定产品相关更多数据有利于更准确的预测,但拥有额外数据的边际价值会下降。随着时间的推移,预测会更为准确,准确性来源于对数据的使用,而不仅仅是拥有更多数据。经济学家 Chiou 和 Tucker(2017)发现,几乎没有证据表明缩短数据的存储时间(在某个案例中,从 13 个月缩短到 3 个月)会显著降低效果。

如经济学家 Lambrecht 和 Tucker(2017)指出,“只有独一无二、稀有、有价值且可持续的资源才能为一家公司提供竞争优势,而数据本质上不具备上述特点。”因此,用经济学家 Shapiro 和 Varian(1998)的话来说,信息产业的市场“主导地位”是脆弱且短暂的:“硬件和软件公司争夺主导地位,因为它们深知目前的领先技术或架构很可能在短时间内被拥有卓越技术的新兴竞争对手推翻。”并不是说大数据的使用绝对不会带来垄断力量,在不同的行业确实存在需要纠正的利用市场地位妨碍竞争的行为,也应当通过各种法规纠正。但是有一点可以肯定,大数据远远不能保证赢家通吃的结果。

显然,在数字经济的发展过程中,存在妨碍竞争的企业行为,需要通过法规纠正,这也日益成为各国社会关注的一个重点。但这些现象,和所谓的“赢家通吃”,无论在理论和实践中都没有必然的联系。我们对事情性质的判断,应该基于事实,基于不同国家、不同行业的实际情况,而非基于假设的“黑板经济学”,否则会适得其反,妨碍数字经济的发展。

大数据在多大程度上在给创新带来障碍?

由于数据是数字驱动商业模式的一个重要组成部分,善用大数据,无论是通过提供有竞争力的产品吸引客户积累数据,还是通过不断优化算法发挥更大的数据价值,都可以巩固公司当前的地位。如果这种竞争优势是由于具备高效使用数据的能力,就不会妨碍创新,反而会激发创新竞争,并不需要竞争政策的干预。竞争政策的目的不是扶持低效的潜在(或实际)竞争对手。只要大数据本身不阻碍那些高效创新者的进入,就不必对大数据的规模过于忧虑。

相反,如果强迫高效率的公司分享其优势来源,反而“与反垄断法的根本目的有些矛盾,因为这可能会打击(他们及其竞争对手)的积极性⋯⋯去投资经济上有益的基础设施。强制共享还要求反垄断法院充当中央规划机构,确定准确的价格、数量和其他交易条款,而法院并不擅长于从事这些工作”(Abbot,2018,引用最高法院判决行文, Verizon Wireless 诉 Trinko 案,《美国判例汇编》第 540 卷,第 407-08 页)。

联邦贸易委员会的总法律顾问 Alden Abbot 曾举例说,欧洲和亚洲的某些反垄断机构在较低效的竞争对手的要求下,对领先企业进行“侵入性调查”,为低效竞争对手寻求庇护,从而避免与领先平台竞争。“有益的创新速度将会放缓,影响消费者的福利。 更重要的是,由于创新和与市场领导者竞争的动力将会降低,竞争将会减弱。监管机构、公众和政府的偏好将取代可提高消费者福利的商品、服务和平台质量。”他指出,“事实证明这一说法是正确的。尽管欧盟官员多次声明,欧洲政策旨在使欧洲成为数字经济的全球领导者,但所有(西方)大型数字高科技平台公司都是美国公司”(Abbot,2018)。

Furman 等(2019)指出,采用大数据技术“可继续以更低的供应商成本、更好的服务、更好的产品可用性、更好的客户体验为消费者和竞争带来好处⋯⋯线上平台可成为创新的强大驱动力,它们向消费者提供的服务通常可免费使用”。

从实际效果看,大数据可以从几个方面推动创新。

首先,大数据的 3 个 V 特性成为生产和商业模式创新的强大驱动力;创新优势,而非垄断优势,似乎正在主导数字经济。从教育、商业、医药和金融,到社交媒体、打车、 共享单车、观看视频和游戏,几乎在各个数字技术领域发挥深刻影响的行业,其共同点都是数据驱动的创新商业模式,而最具创新性的参与者往往是该行业的新入局者,他们几乎没有初始资本和其他资源,往往在很短的时间内通过创新优势迅速成长。

图 39: 2008-2020 年苹果应用商店中可用的应用数量
资料来源:PocketGamer.biz

注:苹果应用商店于 2008 年 7 月 10 日通过 iTunes 更新开放。这恰逢苹果推出支持移动应用的第二代 iPhone 3G。应用商店中的应用程序只适用于 iOS 设备——科技行业一般将苹果的设备生态系统和操作系统称为“带围墙的花园”。

其次,平台作为连接供给和需求的载体,成为创新扩散的重要推动力量。在市场竞争中,平台有意愿用技术改进商业基础设施,推动平台上企业的创新发展。举例来说,自从苹果向第三方开发者开放其应用商店以来,各种创新性的移动应用软件得以迅速发展。根据 Analysis Group(2019)的数据,仅在 2019 年,应用商店生态系统已为全球5190 亿美元的交易和销售提供了支持。如图39所示,应用商店中可用的应用数量已从最初的 500 个增加到 400 多万个。这些创新应用程序几乎在根本性改变世界娱乐、学习、工作、购物和交往的方式。

苹果的应用商店平台,为移动应用软件开发者创造了一个竞争激烈的市场,促进了手机软件的创新,这也给苹果带来了卓越用户体验的声誉。这种共生关系,一方面通过平台上的竞争促使开发者不断提高其服务质量和竞争力,提供创新的、更好满足用户需求的产品。开发者的成功在很大程度上依赖于用户的评论,从而让满足用户需求与 实际的财务激励紧密联系在一起。另一方面,苹果的平台设施(如 TestFlight 和 App Analytics)使开发人员免于承担分销、测试、市场调查等日常繁琐事务,从而得以专注于自己的核心业务。类似的例子在亚马逊、阿里巴巴、腾讯等平台也大量发生。

除了消费行业,在医疗行业也出现了由大数据支持的促进创新的协作。麦肯锡(2013) 通过分析 2011-2012 年“健康数据倡议论坛”参与者的公司和商业模式,发现基于大数据变革的大规模协作创造了大量医疗保健行业的创新。例如,Propeller 是一个基于全球定位系统的记录仪,记录了哮喘患者的吸入器使用情况。通过把即时的信息与已知的引发哮喘的因素(例如,美国东北地区的花粉数量和夏威夷的火山雾)关联,并结合该领域的开创性研究结果,医生可以制定个性化的治疗计划和发现新的预防机会。在这个创新模式中,大数据技术各参与方包括了患者、医生、制药公司、医疗技术公司、医院、医疗保健提供商,他们得以互相协助,发现创新机会,并各自获得收益。

在数字技术和数据的帮助下,这些新的商业模式为行业带来了“破坏性创新”,也逼迫那些墨守成规的成熟企业做出改变。在全球几乎所有市场,带来激进创新的企业都是那些资金和资源非常有限,但拥有无限想象力和雄心壮志的初创企业。可以说,创新已深深烙印在科技初创企业的 DNA 中。

尽管有合理的疑问,但我们认为有几个原因可以说明,为什么大数据天然会推动产品和生产流程的创新。

第一,大数据的三个 V 已经成为重要的生产模式和商业模式的创新引擎。企业连接和了解客户的能力大大加强,因此可进行更明智的决策,并进行创新试验。这是在数字技术深度改变的行业中,创新层出不穷的重要原因。

第二,大数据的三个 V 带来了前所未见的大规模、深度合作,这也大大加速了创新在市场中的部署和应用。平台作为连接供给和需求的载体,成为创新扩散的重要推动力量。平台处于竞争压力,会愿意改进商业基础设施,推动平台上企业的创新发展。实际上平台上的创新非常活跃,例如新品牌和小众品牌在各类平台上的爆发式增长,就是显著证据。

本报告的结构安排如下,第一章总结本报告的核心内容。按照逻辑递进的方式,第二章基于消费者在隐私相关决策时的实证分析,推导出不要单维度看待隐私,而需要综合理解消费者和个人数据相关的权益。第三章谈论数据分享的价值源自何处。第四章介绍从行业和企业的角度,做好隐私保护的核心逻辑和方法。第五章提供了一个基于数据本质特征的综合理解数据权衡的框架。第六章运用这个框架理解全球数据治理的相关问题,并且就数据和价格歧视、竞争、创新的关系,基于实证研究进行了讨论。第七章提供了简短的总结思考。

本文摘自阿里罗汉堂《理解大数据:数字时代的数据与隐私》,全文下载: