数据比较特殊,它可以将使用权做转移,可以拷贝,没有独占性。但使用权可以做出限制,指向单一使用方。
Facebook史上最大规模的数据外泄事件仍在发酵。
服务于特朗普竞选团队的第三方公司剑桥分析,在Facebook购买广告服务,通过不正当方式获得美国11个州5000万人的数据,建立数据模型,最终在大选中推送有利于特朗普的竞选广告。这本质是第三方公司窃取和使用互联网大平台用户的数据问题。事件曝光以来Facebook股价从此前的185.09美元跌倒昨日收盘的159.79美元,市值蒸发近735亿美元 。
(某个服务)的用户授权协议条款,会注明采集哪些用户行为数据。之后,收集上来的数据会做匿名脱敏处理。用户的详细个人信息,比如性别、年龄段都是数据使用方不知道的,而身份证、手机号和姓名等更不可能出现在大数据中。 司照凯对AI财经社分析数据流通中的基本原则和规范,他是云计算厂商UCloud旗下数据交易平台安全屋的业务负责人。
司照凯介绍,数据流通与此前所有的资产流通都不相同。 数据比较特殊,它可以将使用权做转移,可以拷贝,没有独占性。但使用权可以做出限制,指向单一使用方。
从上述基本原则规范看,Facebook在数据采集、处理和流通上,有多处没有遵守原则的做法。但Facebook发生的事件并不孤立。行业目前急需建立数据处理和流通的理念和规范。
其实目前行业对数据流通的需求不小。一方面,一些工具类APP掌握了大量行为数据,但尚未找到非常合理的渠道去做合规的变现。另一方面,很多企业对数据的需求其实非常大。比如一些人工智能公司就需要用数据来训练算法。只有更大规模的数据量,机器学习的结果才会更准确、更智能。另外,期望做精准营销的企业在做市场推广时发现,线上数据和流量的价格已经非常高。
在目前的数据流通链条里,BAT巨头在自己的生态内部,流通较为畅通。而产业上下游之间的数据交流,也值得关注。它的顺畅与否对于行业发展很重要。比如,汽车雷达制造商如果能掌握消费者日常开车的行为数据,就能更有针对性地指导生产。在这些行业痛点下,司照凯所在的UCloud安全屋就是在数据所有权不变的理念下,推动数据的流通。
在数据流通中,除了服务提供方(数据源)需要将数据的采集和流通告知用户,司照凯还提到用户隐私保护的一些细节,比如 适合流通的数据一定不是具体和细致的数据。
以高净值人群这样一个身份标签为例,它可以由多种数据维度来界定,比如社保工资信息里的月工资达到10万元,开豪车,经常出入一线城市的机场,住在上海的内环或者北京一些非常富有的区域。
但数据提供方不能提供上述具体用户信息。以做精准营销为例,如果需要数据提供方输出高净值人群信息,提供方不能提供准确到用户住哪个小区、开什么车、账单额度这些非常具体的信息。合理的数据输出方式是一个大致的范围值,比如个人汽车的价格档位在100万元以上等区间信息,通过区间来输出范围数据。
在数据流通中,由于数据的可拷贝性,数据源提供方一般会有数据资产流失的担忧。 从技术角度做到数据不能被使用方看到,一般我们会提供样例数据,你可以看一些样例,告诉你数据长什么样,它的各种值是什么类型,给你反馈的是一个设备号等很简练的信息。算法可以用这个数据,但人看不到这些数据。这样相当于整个数据源不会被泄露,同时又能够通过算法去触达到数据。 司照凯提到他们打通行业数据交流障碍的方法。
可以想见的是,数据流通是行业痛点,但用户的隐私和安全问题也越来越成为公众雷区,更加合理的数据流通机制有待建立起来。司照凯也认为,数据交换机制还在建设的早期。 不要期待能一步到位,现在先找小的突破口,把数据流通产品做起来。让大家看到示范效应,让数据源所在方愿意接入数据流动平台,推动法律的进步,多方投入后整个生态会越来越完善。