大数据因具有不可估量的价值性,得到各行业的热捧。大数据研究有四个阶段:数据采集、存储、分析与应用。从源头开始,就与个人数据息息相关,四个环节,都有可能让个人数据被不正当利用。在步入大数据时代的过程中,个人数据问题成为焦点。
大数据因具有不可估量的价值性,得到各行业的热捧。大数据研究有四个阶段:数据采集、存储、分析与应用。从源头开始,就与个人数据息息相关,四个环节,都有可能让个人数据被不正当利用。在步入大数据时代的过程中,个人数据问题成为焦点。
美国乔治城大学法学教授戴维 弗拉杰克(同时是FTC消费者保护局局长)举过这样一个例子:想象下在网上花费几个小时时间去寻找油炸锅的信息。你可能是在寻找给朋友的礼物,或者你可能是在寻找烹饪学校的相关信息。但是对一个数据挖掘者来说,他可以追踪到你点击过的所有页面,你的这些信息可以被解读为你有一个不健康的饮食习惯。这一以数据为基准的信息很有可能会到达健康顾问或是潜在雇主的手上。
在缺少对个人数据有效保护机制与数据处理规则的情况下,类似情况将会频繁上演。国内的大数据发展情况同样是冰火两重天。
一边是大数据引领未来发展概念如火如荼。
政府机构和企业都在大数据处理上加大布局。BAT三家投入力度较大。百度把控住搜索、地图等数据入口,并加大人工智能技术研究,如成立百度深度学习研究院、挖来 谷歌大脑之父 吴恩达,都是在为大数据分析做准备。阿里在从IT向DT转型,要做数据公司,天猫、淘宝、支付宝、阿里金融产生的数据构成了个人、企业、商品和金融之间的完全数据链,能够让阿里巴巴提供更精准、高效的服务。腾讯除通过QQ、微信等进行数据收集外,也在加大大数据分析力量,如成立腾讯互联网与社会研究院,培养和引进大批相关人才。
另一边是个人数据被侵犯事件频频发生。
如个人信息在不知情情况下被收集。苹果手机收集国内用户信息回传到美国,小米手机在境外市场收集用户信息回传到大陆,都遭到用户及监管部门不同程度的质疑。手机安装的APP,会在用户授权或者非本意授权的情况下,收集用户的信息。
再如个人信息被非法使用,甚至牟取利益。2013年10月, 开房数据泄露门 曾经引起轩然大波。不久后,一个名为 2000万开房数据 的文件出现在网上。当时一些查询开房数据的网站被关停。然而近段时间,查开房的网站又死灰复燃了。
于是,争议摆在了面前:是推动大数据发展,积极贡献个人数据,实现其最大价值呢?还是要加大个人信息保护力度,控制大数据发展进度呢?陈述认为:
其一,大数据是发展趋势,技术与产业的发展,可以有一定的引导,但当一切条件基本成熟之后,发展之势势不可挡。
其二,用户本身要加大个人数据保护意识。发展过程中必会带来进步与糟粕。每个人对自己的数据隐私及安全负责,增强保护意识,可以降低受侵害的可能性。
其三,政府机构及行业机构要加快制定大数据处理相关法规及机制,规范大数据采集、存储、分析及应用等过程,促进产业良性发展。
对于大数据发展与个人数据保护的解决方案早已有人提出。MIT人类动力实验室主任阿莱克斯 彭特兰及其团队提出建立一种信任网络。在这种网络下进行数据分享,有四个原则:一是数据采集者要通知用户。二是用户对于数据的采集、应用知情并且同意。三是第三方机构要对数据处理过程进行审核。四是个人随时可以撤销自己的数据。
在此原则之上,建立个人数据国际标准,设立个人数据商店(PDS)。PDS是一种能够控制、存储以及审验个人数据流动的开源工具。从理论上讲,这种类型的技术会减弱数据代理的作用,或许能够减弱隐私被窃取的风险。
8月31日,笔者参加比百度百家组织的科技对话活动,阿莱克斯 彭特兰作为嘉宾出席,再次重申自己关于信任网络及个人数据商店的观点。
只是,从理论到实践、从实验室到生产,还有很长的路要走。需要监管机制的完善,需要用户理念的转变。而在此之前,当个人数据被泄露之时,大多数情况下我们也只能拍桌而起,怒喊一声:谁动了我的个人数据?
陈述,手机、通信专栏作者。微信公众号:陈述(mhy_chenshu)