大数据进入2.0时代,大洗牌之后,哪些公司可以活得更好?
来源:信风智库   2019-12-03 10:49:35

大数据进入2.0时代,大洗牌之后,哪些公司可以活得更好?
答案是:你的手机号码、家庭住址、银行账户、网购交易记录等几十种不同类型的个人隐私信息。

换句话说,许多人的个人信息都在以非常廉价的方式,在网上不断流通着。

最近一段时间,多家数据公司的负责人和CEO以“配合调查”的原因被警方带走。这些名单里包括魔蝎科技、新颜科技、聚信立和有盾等,甚至首次出现「天翼征信」这样带有运营商背景的大数据企业。

被调查的理由都非常类似,「涉嫌利用网络爬虫技术侵犯个人隐私」和「助力暴力催收」。

几年前,当我们提起大数据时,皆是新兴科技创造的便利与惊喜;如今我们再次提起大数据,却是数不尽的质疑与埋怨。

中国的大数据走到今天,一场行业「清洗」也许在所难免。

一切都是生意

数据是中性的,它的恶与善取决于使用它的人。

在大数据狂奔的这几年中,「得数据者的天下」的理念驱使着许多公司不断获取数据,为业务扩张和公司发展服务。

正规获取数据的渠道太贵,一些公司就开始耍起了小聪明。要么找非法渠道购买数据,要么干脆招几个程序员去别人数据库里「扒数据」。
大数据进入2.0时代,大洗牌之后,哪些公司可以活得更好?
市场需求的不断膨胀,催生出一大批靠卖数据和扒数据为生的数据公司。3角/条的个人信息、1.5元/条的个人简历、30元/份的行业信息......,只要你有钱,你能买到任何类型的数据。

数据提供方一般有三个来源:

1.各大电商、社交和本地生活APP。这些平台自己拥有原生的用户数据,在用户授权允许的情况下,可以将数据与第三方共享。

2.政府部门代理商。国家机关或部门对外开放接口级的批量查询业务,代理机构很容易便获得私人信息。

3.电信、联通、移动三大运营商。三大运营商已经逐渐成为信息泄露的主要来源,它们输出的信息除了“移动三要素”,还包括来自手机短信的银行卡消费和交易信息。本次出事的天翼征信便是这个类型的大数据企业。

需求方面,最大的是各个网贷机构与互联网金融平台。

因为缺乏贷款人的征信数据,这些网贷平台必须要从其他渠道获取数据,而电信运营商则成为的主要的数据来源。

首先,网贷平台会验证你提供的紧急联系人是否有效。如果这个号码没有通话记录,那么通常都有欺诈的嫌疑。

其次,验证你的联系人以及二阶人脉中是否在黑名单中。毕竟物以类聚,人以群分。如果你存在恶意拖欠,还可以通过这些人找到你。

最后,检查贷款人的手机号与法院,110,银行以及各类信贷机构的通话记录。如果这类通话记录很多,那么很可能是一个老赖。

大数据进入2.0时代,大洗牌之后,哪些公司可以活得更好?
这些数据的来源,基本上都是非法的。因为根据相关规定,即便是用户同意被收集信息,数据拥有方也没有权利对这些数据进行变现和共享。

数据提供方不但「涉嫌利用爬虫技术获取个人隐私」,还因为网贷公司暴力催债,而被指控「涉嫌助力暴力催收」。

挖掘「谁的」潜在数据价值

很多大数据公司都会在宣传时强调自己能够「挖掘数据潜在价值」。

我们不禁要提出疑问,到底是「谁的」潜在数据价值?享受这种数据潜在价值的人又是谁?

电商平台根据用户的数据个性化推荐商品,当然算是价值的一种。但当顺风车司机给乘客贴上「胸大腿长」、「肤白貌美」这样的标签时,恐怕就不好说了。起码,这对于乘客来说不是价值。

可以肯定的是,以我们目前的数据收集能力来看,远远高于我们合规合法管理数据的能力。

现在,许多大数据公司以非常低廉的价格,便可以拿到大量的用户数据。为了让成本更低,他们又会将数据以更便宜的价格进行倒卖。

不仅如此,大量的数据存在数据库中,企业又将用什么方式进行保管和使用?如果数据被倒卖和滥用,要追查就会变得异常复杂,证据往往无迹可寻。

的确,消费者希望通过让渡一部分个人隐私而获取更好地服务,但部分企业却将这些消费者的信任肆意践踏。

以往,每个APP打开前那份冗长的用户协议没什么人看;但现在,已经有越来越多的人会去注意这份协议,并且逐字逐句揣摩分析。

这到底是消费者个人隐私意识的提升,还是大数据公司道德的沦丧,我们不得而知。

行业洗牌,如何规范数据安全?

2019年5月28日,国家互联网信息办公室发布关于《数据安全管理办法(征求意见稿)》公开意见的通知,向社会公开征求意见,其中提到几点明确规定。

1.明确监管主体,施行备案制管理

根据《数据安全管理办法》,在中华人民共和国境内利用网络开展数据收集、存储、传输、处理、使用等活动,以及数据安全的保护和监督管理均在此办法的监管范围。

2.建立个人信息收集使用规则,提出安全责任人制度

根据《数据安全管理办法》,网络运营者只要收集使用个人信息,应分别制定并公开收集使用规则,收集使用规则可以包含在隐私政策中,也可以其他形式提供给用户。并规定仅当用户知悉收集使用规则并明确同意后,网络运营者方可收集个人信息。

3.约束默认授权、功能捆绑相关行为,要求停止“定推”后删除用户数据

《数据安全管理办法》则对这一行为进行了严格约束,规定网络运营者不得以改善服务质量、提升用户体验、定向推送信息、研发新产品等为由,以默认授权、功能捆绑等形式强迫、误导个人信息主体同意其收集个人信息。

4.提出数据爬取要求,规定“合成”内容要求

《数据安全管理办法》对数据爬取和“合成”信息进行了首次规定。网络运营者采取自动化手段访问收集网站数据,不得妨碍网站正常运行;此类行为严重影响网站运行,如自动化访问收集流量超过网站日均流量三分之一,网站要求停止自动化访问收集时,应当停止。

当前,大数据风控行业对个人隐私缺乏保护,存在广泛的数据滥用问题。随着监管信号的不断释放,野蛮生长的大数据收集时代进入冷静期。未来很多风控公司、征信公司以及金融大数据公司都会受到深远的影响。

严格监管对于行业的长远发展起到了积极作用,当前监管机构并不是采取了所谓一刀切的态度和做法,而且依法对于没有合规经营、侵犯个人隐私的企业进行调查,对于加速清退劣质企业、保护用户权益、促进优质企业发展有重要意义。

长久来看,随着金融机构第一方数据积累以及第三方数据源壁垒降低,输出数据分析能力将成为风控公司更好的商业模式,提供标准评分卡产品+数据科学家咨询能力,将成为更有竞争力的商业模式。

另外,没有授权的爬虫就一定是违法的,需要重点整治。现在的关键是如何面对这些看似“合法”的爬虫,重中之重就是运营商做到用户授权链的完整,明晰完整的授权链,做到源头控制。
大数据进入2.0时代,大洗牌之后,哪些公司可以活得更好?大数据进入2.0时代,大洗牌之后,哪些公司可以活得更好?


评论