【安防大数据】互联网早已失去了开放性,它正在走向封闭

时间: 2019-01-30 17:11:46 编辑: 西奥马尔编辑 来源: 钛媒体 标签: 大数据思维 互联网隐私


最近,百度又挨骂了。

 

有文章称,百度搜索为自家产品(百家号)引流,致使搜索结果充斥着大量质量低劣的信息,已经沦为营销号的平台。

 

不少朋友问我怎么看,我有点诧异:

 

百度不是做贴吧、网盘和输入法的吗?怎么还有搜索功能?

 

好吧,开个玩笑。

 

不过说实话,近10年来我基本没有用过百度搜索。上一次打开,应该还是用来测网络连接。

 


不用的理由也很简单,主要倒不是因为广告,而是因为百度的内容实在太低劣了。

 

举个例子:就在写文章的此刻,我特地打开了百度搜索,搜了下「2018年GDP」。结果是,第一页9条结果(不算中间的各地新闻),只有2条能告诉我,统计局21日刚公布的18年中国GDP是多少。一不留神,很可能就错过了。

 

其他内容都是什么呢?超过一半是百家号的内容。

 

数据垄断和信息孤岛,是如何驯化我们的?

 

不是说百家号一定是营销号。但在这种场景下,作为一个普通用户,需要的是第一时间的触达,是权威媒体的一手信息,可靠的事实报道,严谨的数据呈现,而非自媒体们过时、没有门槛和信用背书的「评论」。

 

再举个例子。我随便在百度百科中搜索「斯坦福监狱实验」,看到的内容,是一篇没有数据、没有参考材料、没有任何学术性、充斥着大量可疑描写的东西。它的出处是什么呢?是一名豆瓣用户发的帖子……

 

至于对这个实验的各种引用和讨论,学界的相关研究,包括18年中撼动整个心理学界的「骗局」争议,以及菲利普·津巴多本人在知乎亲自撰写的回应,当然全都没有。

 

至于竞价排名、莆田系等问题,大家都已经熟知,就不说了。

 

很多人为百度开脱,说,一款产品,为自家的产品引流,有什么大不了的吗?其他公司不都一样?

 

但这正是最值得警惕的问题:

 

作为国内最大的搜索引擎,百度拥有实际上的信息垄断权力。

 

每天,可能有数以千万计的人从百度获取信息。这种垄断的权力,一旦被不当利用,跟利益挂钩,后果会有多可怕?

 

所以,我在以往的文章中,才一直呼吁:不要盲信百度。浪费时间精力倒是小事,更严重的后果是,它可能会降低你对信息的「品味」。

 

什么意思呢?长此以往,你可能会习惯低劣的信息。不再去要求严谨的论据,可靠的事实,精确的数据,中立的描写,严格的出处……习惯这些似是而非、片面简单的碎片内容。

 

这才是最可怕的。

 

但是如题目所言,这篇文章并不是为了骂百度。反正骂了也没有用,有用的东西又不能说。

 


我想和你聊的,是这背后折射延伸出来的一些问题。

 

众所周知,对于搜索引擎来讲,第一页的流量可能是第二页的数百倍,而在第一页里面,前几个链接的流量,又远远超过末尾的链接。

 

可以说,排序就是一切。

 

这已经成了衡量搜索引擎质量的一个指标。有一个段子是这样说的:把一样东西藏到哪里可以确保不会被人发现?谷歌搜索结果的第二页。

 

但是,越靠前的链接,就一定越好、越符合我们的需求吗?

 

在传统媒体中,决定版面位置的是编辑,这就是传播学里面的「把关人」效应 —— 你所看到的一切东西,都是媒体编辑想让你看到的。

 

哪怕再公正、再客观的媒体,只要是「人」去操作,就存在「把关人」问题。

 

但把人换掉会更好吗?未必。

 

如果说搜索引擎排序的依据是算法,我们又凭什么去相信算法的完善、严谨,以及,相信算法背后的公司?

 

不说百度,就连谷歌,也遭受过许多质疑。

 

2016年美国大选期间,知名视频博主 SourceFed 就曾爆料,称谷歌屏蔽希拉里负面搜索建议。后来谷歌也作了回应,表示:当用户在谷歌搜索的时候,有关负面的建议词(像 crime 等词汇)会被自动降权,并无针对性。

 

但美国心理学家、Psychology Today 的前主编 Robert Epstein 做过实验后,认为:SourceFed 的爆料大体是正确的,只是有点夸大。他认为,谷歌在对待希拉里和特朗普的搜索建议上,确实不太公平,对前者的负面屏蔽要比后者多。

 

Robert Epstein 认为,如果此事属实,靠这个细微的区别,可能影响 80 -320 万张选票。

 

2017年,欧盟反垄断委员会对谷歌罚款27亿美元,理由就是:谷歌涉嫌干预搜索结果,将用户引导向自己的服务,而将竞争对手的链接放到靠后的位置。这导致谷歌当年度收入受到重创。

 

2018年8月,美国中期选举前不久,媒体 PJ Media 发表了一篇文章,声称,在谷歌上搜索「特朗普新闻」相关关键词,排序靠前的结果中,有96%来自左翼媒体,占比最大的是和特朗普关系最差的 CNN。

 

这当然有许多可能性 —— 比如左翼媒体会更关注特朗普的过失,相对报道量更大,点击量也更高 —— 但值得警惕的是:哪怕是地球上最好的搜索引擎,也会受到种种质疑和争论,更何况其他产品。

 

无论多么伟大的产品,一旦拥有了垄断的权力,结果都是可怕的。

 

没有任何一个媒体能像谷歌一样,能够干预数十亿人的信息接收,影响数十亿人的思维、认知,但问题是,又有谁来监督和约束谷歌?

 

同样,当百度垄断了你获取信息的渠道,当你习惯了不动脑子的吸收,你所看到的,就永远只是别人想让你看到的东西。

 

在你点开搜索引擎第一页的结果时,有没有想过:这些结果可能是受到干预的?有些东西可能是人为想让你看到,而有些东西,可能你永远看不到。

 

倘若首页超过50%的结果,被换成了自家的产品,那原本那些位置上放的是什么?它们又去了哪里?

 

如果盲信别人为你递上的结论,就相当于把思考和判断的权利,拱手让给了别人。

 

这只是一方面,另一方面,是互联网的开放性。

 

搜索引擎的本质驱动是什么?是互联网的开放性。可以说,如果没有开放性,搜索引擎的根基就会受损,从而也就没有了存在的理由。

 

但互联网真的是开放的吗?

 

如果把诞生于1995年的雅虎算作第一个搜索引擎,至今也有23年了。那时还是 Web 1.0 时代,万维网刚具雏形。整个互联网就是一个平面的数据库,由各种彼此跳转的超链接文本组成。

 

一切信息都是开放的,可链接的,可触及的。而搜索引擎,就是这个数据库的目录。

 

但从 Web 2.0 开始,事情发生了变化。

 

互联网厂商开始「圈地」,开始由平面向着立体进化,建筑起自己的一个个仓库。互联网的开放性被消解了,开始产生隐私、封闭性和信息壁垒。

 


为什么?很简单,因为大家开始意识到「数据」和「流量」的价值。

 

举个例子。我在公众号写过200篇文章,100多万字,但无论是用百度、必应还是谷歌(除了搜狗),都是几乎搜不到的,仿佛它们从未存在过。

 

同样,如果我想在这篇文章中,插入一些外部的链接,比如论文、网址,也是做不到的。我只能直接粘贴整个链接,再让读者手动选择、复制,跳转到浏览器里打开。

 

这就是微信公众号的封闭性。

 

不仅如此,微信对 API 把控得非常严。有一些抓取公众号文章,转化为 RSS 阅读的产品,出来后都会遭到针对性的封杀和升级应对,就是为了保障这种封闭性。

 

有了封闭性,数据就会被圈定在产品之中。你就必须每天都打开它,使用它,久而久之,习惯它,成为它的流量。

 

为什么所有的互联网产品都在推出APP,都希望你去使用它们的移动应用?就是因为,使用APP,你才能老老实实地「待」在里面,成为一名可量化、可跟踪的用户,而不是像网页一样,跳转、迁移、难以捉摸。

 

移动互联网有一个术语,叫做「激活成本」,指的就是获取一个有效用户的平均成本。这个指标从五六年前的几毛钱、几块钱,飙升到今天的几百块,仍然有无数公司在这片血海里厮杀,无非都是有利可图。

 

正是这些封闭的系统,把整个互联网,变成一个个的「信息孤岛」。

 

今天,我们手机里有各种各样的APP。想知道附近有什么吃的,打开大众点评;想买东西,打开淘宝、京东、亚马逊;想看看大家都在关注什么,打开微博;无聊了,打开朋友圈……

 

但这些独立的APP之间,信息能够互通吗?当然不能。

 

别说互通了,你的朋友圈能导出吗?你的微博能导出吗?你的淘宝搜索记录、浏览记录能导出吗?都不能。

 

甚至,根据微信的协议,我们的微信号并不属于我们,它是腾讯的资产,我们只有使用权。

 

我们产生了几乎无限的数据,根据这些数据,互联网厂商们可以精确地知道我们的爱好、习惯、行为,从而给我们推送精准的服务和广告。

 

而我们对这些数据,连基本的所有权都没有。

 

它们掌握在谁的手里呢?互联网巨头。为了从数据中攫取利益,巨头们营造出一个个信息孤岛,把信息进行割裂,树立壁垒,实现垄断,把我们「圈养」起来。

 

正如哥伦比亚大学法律系教授 Tim Wu 在《大变迁》一书中所说:通信技术的每一次主要变迁都遵循着相似的模式:最先出现的是短暂却足以让人感到兴奋的开放性阶段,随后带有垄断性质的封闭性阶段会逐渐取代前者。

 

Medium 的创始人 Ev Williams 对此深有同感。他经常引述 Tim Wu 的观点:

 

不论是铁路、电力、电报还是电话,这些事物最终都朝着封闭和垄断的阶段迈进。而且不论政府是否进行干预,在网络效应和规模经济效益的复合作用下,这个进程总会上演。

 

互联网早已失去了开放性,它正在走向封闭。


声明:大数据观察网部分信息来自网络转载,若无意中有侵犯您权益的信息,请联系我们,我们会在第一时间删除!