banner

对话《人类简史》作者赫拉利:数据崇拜将无边无际?

作者: afenxi来源: afenxi时间:2017-06-22 12:19:490

对话《人类简史》作者赫拉利:数据崇拜将无边无际?-数据分析网

4月23日,世界读书日,涂子沛应邀出席中信出版集团在北京举办的“你,定义未来”大型读书会,与《人类简史》作者尤瓦尔•赫拉利进行了一场关于数据崇拜与智能之心的对话。以下是演讲全文:

大家好,今天想跟大家谈的话题是“数据是土壤”。很多人说,数据是黄金,数据是石油,我告诉你们,不是黄金,不是石油,而是土壤!大数据的出现,标志着我们在迈向一个智能社会。

崇拜源于自身局限

从远古开始,我们就认识到土壤很重要。土壤是万物之源,所有的食物都来自土壤,人类很早开始就对土壤有崇拜。公元前七百多年,中国人的史书就记载了,人类有组织地在庙宇里祭祀土壤。

“人非土不立”,没有土人都立不起来;“非谷不食”,只能吃五谷才能生存;“土地广博不可遍敬也”,土地太大了,不可能到每一个地方表示我的崇拜,只能来到这个固定的场所。

人们不仅在固定的场所膜拜土地,还追逐土地,他们在寻找好的、肥美的土地,就像我们今天在寻找配偶一样。我们对土地有很多很美好的向往,它代表着人类的未来,美好的梦想,桃花源、香格里拉、黑土地,这一系列的名词都是描述这个美好。

对话《人类简史》作者赫拉利:数据崇拜将无边无际?-数据分析网

但在200-300年前,世界开始发生变化,土地的膜拜受到冲击,为什么?机器出现,工业革命来了。当挖土机、流水线摆在人们面前,这对当时人类的冲击,堪比我们今天看到AlphaGo战胜人类引发的心理恐慌。我们会不会被机器所代替?当时美国、欧洲都做了很多调查,想搞清楚机器的出现是不是提高了失业率,就像我们今天认为机器人会代替人一样。这是机器崇拜。

但在今天这个时间点上,一个新的崇拜出现了,这个崇拜关乎数据。数据在爆炸,这种爆炸前所未有。2005-2015年,人类的数据增加了多少倍?50倍,是ZB的级别。ZB是什么级别,ZB是10的9次方个“太”,“太”是什么,1T。今天很多人都能买到1T的硬盘,大概是400元人民币,但它能保存一个图书馆的容量,ZB是10的9次方个T,数据在爆炸。

这种数据爆炸非常真实。我最近看了一下数据,去年中国几乎所有的经济指标都在下降,我们发的电更少了,我们的货运量更少了,我们的投资更少了,我们消费的指数几乎都在下降,如饮料的消费都在下降。但是,你看到吗,人们在缩减其他开支的同时,在购买硬盘,在进行数据消费。这份数据来自希捷公司的年报,在中国的硬盘销售,从2000年到现在一直在攀升。

我们从猿猴而来,经历了农耕时代,再到机器时代,今天到数据时代。人类为什么会有崇拜心理,是因为对自身局限的认识、对能力的不断渴望。

当机器出现的时候,以更高的效率完成了人所不能完成的事情,人类真的没有必要恐慌,为什么?刚刚赫拉利教授也讲了,人类是猿猴的兄弟,大家看这幅图片,是不是猿猴的兄弟?

对话《人类简史》作者赫拉利:数据崇拜将无边无际?-数据分析网

事实上,关于计算的能力,人类还不如猩猩。猩猩在攀援时,在快速的从一棵树跳到另外一棵树的时候,它能迅速计算有多少果实、这些果实在哪里,一回身,它就能准确的、快速的摘下那一枚果实,在这个角度上看,人根本没有办法跟它相比。事实上人跟很多东西都不能相比,我们人跑的有马快吗?没有,我们必须要接受,我们就计算而言,我们算不过机器,就连猩猩的记忆力也比我们要好。

大数据背后是大事实、大世界

人类为什么会有数据崇拜?

我想举一个例子,这个例子能很好的说明我们为什么要数据崇拜,那就是人口普查,我想以美国为例子来分享我对人口普查的看法。

美国是全世界第一个进行人口普查立法的国家,而且直接把它写进了宪法,规定每十年就要进行一次人口普查。美国立国的时候就把这件事写进了宪法,为什么写进宪法,因为当时的美国要选举议员,也就是我们今天的人大代表,怎么选举,要根据人口,来分配议员的比例。

大家千万不要小看“点人头”这件事情,这是人类最早有大数据。在两百多年前的1790年,要把一个国家的人口点清楚,几乎是不可能的,事实上到今天,我们人类连我们有多少同类生活在地球上,都没有办法算清,所以人类的自身的计算能力非常落后。

1790年,美国用了14个月,派人骑着马挨家挨户敲门,进行调查问卷,这些问卷从乡到县、到市、到州、到联邦政府,一级级统计,用了几年的时间。美国每十年做一次,因为他们从人口普查当中发现了很多好处,他们通过数据能够完整的对社会进行认识,所以人口普查的范围不断扩大,每十年,美国的国会就要争吵,我们该普查什么,是不是要普查更多的事情,除了人口之外,我们还要知道一个家庭里他们养了几头羊、几头牛,他们有多少花生地,他们纳了多少税、有几个文盲、因为什么病死亡等等,所有的数据都在统计。

这种统计广泛得离谱,美国的人口普查是十年一次。但是,你知道吗,这些数据的处理要七年八年甚至九年。我们举个例子,1856年,美国用了九年才完成数据的处理分析,然后得出普查的最后结果,全国有多少人,各项数据是什么样子。

所以美国国会议员就质疑了,我们为什么要这么干,数据刚刚统计出来,新的普查又要开始了,这些数据还有意义吗?但是,另一方力量认为,数据是对事实的记录,我们的政策应该建立在一个事实的基础上,所以我们需要更多的数据。这种争论非常离谱,直到今天这种争论还在延续,比如,美国国会现在还在争,要不要统计每家每户有多少宠物,换句话说,有多少猫有多少狗,为什么,因为一旦他们统计了有多少猫多少狗,全国的宠物协会他们就知道这些猫这些狗有多少、在哪里,他们就可以决定宠物商店开设在哪里,他们每年应该生产多少猫粮狗粮,这些猫粮狗粮可以卖给谁等等,这些数据就是事实。

在这种对事实的渴望驱动下,美国最早的问卷从28个上升到1870年的156个,然后在1880年上升到13000多个。什么意思?美国每做一次普查要问一万多个问题,他的数据分析要8到9年才能完成,但同时,普查的时间却从最早1790年的14个月,到1850年缩短到6个月,我们知道当这个时间缩的越短的时候,你可能越精确,每一个时刻,有人来到这个世界,有人离开这个世界,世界不会静止地等待你去画像。

对话《人类简史》作者赫拉利:数据崇拜将无边无际?-数据分析网

数据是什么?数据是对事实的记录。然而,就像永不停歇的钟摆一样,数据仅仅是记录,但却无法完全精确的记录事实,数据永远在追赶事实。这也是我们今天为什么要提大数据,因为大数据的背后是大事实,大事实的背后是大世界。事实就像世界一样无边无际,所以我们今天会有大数据,因为我们试图用数据去记录整个世界。

什么是事实?赫拉利教授上来他也谈到了什么是事实,我们的数据为什么追赶不到事实,就是因为事实其实非常庞大,事实虽然只有一个,但事实却有千万个棱面。

记得我刚刚到美国读书的时候,有个教授跟我说,事实只有一个,但是观点可以有很多。为什么针对一个事实会有那么多观点呢?因为事实有很多个侧面,可以进行不同的解读,我们任何一组数据都仅仅只是描绘了事实的一个侧面。我们今天对数据的崇拜,就是因为在不断的完善、追逐真正的事实,但又无法追上!

数据崇拜让美国领跑信息时代

回到人口普查,这种崇拜、这种追逐最终产生了什么?

刚刚大家看到一个数据,在1890年的时候,美国的人口普查的数据分析时间从8、9年降到了2.5年,他们的普查范围更大了,提出了几万个问题,为什么却能降到2.5年,就是因为技术创新。

人类在信息时代的第一个创新就是打孔机。打孔机把所有的普查数据变成了卡片,变成了有、没有的封闭选项,用“有洞”和“没洞”来表示数据,也就是0和1,这是计算机最早的雏形。打孔机就是在美国人口普查局发明的,普查局的一个员工发明了打孔机,随后这个员工出来成立了一家公司,这家公司今天大家都耳熟能详,它就是IBM。等到1946年的时候第一台计算机被发明的时候,所接受的第一个商业项目就是处理美国的人口大数据。

所以我们今天回头看,美国人对于数据的崇拜,对于数据的追求,最终促使了人类社会进入信息时代,这个地标性的东西,计算机、打孔机的发明,就是因为人口普查。

对话《人类简史》作者赫拉利:数据崇拜将无边无际?-数据分析网

为什么我们人类会有这种对数据的崇拜,因为数据在记录事实,数据表示的是过去,但是数据表达的是未来,人类一切的努力都是为了更好的去预测未来。我猜你喜欢什么东西,然后再推送给你,就是在预测未来。怎么预测未来?没有其他的办法,唯一科学的办法就是根据数据。

数据当中有规律,数据当中预示未来。

今天的数据崇拜一定还会走上更高的浪潮和高峰,我们今天面临的生活事实上就是在全面的数据化,数据不是一切,但一切都将成为数据,一切业务数据化对任何企业来说都是一个终极的命运:今天企业在做的就是把自己所有的业务过程变成数据,为什么要变成数据,因为变成数据之后就可以记录下来,就可以再现事实,就可以去分析它,去预测未来。

我们对数据的崇拜将会像对土壤一样,是无边无际的。

数据是智能社会的土壤

再举两个例子,手机淘宝在做什么?

当我还在阿里巴巴的时候,手机淘宝在做一件事情,每个人打开手机淘宝之后,所看到的界面都跟其他人是不一样的。今天手机淘宝有3.5亿用户,换句话说,3.5亿用户每个人打开之后,所看到的界面都是个性化的,这是一件非常了不起的事情,人类的历史上从来没有实现过,一件产品发送给3.5亿人,每个人看到的都是不一样的个性化定制。

阿里巴巴为什么能做到?因为它掌握了大量的数据,在这些数据的基础上,通过算法,它知道你最想看到什么。整个世界的商品千千万万,我们的屏幕只有一点点大,它要把你最需要的东西推送给你,这就是今天的个性化服务,这就是今天的智能化服务,它的基础就是数据。

我们还知道百度最近发布了他们关于无人驾驶汽车的计划,三年上市、五年量产。我们今天这代人真的是在见证伟大的时代改变,这种改变不是三千年未有之变局,是人类历史上从来都没有过的巨大变局,我们今天有幸在见证。无人驾驶汽车是数据驱动的汽车,我们看到今天的数据革命反过来跟工业革命相结合,在改造汽车,把它推到了一个新的高度。无人机也在快速普及,它会引起空中大数据的爆炸,我们今天的地图包括谷歌地图、百度地图,他们的基础是什么,卫星、遥感,但是无人机未来可以飞到离地面只有20米、30米的地方,把整个大地拍下来,大家可以想象,我们未来的地图是什么样的地图,它会比现在我们看到的地图要精确一百倍。

重要的事情说三遍,数据不是黄金,不是石油,而是土壤!

为什么?

黄金跟石油是工业时代的产品,它们用完了就用完了,它们是可以消耗的。但数据不是,数据永远在这里,你越用会越多。数据是我们新时代的资源,我们今天为什么对数据有这样的崇拜,因为我们在迈向一个智能社会,因为我们追求事实,我们追求科学,我们想更好的把握未来。

我已经在去年春节前离开了阿里巴巴,出来创建了自己的公司,我的一个使命就是在中国推动大数据的发展,普及大数据的文化、思维和技术。这是我的工作,谢谢大家。

来源:涂子沛频道公众号(授权转载)

作者简介:涂子沛,著名信息管理专家,观数科技创始人,原阿里巴巴集团副总裁。《大数据》《数据之巅》作者。

banner
看过还想看
可能还想看
热点推荐

永洪科技
致力于打造全球领先的数据技术厂商

申请试用
Copyright © 2012-2024开发者:北京永洪商智科技有限公司版本:V10.2
京ICP备12050607号-1京公网安备110110802011451号 隐私政策应用权限