banner

大数据让关联更清晰 但并非是魔法水晶球

作者: 大数据观察来源: 大数据观察时间:2017-08-28 18:30:230

即使社会日益受数据驱动,必须记住的是大数据并非预测未来的神奇工具。   如果你吃冰激凌,你就很容易被淹死。   这当然不是真的。只不过夏天的时候吃冰激凌和游泳会同时发生,这两个是相关联的——冰激凌开始消费对于溺亡惨讯是前后发生的事情——但冰激凌很难造成溺亡。  

大数据让关联更清晰

这类关联在我们身边无处不在,而大数据让它们更容易被发现。我们可以把儿童时期受的外伤和肥胖联系起来,也可以把犯罪率和营养学联系起来,甚至可以把婴儿学步和政治联盟的未来联系起来。   就像我们不能打着避免溺亡的旗号禁止冰激凌,我们不能先期逮捕任何人只因为他们饮食不科学。但是在有着压倒性似是而非的关联性数据后,被量化的社会却可能试图这么做。造成这种压倒性的关联性正是通过大数据的技术最容易实现的。   现在比任何时候都更容易发现关联性。平行计算,算法的进步,以及依照摩尔定律产生的无法阻止的进展显而易见地降低了数据设置分析中造成的消耗。今天的我们已经习惯于不假思索地一遍遍做一件事情:谷歌搜索。该搜索是由无数服务器支持下得以实现的,它总能在不到一秒钟的时间里回复给你上百个答案。它提醒你大数据貌似神秘,但已在眼前。   谷歌搜索结果并非正确答案,他们并非最接近你所寻找的信息。类似的沃森(Watson)——IBM在《危险边缘》(Jeopardy)上获奖的软件,可以为了推测正确答案挖掘上百万记录。今天,大量简单便宜的工具是被用来做着这件事情,事物之间的关联性似乎变得更加清晰。

数据无情 用之须慎

明天的数据驱动社会将更加智能和无声,也更加正确和无情。手段的伦理性到现在才清晰:从某些方面讲,从无罪到有罪的论证看来只不过是从无罪到疑似有罪。   大数据革命真的可以为我们带来一些预测的结果。不管是为上网者选择合适广告,或是设置最优保险金习,我们都可以把数据掰开揉碎了来预测所要发生的。但我们应该知道这并非预测的全部。   支持者认为这是人类的福音。大数据让我们更智慧:我们可以预测流感的爆发,或者哪里慈善捐款做的最好。它也让我们可以把信息更加公开透明化,使腐败的数据无处藏身,用事实来代替意见。   另一方面,批评意见认为大数据使得我们坚持不断推进我们已经知道的东西,进而难以跳出窠臼,因此阻断了真正的创新。   我们会因此而依赖机器的改进,而不是做出革命性的创举。大量数据意味着我们可以寻找事实去支持既有观念,并由此造成分歧的完全对立以及与志同道合者的车轱辘话来回说。这最终会造成部分人群得不到医疗保障或被拒绝就业,甚至把我们带回种族隔离的境遇。   大数据并非预测未来的魔法工具。即使它常常在推测上往显示出惊人的能力,但它也不是什么窥探灵魂或者决定未来的方式。推测成本下降为零也并不意味着我们可以把推测当真理。在我们日益成为数据驱动的社会时,重要的是我们要记得不能用今天的数据去推测明天,正如我们不能通过禁止冰激凌来防止溺水事故。   周刊  作者:文 Alistair Croll  译 孙建昆

banner
看过还想看
可能还想看
热点推荐

永洪科技
致力于打造全球领先的数据技术厂商

申请试用
Copyright © 2012-2024开发者:北京永洪商智科技有限公司版本:V10.2
京ICP备12050607号-1京公网安备110110802011451号 隐私政策应用权限