banner

用“大数据”的眼光看世界看未来

作者: 大数据观察来源: 大数据观察时间:2017-05-08 16:43:300

大数据,即将成为石油、矿产类的新能源、新生产要素和巨大的经济资产,开启一次重大的时代转型,预示着新一波生产率增长和消费者赢余浪潮的到来。它是管理国家的手段、商务经营的法宝、未来就职的热门,可能还是发达国家下一轮全球化竞争中的利器。

2013被称为大数据元年。

关于大数据的图书市面上就有20多种,其中最突出的是维克托·迈尔-舍恩伯格的《大数据时代——生活、工作与思维的大变革》(浙江人民出版社出版)。

舍恩伯格是最早洞见大数据时代发展趋势的数据科学家之一,早在2010年就在《经济学人》上发布了对大数据应用的前瞻性研究,他的咨询客户包括微软、惠普和IBM等全球顶级企业,被誉为“大数据商业应用第一人”。

下面,我们循着舍恩伯格《大数据时代》的脉络,了解一下大数据究竟意味着什么。

世界的本质是数据

2009年,甲型H1N1流感爆发的前几周,谷歌的工程师在《自然》杂志上预测大型流感传播即将到来。不需分发口腔试纸或调查医生,他们建立了一个系统,在每天收到的数十亿条搜索指令中关注特定检索词条(如“哪些是治疗咳嗽和发热的药物”等)的频繁使用与流感传播之间的联系,及时判断流感从哪里传出。而疾控中心要到流感爆发一两周后才能确定。

谷歌的判断就建立在大数据基础上:即以一种特定方式,对海量数据进行分析,获得有巨大价值的产品和服务或深刻的洞见。

传统经济统计原则是以抽样表征总体,人类对世界的认识,很像打着手电筒,清晰地看到脚下的某一块石头;而大数据时代的信息统计包含的样本量是如此之大,如同一盏灯笼,可能细部不够准确,但能照出整个环境和道路通向哪里。那些不很准确的最原始、看似平凡无用的信息,经过恰当的分析,让我们越来越接近正确——

中英人寿通过分析爱好、常浏览的网页、常看的节目、收入估计等好几百种生活方式数据,找出更有可能患高血压、糖尿病和抑郁症的人。申请者不必提供血液和尿样,这个纯数据分析法只需5美元,可使保险公司在每人身上节省125美元;

网站内容设置依赖于数据而不是编辑的新闻敏感度,数据比有经验的记者更能揭示哪些是符合大众口味的新闻;

网上教育公司深度研究它收集的所有数据,比如学生重放讲座视频的哪个片断,从而找出不明晰或很吸引人的地方反馈给设计课程的团队……

这很像一场寻宝游戏,通过数据科学家的巧手,这些数据的潜在价值被挖掘出来,远超其最基本的用途。数据发出了自己的声音,带给我们惊喜。有了大数据的帮助,我们会意识到本质上世界是由信息构成的。

挖掘处理数据是“大数据”的真谛

一个男人冲进塔吉特商店,气愤地对经理说:“我女儿还是高中生,你们却给她邮寄婴儿服和婴儿床的优惠券,你们是在鼓励她怀孕吗?”几天后,当经理打电话致歉时,男人语气变平和了:“我女儿的预产期是8月份,是我完全没有意识到这个事件的发生,该说抱歉的是我。”原来,塔吉特的分析团队发现,怀孕3个月的女性会买无香乳液,之后会买镁、钙、锌等营养品,有20多种关联物能使零售商较准确地预测预产期,寄出相应的优惠券招徕顾客。

在大数据时代我们可以预测未来。古代能够预言天气的人,往往被视为通神,而今需要的只是海量信息的占有和分析。

大数据不仅仅在于数据之大,挖掘处理才是大数据关键所在。一要有收集及开发数据的特定工具,二要有集黑客和定量分析员优长于一身的数据科学家。

随着相关技术的成熟,公共部门和私人企业过去积累的大量“垃圾”数据有可能重焕光彩。比如用微观居民和企业用电量数据指导智能电网建设、用交通事故和犯罪数据指导警力布局、用消费和税收数据指导收入分配、用客流量数据指导铁路和民航调配、用互联网关键词传播数据进行流行病预防等等。

沃尔玛可谓是大数据的玩家。在对每个顾客购物篮中的物品、具体购买时间甚至购买日的天气分析后,研究人员发现,跟尿布一起搭配购买最多的竟是啤酒,而季节性飓风到来之前,POP-Tarts蛋挞被大量买走。于是沃尔玛把啤酒和尿布捆绑销售;在飓风警报发出后,将蛋挞和手电筒等放在一起。过去,总部人员需要先有想法,再收集数据来验证;如今,他们可以预测到当A出现,B即将出现,这已经足够珍贵。他们不再探求难以捉摸的因果关系,转而关注事物的相关关系。

搜集数据是否涉及隐私

一天早晨,警察冲进霍华德·马科斯的家,后者正打算用剪刀刺杀他的妻子,因为他发现妻子给他戴了绿帽子。警察开始控制霍华德,霍华德大喊冤枉:“我什么都没做啊!”这是电影《少数派报告》中的场景。不受限制的大数据分析可能也会导致这样的场景:罪责的判定是基于对个人未来行为的预测。

这场即将到来的数据革命,将给企业、国家的发展模式带来前所未有的革新与挑战,必须从战略高度来认识。美国总统科学技术顾问委员会主席霍尔德伦说,像美国历史上对超级计算和互联网的投资一样,大数据计划将对美国的创新、科研、教育和国防产生深远的影响。美国的每一项立法和计划,都有一个数据库和信息管理系统与之对应。2012年3月,美国宣布将投入2亿美元启动“大数据发展研究计划”,以推动大数据的提取、存储、分析、共享和可视化。通用电气也将投资15亿美元在旧金山建立一个全球软件和分析中心,拟雇佣科学家400名。如同工业革命要开放物质交易、流通一样,开放、流通的数据是时代趋势的需要。

但滥用大数据也会带来危险,当零星存在的数据被汇总,危机就出现了——不仅仅是隐私的泄露,还包括了被预知的可能性——这些能预测我们可能生病、拖欠还款和犯罪的算法会使我们无法购买医疗保险、无法贷款,甚至在实施犯罪前被预先逮捕。过于依赖数据,我们同样会受到局限:因为数据量过于庞大,做出决策的将是机器而不是人类。

《大数据时代》一书的

总之,这本书以丰富的事例生动展现了大数据的光芒如何照亮整个世界,而严谨平实的叙述框架又令人了解到大数据各个技术性方面。对大数据的了解令我们对未来增添了憧憬和信心,难怪宽带资本董事长田溯宁称它是“我看到的最好的大数据著作”。

(责任编辑:蒙遗善)

banner
看过还想看
可能还想看
热点推荐

永洪科技
致力于打造全球领先的数据技术厂商

申请试用
Copyright © 2012-2024开发者:北京永洪商智科技有限公司版本:V10.2
京ICP备12050607号-1京公网安备110110802011451号 隐私政策应用权限