banner

写给“普通人”看的:大数据跟“所有人”是什么关系?

作者: 大数据观察来源: 大数据观察时间:2016-11-26 13:22:520

写在前面的话

很少见地,这是一篇散文。(之所以少见,是因为笔者在求学的那些年写所谓的“考试作文”,写散文从未得过高分——彩笔从未排除是评判标准的问题。)

一、我有一个朋友

该青年在广州某大型政府投资性企业工作,为人靠谱(我会乱说),领导看好,目测有一个Promising的将来(我其实不懂,不过少女们弱弱地发一下花痴就好,此人已订婚)。

这样一个朋友(本应跟彩笔的二笔人生毫不搭界),偶尔会以请吃饭为诱饵,创造机会跟笔者扯一段什么是大数据之类的话题。可见他原本的工作内容、以及社交圈子跟大数据的相关程度有多稀疏;也可见他是有多绝望——找到彩笔这种边缘人。

这个朋友代表这样一类人:

1. “社会意识”开始觉醒; 2. 部分精神世界开始脱离低级趣味; 3. 有意愿跻身于“大数据”这个ongoing时代潮流中; 4. 无法摆脱“术业有专攻”的桎梏,“专业能力”不对路,至少目前做不到为“大数据”的宏伟蓝图的实现添砖加瓦。

若是在以前(对不起,彩笔也不知道至少要追溯到多久之前),“隔行如隔山”,现如今这种大范围的跨行业“乱入”应该完全不能想象吧。所以,《世界是平的》这种内容的书会成为比尔盖茨推荐的畅销书,还竟然可以“再来一本”。这种现象的出现,也便由意料之外,变为情理之中了。

这个又热又挤又平的世界,好像可以让人不费吹灰之力就可以看到其他行业的人在忙什么。这种零高度差创造出一种“好像很容易”、“我也可以做到啊”之类的幻觉。于是,越来越多的人开始觉得,自己就是那个厨子,以为“不想当裁缝的司机,不是好厨子”的励志的句子说的正是自己。

笔者本想说,每个人做好自己的本分就够了。然而转念一想,如何在这个扁平的毫无遮拦的世界里界定“本分”?有难度。同时,作为一个自由主义者,笔者坚定地维护每个人“天马行空”、“异想天开”以及做任何不切实际的梦的自由,即便倾向于以结果为导向的笔者找不到论据JUSTIFY他们的各种妄想。

因为上文的种种(也会因为下文的种种),每次SENSE到这位大叔是要FEED有关大数据的内容而请求见面时,彩笔黄就会很纠结。且不说彩笔能说出来的东西不多,彩笔也更加不知道大数据concerns him how,不知道要跟他说什么。钱可以浪费,但粮食不能浪费。这样的饭,彩笔吃不下。

二、我有一个同学

笔者求学期间的一个同学,现在是鄙人母校的在读博士。当年(2012年6月末至7月初的时候),我们是一同在武汉大学图书情报与档案管理研究生暑期学校的讲座上,听张李义老师的讲座“大数据背景下的信息处理工具与方法”。有生之年for the first time,聆听有关“大数据”的福音。自那时始,大数据便渐渐“走进了彩笔的内心深处”,扎根下来,变成了彩笔黄的一生挚爱,谁都抢不走。然而,截然相反地,这位同学却在随后的时间里,走上了一条几乎完全相反的路。用她的话说:“大数据对于我们这种没有数据处理技术,没有数据处理设备,更压根就没有数据的(一般)人来说,就是个坑(绕着走)。”

——————————————下面是一段插叙————————————————

笔者在之前的一篇文章中提到过(我就是不说是哪篇),大数据不过是在新的技术水平下,某旧物展现出来的新姿态。所谓“老树发新芽”。“老树”是经典的数理统计理论,以及在漫长的实践过程中添加和反复验证的方法体系。“新芽”便是分布式、云计算这些我本身就一知半解、说出来你以为你懂但其实你根本不可能懂的“新技术”了。

如果一定要用一句简短的话表述什么是大数据,笔者会选择:“大数据即全部的数据。”

什么是“全部的数据”呢?假设你经营一家上世纪八九十年代的“小卖部”,售卖烟酒糖茶等种类有限的货品。这时,“全部的数据”可以是每种货品的成本、单价、销售、库存等等(抱歉笔者并没有实际经营经验,这里只是列举几个作为例子,看官可结合自身丰富的经验自行脑补“等等”的部分)。然后,继续假设你经营的是一家21世纪的跨国连锁超市,对于你来说“全部的数据”仍然是:每种货品的成本、单价、销售、库存等等(注:一个字都没有改动哦)。

是的,我们惊喜地发现了,这个以数据命名的时代(“大数据时代”)并没有新数据的诞生。或许一些行业的资深业内人士仍然能够想到一些现在“能看到”并且当年“看不到”的数据类型。彩笔黄的解释是,这种数据类型或许是新的,但是这些数据类型所描述的对象是一直存在的。(有些诡辩了是不是)

这些业内人士的疑问可以很好的引出我们的下一个环节:是什么让这些新的“数据类型”诞生(成为可能)?答曰:“(新)技术。”

彩笔实在是不想讨论什么是大数据,所以以上内容虽未得尽表,但也到此为止。

————————————————插叙的内容结束———————————————

终于回到我的同学这里。虽然我们分别决定走上不同的路,但是我们对大数据的一些基本认识是一致的(上述插叙的内容啦)。她之所以决定绕路,是因为认识到大数据的门槛其实很高(在这个普遍认为“THE WORLD IS FLAT”的人世间,能意识到这里实属不易)。而她本人的兴趣、专业的技能等,不足以将她提升至与大数据共舞的高度。

写到这里,笔者决定暂且告一段落。总结一下文章进行到这里的思路:

在文章中,笔者介绍了笔者身边两类人的代表,描述了他们对于大数据的态度(趋之若鹜VS避之唯恐不及)以及这种态度的形成过程。期望是能够引发有关Big Data Concerns Everybody How的思考。这两类人即便不能完全cover现在社会上的所有人,“所有人”都可以在这两个分类中找到部分自己的归属感。接下来便可以自行思考Big Data Concerns Yourself How了。因为笔者确定有下文,也确定下文的内容与解答这个问题完全无关(突然觉得这个系列——虽然确定下来只写上下两篇——应该叫做“彩笔黄的价值观输出”)。

三、哎呀我说人类啊

本小节标题请用二手玫瑰(artist)《命运(生存)》一曲中“哎呀我说命运呐”对应的旋律来发声。

彩笔黄是个很矫情的人,表现之一是不喜欢回答一些明明是哲学范畴,却被世俗的搞不清楚状况的人问出来,然后还不得不回答。比如常见于门卫大哥小哥的“你是谁?”、“你从哪里来?”、“你要到哪里去?”,[抓狂]真的是完全不知道要如何开口。

随着社会生活内容的增多,这种奇葩问题的来源也越来越多,招架不住。比如美容店、理发店或者美甲的地方,这类服务往往要以小时计(一困就是若干小时的节奏)。服务人员通常会找话题。常见的除了“你从哪里来?”之外,笔者遭遇最多的就是“你是做什么的?”

而这个问题,真!的!很!复!杂!

简单地说,笔者是做“数据分析”的。但在笔者看来,这四个字说!了!等!于!没!说!啊!笔者很抵触这样明摆着会造成误解的答案。可是,第一次被问时不说,便会有“下次”。这些天真的人们不知道有没有想清楚便执着地强迫我给出答案(我不知道他们为什么觉得我一定要说,大约正如他们不知道我为什么会不想说)。于是彩笔只得勉强挤出那四个字“数据分析”。

然而,出人意料,彩笔给出答案之后,对方会仿佛什么都知道了似的“哦~~~~~”(“我还以为是什么呢,这个我知道啊”之类的)。这让笔者很不舒服。

彩笔黄深知自己给不出可以让人“哦~~~~~”的答案(并深刻质疑这个世界上究竟是否存在对数据分析这个职业的一致的认识)。So,作为信息源的我并没有输出“数据分析”的清晰认识,为什么接收方会认为自己“知道了”呢?彩笔很痛苦。

痛点1:我热爱数据分析这个职业,但是谈到对“数据分析”本体的认识,目前的现状还很复杂,不是百废待兴,而是群魔乱舞;彩笔不知道为什么要在一个休闲放松的时候、如何跟一个处理身体美容的孩子介绍这个话题(我知道是我考虑问题太严肃了,我就是不想敷衍)。

痛点2:在我明明没有说清楚的前提下,那些人,凭什么以为自己理解了!(彩笔觉得这很荒谬,也让彩笔很气愤)

说着这么一大段有的没的(但绝对不是可有可无的),是为了引出下面要用到的这种先进的价值观:

1. 世界上也许根本没有communication,只有每个人兀自地talking。就像笃信外星人存在的组织和个体不间断地向外太空发送信号一样,漫无目的,却满怀希望。地球上的人类个体之间是不是也是这样:我们都以为自己会被理解而不停地向外界发送有关我们自己的描述。因为视野中从不缺少“同类”,所以我们会过高的估计被理解的可能性。以为自己是在跟对面的人communicating,但其实只不过是大家互相各自你说一句,我说一句(如果有人固执地把这种行为叫做communication)。

2. 所以我们根本没资格谈论understanding,在生存或相处中,我们的选项只有一个:compromise。

如此粗略地介绍一个道听途说、但是很伟大的价值观,彩笔无非是想表达:即便你找到一个人(你认为的、或你认为业内公认的能够把大数据的前生今世说清道明的人,或者不是一个人,而是一个可以实现上述功能的虚拟对象),TA说的,你又能领悟多少(当然你永远可以觉得,你领悟了,或多或少)?

四、一个虚构的例子

究竟什么是大数据?让我们看个虚构的例子(网上转载,出处不明,如有需要,原作者可与本人联系):

某披萨店的电话铃响了,客服人员拿起电话。

客服:***披萨店。您好,请问有什么需要我为您服务?

顾客:你好,我需要一份……

客服:先生,麻烦您告诉我您的会员卡号。

顾客:16846146***。

客服:陈先生,您好!您是住在泉州路一号12楼1205室,您家的电话是2646****,您公司电话是4666****,您的手机是1391234****。请问您想用哪一个电话付费?

顾客:你为什么知道我所有的电话号码?

客服:陈先生,因为我们联机到CRM系统。

顾客:我想要一个海鲜披萨。

客服:陈先生,海鲜披萨不适合您。

顾客:为什么?

客服:根据您的医疗记录,您的血压和胆固醇都偏高。

顾客:那你们有什么可以推荐的?

客服:您可以试试我们的低脂健康披萨。

顾客:你怎么知道我会喜欢吃这种的?

客服:您上星期一在中央图书馆借了一本《低脂健康食谱》。

顾客:好,那我要一个家庭特大号披萨,要付多少钱?

客服:99元,这个足够您一家六口吃了。但您母亲应该少吃,她上个月刚刚做了心脏搭桥手术,还处在恢复期。

顾客:那可以刷卡吗?

客服:陈先生,对不起。请您付现款。因为您的信用卡已经刷爆了,您现在还欠银行4807元,而且还不包括房贷利息。

顾客:那我先去附近的提款机提款。

客服:陈先生,根据您的记录,您已经超过今日提款限额。

顾客:算了,你们直接把披萨送到我家吧,家里有现金。你们多久会送到?

客服:大约30分钟。如果您不想等,可以自己骑车来。

顾客:为什么?

客服:根据我们CRM全球定位系统的车辆行驶自动跟踪系统记录,您登记有一辆车号为SB-748的摩托车,而目前您正在解放路东段华联商场右侧骑着这辆摩托车。

顾客当场晕倒。

这是个极一般的网络段子而已,语言很粗糙,逻辑也有很多经不起推敲的地方。但话糙理不糙,其中涉及到一个社会人日常生活的若干方面:经济信息、健康信息、实时的位置信息,还有现代社会基础服务如图书馆,甚至包括个体之间的关系信息(或曰户籍信息?),以及基础规则(比如健康与饮食、历史经济信息与将来的经济行为的对应等)。任何一个人(一般人/普通人),都很难讲自己的信息完全脱离与上述系统之外。

所以,对于大多数人,大数据是一种全新的服务形式,而已。LET IT FLOW,放松全身心,JUST ENJOY IT,不需要想太多。

写在最后的话

以管窥豹,可见一斑。简单的说,这篇文章的意思是:如果你不知道大数据是什么,那么,说不定你压根就不需要知道大数据是什么。或者,你知道的也是不准的。而且即便找到“别人”跟你说,你也不会明白。对于其工作逻辑来讲,就这么回事儿。把它作为你的苹果手机,你不需要因为不知道它的供应链、制造商的运作而感到焦虑,你会用它打电话、发短信、接入互联网享受五彩斑斓的Web服务,就够了。

作者:Ivey Huang   banner

看过还想看
可能还想看
热点推荐

永洪科技
致力于打造全球领先的数据技术厂商

申请试用
Copyright © 2012-2024开发者:北京永洪商智科技有限公司版本:V10.2
京ICP备12050607号-1京公网安备110110802011451号 隐私政策应用权限