banner

靠什么中国才能在大数据时代胜出

作者: 大数据观察来源: 大数据观察时间:2017-07-25 19:06:320

《数据之巅:大数据革命,历史、现实与未来》是开中国社会大数据之先河的徐子沛的第二本着述,如果说前一本开创性的《大数据》引发了大数据战略、数据治国和开放数据的讨论,“为华文世界开创了一个重要话题”,那《数据之巅》则在追根溯源,追述小数据的历史与大数据的崛起过程,着重解析美国的实例,阐述历史大架构下的数据文化以及数据治国理念的形成。归根结底,作者是要提醒国人,当前信息技术的发展,已让我国获得了后发优势,但数据文化从来是中国文化的薄弱之处,想在大数据时代的全球竞争中胜出,必须把大数据从科技符号提升成为文化符号,在全社会倡导数据文化。

按徐子沛的看法,大数据时代是从本世纪10年代开始的,标志着人类社会正在向智能社会转型,但追述大数据的兴起过程,却要从小数据开始。他选择从美国的数据文化根基开始讲起,通过阐述初数时代、内战时代、镀金时代、进步时代、抽样时代的数据文化特征,以数据分权、人口普查、土地丈量、数据远征、数据审判等历史事件为主线、系统梳理了美国数据文化的形成,阐述其数据治国之道。

无论是开国总统华盛顿,还是打赢南北战争的林肯,都高度重视统计。因“罗斯福新政”闻名于世的美国第31任总统富兰克林?德拉诺?罗斯福更是“首倡要在公共政策的制定过程当中应用统计学的理论和方法”。高度重视统计,表明一个政府对收集社会各方面信息的科学性,此举也必定有助于决策的科学性。

但是,现实发展不可能总是自然走向好的一面。对数据越是高度重视,越不可避免地会遇到一个常识性的“技术”问题,即数据的准确性。数据是否准确主要取决于两大方面,一是统计标准的确立,二是统计过程的严谨。相较于后者,前者相对较为容易。之所以这么说,是因为统计过程的严谨与否,往往取决于统计人员的素质以及相关制衡机制。很难想象,一个统计工作人员如果受到工作之外的强力干扰,仍会谨守数据的准确性。而如果缺乏外在有效监督制约力量,统计很难不会朝向“趋利避害”的方向逐渐扭曲。这也就是说,统计做的是数字的工作,但归根结底还是取决于人的素质,还有良好机制等系统机制的约束。

美国的数据权威之所以能够得到较好的保证,抛开数届政府坚持确立科学的统计标准外,还在于整个社会对统计数据的真实性和科学性存在诸多制衡机制,比如公开和辩论。公开,本身就是社会对统计工作监督的重要内容之一,其中又以舆论监督为最。在强大的舆论监督压力下,统计瑕疵一旦被曝光,轻则被质疑,重则可能引发官场地震。二百多年来,美国舆论对各类数据始终保持着习惯性“虎视眈眈”传统,绝大多数媒体还会通过民意调查等方式,从“民间”角度反证官方数据的准确性与合理性。当然,这种“民间发声”也会被一些见风使舵的政客所利用,一些美国总统精于踩着民意统计步点,及时派“糖”以保个的支持率的实例屡见不鲜。不过,徐子沛并不认为这就是数据不可饶恕之积蔽,而是数据未来发展有必要努力克服的方向。

公开数据,还是遏制特权的有效手段。在1843年前,美国“各地的执法官为了提高(人口普查)数据的准确性,在普查完成之后,还在城市、村庄的显要位置张贴普查结果,号召民众补充和核对”。尽管后来出于隐私保护的考虑,对有关统计信息都有所遮蔽,但“国会的议员必须每年公开自己的财产情况,包括各类股票的数量和交易明细”却一点不通融。奥巴马就任总统后,“从上任的第一天起,他就在全国范围内推动数据开放运动”。数据公开力度,某种意义上也折射出一个社会的清廉度。

仅仅公开当然是不够的,因为有的数据不是公开后便可一目了然,这就需要专业人士的深入研究乃至充分争论。“在国会的听证会上,每一个数据如果稍有含糊,每一个逻辑推理的链条如果断裂,都有可能被虎视眈眈的竞争对手揪出来,受到质疑和挑战”。也只有经常性地面临被质疑的强大压力,才可能确保数据的生成过程始终严谨。

分析数据,就是为了从数字中寻找可能的规律。一个过硬的数据体系,更有益于决策的造福于社会。数据不仅在美国政界大量开花结果,民间同样收获颇丰。如盖洛普公司凭借“科学抽样”不仅成功预测数届总统人选,还为好莱坞电影《乱世佳人》提供全程指导并大获成功。而被誉为“质量管理之父”的爱德华?戴明通过抽样检查实现对产品质量的控制,还推动了日本制造业在短时间内的质量腾飞。

历史学家黄仁宇在《万历十五年》中有过一个着名论断:中国人不善于用数目字管理,对古币存世量的讨论,大多含糊其辞。近几十年来,情况有了较大改变。1983年我国出台了首部《统计法》,现在施行的《统计法》历经1996年和2009年两次修订。社会各方越来越重视分析比较各类统计数据。不过,现实表明,我们的统计工作仍有大力提升的空间。顺举一例,据报,2013年全国31省区市的GDP之和约为63万亿,这个数据超出了全国GDP总量逾6.1万亿。事实上,像这样巨大的统计“误差”绝非孤例。出现这类统计误差,原因不外乎两个,一是统计标准不一,比如未能有效厘清对央企等特殊企业特殊行业的统计内容;二是统计中掺有政绩“水分”,这也是导致统计巨大“误差”的重要原因。2002年,国务院前总理朱镕基为国家会计学院题写校训“不做假账”,这无疑是对数字工作者的巨大鞭策。然而,在多年来的“唯GDP”崇拜下,扭转数字出政绩的历史惯性不仅需要智慧,恐怕还更需要“横刀立马”的勇气。

数据本身是没有偏好的科学工具。除非这个原本枯燥的工作被赋予了太多的利益内涵而又不受制约。简言之,数据就像是铁面无私的法官,其公信力往往取决于数据生成全过程的抗干扰能力。

随着科学技术的飞速发展,特别随着社交媒体的普及,每个网民在不知不觉中都变成了数据生产者。网民上网的过程,同时也是数据处理的过程,每个网民无形中变成了一台台数据处理器,所不同的是处理标差和侧重点的不同。“从科技符号演变为文化符号,形成一种文化话语体系,大数据,正在撬动中国的制度创新、科技创新”。现在的问题是,面对海量的数字谜团,我们该如何从中寻找可能的内在规律?

banner
看过还想看
可能还想看
热点推荐

永洪科技
致力于打造全球领先的数据技术厂商

申请试用
Copyright © 2012-2024开发者:北京永洪商智科技有限公司版本:V10.2
京ICP备12050607号-1京公网安备110110802011451号 隐私政策应用权限