banner

如果大数据是任何东西

作者: 大数据观察来源: 大数据观察时间:2016-11-24 12:08:270

一、大数据的源头

第一次听说过“大数据、商业智能、数据可视化、大数据分析软件”这些词,多数人应该是在信息技术厂商开着的营销活动以宣传自己的产品和服务的背景下听到它的。正是这种营销活动使得“大数据”这个词取得了长期流行,最终导致了今天这样家喻户晓状态。尽管它很流行,但它的最终意义仍然需要长期追求。

在这个词于2010年各地普遍使用之前,在90年代末,它就开始在这里和那里出现了。它最早出现在数据可视化的背景下,1997年在IEEE第八届会议上可视化的文件的标题由迈克尔•考克斯和大卫•埃尔斯沃定为“应用控制的需求分页外核的可视化。”这篇文章开头如下:

可视化给计算机系统提出了一个有意思的挑战:数据集通常是相当大的,超出了繁重的主存储器,本地磁盘,甚至远程磁盘的容量。我们将其称之为大数据问题。当主存储器装不下数据集时,或当本地磁盘也装不下时,最常见的解决方案是获得更多的资源。

二、什么最适合大数据

两年后,在1999年的IEEE会议,可视化的主题为为“自动化或互动:什么最适合大数据?”

2001年二月,道格•莱尼,是当时的Meta集团的分析师,现供职于Gartner公司,其发表研究报告题为“3D数据管理:控制数据流量、流速和品种。”大数据这个词并没有出现在报告中,但十年后,数量,速度和品种的“3VS”属性成了被用来定义大数据最常用的三种属性。

到2008年,这个名词在在科学界才用得足够多,以保证其在《自然》杂志成为一个特殊问题。直到2010年2月,当肯尼斯Cukier写的经济学家题为“数据,数据无处不在”时它才逐渐被广泛地使用。在这篇报告中他说:

……世界包含的多得难以想象的数字化信息变得更多更快……从商业到科学,从政府到艺术,这种影响无处不在。科学家和计算机工程师们给这种现象创造了一个新名词:“大数据”。

正是在这个时候,这个来自学术界的词语,成为近十年最成功的信息技术市场营销活动。 由于大数据还没有普遍接受的定义,关于它的讨论也很少有意义或有用的。道格•莱尼的3VS,这说明指数增加的数据量,速度和品种,在电脑问世很多年前就已经发生了。你可能会认为技术里程碑诸如个人电脑、互联网或社交网络的出现创造了指数增长的数据,但是他们仅仅取得的指数的持续上升是已经发生的事情。如果不是因为这些技术进步,数据将不再成指数增加。最近,定义已强调,大数据是不能用常规技术处理的数据的概念。什么是常规与非常规的技术?我最近对此众多的研究表明大数据是台式电脑处理不了的。而基于这个愚蠢的定义,那么大数据一直存在,因为个人电脑从来没有能够处理许多组织收集的数据集。

因此,如果大数据尚未有统一的定义,并且如果没有现行的定义确定有关数据及其用途实际上是新兴的,那么都这个词是否能形容任何事情?

三、大数据的快速增长

这里的难题:大数据,一个没有明确的定义的词语,它服务于技术供应商的营销活动,它鼓励人们在没有利用这些技术开发新的技能的前提下对这些技术有信心。这样一来,企业浪费自己的时间和金钱追逐最新的所谓大数据技术,其中有些是有用的,有些没有任何作用,因为技术只能增强人的分析能力;他们不能弥补我们缺乏的技能或完全替代我们的技能。数据、数据分析、在线分析确实是一种宝贵的资源,但前提是我们开发这些技能使得它变得意义并且在广阔的和成倍增长的噪音中找到这些相对较少有关的信号。目前市场上关于大数据分析的软件很少,这里有一款数据分析软件大数据魔镜—免费又好用的大数据BI 使用网址www.moojnn.com”大家可以体验一下!

banner
看过还想看
可能还想看
热点推荐

永洪科技
致力于打造全球领先的数据技术厂商

申请试用
Copyright © 2012-2024开发者:北京永洪商智科技有限公司版本:V10.2
京ICP备12050607号-1京公网安备110110802011451号 隐私政策应用权限