banner

本站译稿:人人都应该了解的大数据基本范畴

作者: 大数据观察来源: 大数据观察时间:2017-02-20 14:23:280

36大数据专稿,原文作者:Bernard Marr 本文由36大数据翻译组-一朵小金花翻译,转载必须获得本站及

大数据的范畴要求使人们更加清楚的认识大数据,而我恰恰喜欢用简洁的例子去解释一样东西。这就是为什么我将会得出一些简单的关于技术的解释,它们都是一旦你进入大数据领域你将会遇到的一些最前沿的技术。

但是,如果你对这个话题完全陌生,那么你可能首先想知道的应该是大数据究竟是什么东西。然后再回到这个问题。以下就是我得出关于大数据的一些关键词组:

算法:由相关的软件去计算一个数学的公式或者统计的过程,从而实现对数据的分析。它通常由不同的算术构成,用来自动化的处理数据和解决问题。

亚马逊的网页服务:亚马逊提供的集中式的云计算服务,专门为商业处理大规模的运算(比如说大数据项目)。这些商业企业不用投资建立自己的云计算服务器场地和数据储存仓库。实际上,是租用亚马逊提供的数据存储空间、处理数据的能力和软件的运行能力,而不是自己去购买和安装设备。

Analytics:收集数据的过程,整理和分析数据得出有价值的信息,帮助作出基于事实的决策。在很多情况下,它是包括了使用算法的软件分析。更多的内容可以参考:到底什么是大数据分析。

Big Table:谷歌的专利:数据存储系统,除了支持它本身的业务:如Gmail、谷歌地图和Youtobe之外。通过谷歌app引擎,它同样在对外开放使用中创造了价值。

生物测定学:通过技术和分析人的一种或多种身体上的特质去分辨不同的人,如脸部识别技术、虹膜识别技术以及指纹识别技术等。

厄运预言家:由Apache软件机构管理的一款受欢迎的开源数据库管理系统,被设计用来解决存放在分布式服务器上的海量数据。

云:云计算,或者计算云,简单的说是指软件或者数据在远程服务器上运行,而不是在本地。数据存储在“云里”是典型的互联网应用,无论数据的拥有者在世界的哪个角落都可以将数据存储到“云里“。

分布式文件系统:数据存储系统被设计来存放来自设备(经常“云“是基于商用服务器)的海量数据,来减少存储的费用和降低存储大量数据的复杂度。

数据学家:这是指那些能够从数据中提取价值的有关专家,他们通常在分析方法、计算机科学、数学、统计学、原创、数据洞察、沟通以及商业和商业决策方面拥有很专业的能力。

游戏化:是指从一些非游戏的事物中汲取灵感,构思一个新的游戏的过程。在大数据的环境下,游戏化经常是帮助数据收集的强而有效的方法。更多的具体内容可以参考文章:什么是数据化。

谷歌APP引擎:谷歌拥有云计算平台,允许企业发展和支持他们本身的服务器连接谷歌的云服务器。与亚马逊网页服务不同,亚马逊网页服务仅对小规模项目免费。

HANA:这是来自SAP的一款软硬件结合体,是处理和分析海量数据的一款高性能分析应用。

Hadoop:Apache 的 Hadoop 是被最广泛使用的一款分析大数据的软件架构。它能收集并存储程序,同时使用分布式硬件检索和分析庞大的数据集。(它允许数据在不同的小的服务器上传递而不是仅仅将数据存储在一个大的服务器上)。更加具体的内容可以参考文章:究竟什么是Hadoop?为什么我们要了解它。

物联网:它是指这样一种现象:越来越多人们日常接触的东西被连接起来,我们分析和传递它们间的数据,从而增加它们的价值。例如:自动驱动的汽车、自动存储的冰柜。

MapReduce:MapReduce参考软件程序是如何将一个解析分成几部分,实现将数据分布在不同地方的不同计算机中。它首先分开需要分析的数据(map),然后将分析的结果收集到一份报告(reduce)。包括谷歌和Apache(即hadoop架构的一部分)在内的一些公司都提供了MapReduce工具。

自然语言处理:软件算法是设计用来帮助计算机更加准确的了解人们每天的说的话,帮助我们人类和计算机更自然地、高效地发生交互。

NoSQL:它是参考数据库管理系统,但是它不是使用通常在传统数据库里面使用的相关表格。它被设计是为了提供海量不规则数据的数据储存和恢复系统。

预测分析:利用数据预测未来事件的发展趋势的分析过程。

R:进行数据分析的一个受欢迎的开源软件环境。

RFID:即是射频识别技术,RFID标签使用自动识别和数据捕捉技术获得标签的方位信息,将如旅游的方向或彼此接近的情况的信息发送到计算机系统,实现在网上跟踪现实界物体的情况。

软件服务(SAAS):软件制造商的成长趋势使得他们能够通过云来提供程序支持,这就意味使用者是花钱购买使用软件的时间(或者进入数据的时间)而不是直接地购买整个软件。

结构化数据对比非结构化数据:结构化数据是能够将数据都放入一个表格里面,按照这样的方式将和它相关的其他数据都放入同一张表中。非结构化数据是无法放入同一张表的数据:如邮箱信息、社交媒体发布的信息和记录了的人们说的话。

关于:Bernard Marr 全球知名的专家,在数据决策、性能管理、数据分析、KPIs和大数据方面颇有声誉。他帮助许多企业和运营团队进行管理、测试、分析的工作,从而提高了企业经营的效益。

原文标题:Big Data: The Key Vocabulary Everyone Should Understand

相关阅读:

一个常见的大数据术语表(中英对照简版)

36大数据相关术语500例解释及中英文对照②

36大数据相关术语500例解释及中英文对照①

banner
看过还想看
可能还想看
热点推荐

永洪BI
更敏捷、更快速、更强大

申请试用
Copyright © 2012-2020 北京永洪商智科技有限公司
京ICP备12050607号 京公网安备110110802011451号