banner
大数据平台>数据可视化>有效的数据可视化

有效地对数据进行可视化

作者: 古思特来源: afenxi时间:2017-03-27 14:54:28

如何才能做好大数据的可视化呢?今天,我们来回答一下整个问题。

整个设计流程中,数据是基础,如果仅仅是把数据置于孤立、静态的图形中,则会限制可视化能够回答的问题数量,让数据贯彻其中,把来龙去脉娓娓道来,成为数据可视化的核心所在。

数据可视化,并不意味着一定要使用很炫的图形,不同类型的数据需要的展现方式不同,即使是最朴实的展现方式也有适用的场合,可视化的最终目的是为了用直观、交互的方式传递数据中隐藏的信息,回答用户的问题。如果图形很绚丽,但是无法从图形中获取有价值的信息,这样的可视化是不可取的。

数据可视化设计,需要根据场景对数据维度或属性进行筛选,根据目的和用户群选用表现方式,同一份数据通过数据可视化可以展现成多种看起来截然不同的形式。

有的可视化目标是为了观测、跟踪数据,所以就要强调实时性、变化、运算能力,可能就会生成一份不停变化、可读性强的图表; 有的为了分析数据,所以要强调数据的呈现度、可能会生成一份可以检索、交互式的图表;有的为了发现数据之间的潜在关联,可能会生成分布式的多维的图表; 有的为了帮助普通用户或商业用户快速理解数据的含义或变化,会利用漂亮的色彩搭配、动画创建生动并具有吸引力的图表。

如何把数据转化成有效的可视化形式(任何种类的图表或图形)是让数据发挥价值的第一步。接下去简单的介绍一些常用的分析图形,以及它们适用的场景。

常规图形 一般我们做统计分析都会用到柱状图,折线图,饼图。折线图通常用于表达趋势,饼图用于显示信息的相对比率,柱状图用于横向比较数据数值。这些常规图形同样会用于数据可视化领域,但都会辅助以交互的方式,不仅限于一份静态的图表;交互的方式,可以使得用户能够对感兴趣的数据进行深入挖掘。除此之外,这些常规的图形还会以组合的方式出现,以突出数据的多维度。

例如,传统的饼图一般用来表达一维数据的比例,如果我们把饼图和地图组合起来使用,就可以大大拓展饼图的使用方式,下图是通过百度ECharts制作的混合饼图,用户展现全国各省的GDP数据,其中地图上的颜色越深代表数值越高,同时用户还可以通过交互的方式在地图上选择参与饼图对比的区域;一方面可以通过地图形象的看到全国最高的省份,同时通过交互式选择也避免了对比条目太多,无法区分重点,把选择的权利交给用户,用户可以根据自己的疑问去设置,进行对比。

如何有效地对数据进行可视化-数据分析网

散点图 当想要再深入挖掘一些数据,但不确定不同信息的关联方式,或者是否有关联时,可以选择散点图。散点图是大概了解趋势、集中度、极端数值的有效方式。下图是通过百度ECharts制作的散点图样例,展现的是男女身高体重的分布,可以一目了然的看出平均分布和极端数值。

如何有效地对数据进行可视化-数据分析网

气泡图 气泡图是一种动态的多维度可视化方法,展示维度包括气泡的x坐标、y坐标、大小、颜色、时间等5个维度。通过数据多属性的同步可视化以及时间动画,方便用户探查数据的差异变化以及演变趋势。下图是通过淘宝的DataV组件制作的气泡图样例,展示的是茶叶的销量情况分布,x坐标是搜索指数,y坐标是销售指数,大小是数值,颜色用来分区分类,一张图呈现数据的多维性。

如何有效地对数据进行可视化-数据分析网

树形图 当希望一目了然看清您的数据,发现不同部分与整体的关系时,可以选择树形图。顾名思义,把这种图表中的数据想成一棵树:每根树枝都赋予一个矩形,代表其包含的数据量。每一矩形再细分为更小的矩形(或者分枝),仍然以其相对于整体的比例为依据。树形图还能有效利用空间,便于您一目了然地看到整个数据集。下图是通过淘宝的DataV组件制作的树形图样例,用于展现3C数码配件的销售分布,以及不同分类的数据占比关系。图中的每个矩形代表树的一个节点,大矩形中的小矩形代表父节点包含的子节点。不同的节点用不同的颜色加以区分,节点的值用矩形面积的大小表示。每个节点可以点击进入查看更细分类的数据占比。

如何有效地对数据进行可视化-数据分析网

箱形图 箱形图又称盒须图,是显示数据分布情况的重要方式。其名称显示这种图的两个部分:盒,包含数据的中位数,以及第1和第3个四分位数(比中位数分别大、小25%);须,一般代表四分位距1.5倍以内的数据(第1和第3个四分位数之间的差)。“须”也可用来显示数据内的最高和最低点。当需要展现一组数据的分布情况时,可以选择箱形图:例如,查看数据如何向某一段偏斜,查看数据中的异常值。下图是通过Tableau制作的盒须图样例,用于展现大学招生的成绩的数据分布,可以看出数学专业和建筑专业平均分最高,机械工程专业和金融专业的分数跨越较大。

如何有效地对数据进行可视化-数据分析网

除此之外,还有用于展现数据之间的联系的弦图,力图,用于对比参照目标评估指标表现的靶心图,用于对比两类数据之间的交集的热力图等等。

数据可视化的发展趋势

随着各行各业对大数据分析的深入,数据可视化已经在各个领域遍地开花。

企业通过数据可视化宣传自己的产品,学校通过数据可视化来分析自己的生源,电商通过数据可视化分析客户的消费习惯,支付产品通过数据可视化提供年度账单,可视化作品是否优秀,取决于产品本事能用户带来什么?

学校分析生源,可以提供按星座分配宿舍的服务,电商分析客户消费习惯,可以把用户最可能关注的商品进行推荐,支付产品提供年度账单,可以增加用户的粘性,说到底都是给用户带来了附加价值。这类优秀作品都是解释型的可视化作品,在这些作品背后,展现形式多种多样,如何找到用户潜在关注的分析维度是数据可视化的核心,而探索型的可视化工具可以协助分析策划人员更有效的分析数据,找到数据之间的关联,制作出优秀的解释型可视化作品。虽然可视化在探索型和解释型领域会各自独立发展,但人们通过探索型的工具发现的数据关联,现有的展现方式无法表达时,就会推动解释型工具的更新。

banner
看过还想看
可能还想看
热点推荐
Yonghong的价值观:以卓越的数据技术为客户创造价值,实现客户成功。