<< Click to Display Table of Contents >> 数据准备复制链接 |
当前的数据类型、数据结构、数据范围和数据库类型各种各样且纷繁复杂,不能够直接用于数据分析,必须按照用户需求和vividime的规范进行加工,才能成为系统可以识别的数据,用于数据分析。
用户可通过各种方式创建数据集,并对数据进行多角度多层次的治理操作,包括联接、联合、分组汇总、自循环列、透视/逆透视、去重、抽样、排序、镜像;建立数据层次以方便报告端钻取、除此之外,还有日期转年/季度/月/周/日等、填充缺失值、对数据进行分组/分箱、值映射、拆分数据列、去除数据中的空格、数据类型转换等。如果基础数据未包括所需的所有列(字段),也可以通过计算创建新列,vividime Z-Suite支持100多个计算函数。经治理的数据,过滤掉不符合要求的数据,才能带来高质量的数据分析与科学的结论。
另外,数据集还提供了血缘分析功能,方便数据处理人员查看数据、报告、组件之间的依赖关系。
创建数据集模块目前支持以下数据集:SQL数据集、Excel数据集、组合数据集、自服务数据集、数据集市数据集、流式数据集、Mongo数据集、内嵌数据集、多维数据集、定制数据集、Neo4j数据集、RESTful数据集、InfluxDB数据集。