数据分区

<< Click to Display Table of Contents >>

当前位置:  深度分析 > 旧操作 > 数据变换 

数据分区

复制链接

1.概述

一般做预测分析时,会将数据分为两大部分。一部分是训练数据,用于构建模型,一部分是测试数据,用于检验模型。数据分区就是把数据集节点的数据分为验证集和训练集。

2.配置参数

拖拽一个数据集和一个数据分区节点到画布,连接数据集和数据分区节点。

将数据分区节点添加到实验后,可通过右侧的”配置项目“页面,对数据分区进行设置。

DepthAnalysis_OldDataPartition

【训练集比例(%)】训练集占总样本数的比例,默认值是60。

【随机拆分】当不选中时按顺序抽取训练集。当选中时随机抽取训练集。默认未选中。

【随机数种子】生成随机数的种子。默认值是0。

设置数据分区后,可查看分区后的元数据、对数据进行过滤、探索数据。

元数据和探索数据可参考深度分析>实验功能使用>节点>数据