去重

<< Click to Display Table of Contents >>

当前位置:  数据准备 > 数据集 > 自服务数据集 

去重

复制链接

1.概述

从操作列表拖曳“去重”节点到自服务画布与一个输入节点连接,去重节点可以把连线节点的重复记录去掉。

2.应用场景

用户拿到的数据中可能存在大量的重复数据,可以使用“去重”节点来将完全重复的冗余数据去除。

1)新建自服务数据集,添加一个输入节点,输入节点的原始数据如下图所示:

clip0182

2)连接去重节点之后重复记录被去掉。

注意:需要各列都重复的完全重复的行才会被去除。

clip0183