<永洪tech>如何轻量级的数据清洗

vincent 显示全部楼层 发表于 2017-12-11 16:08:06 |阅读模式 打印 上一主题 下一主题
本帖最后由 vincent 于 2017-12-11 16:13 编辑

       Yonghong产品为用户提供了数据建模功能,这些实用的小功能具体为新建表达式、新建分组、缺失值填充、拆分列、去空格、值映射等功能。
       新建分组
       选择数据类型是布尔、字符串、时间戳、日期或时间的字段,在元数据上选中字段或者在细节数据选中字段的列头右键菜单中可以选择新建分组,对字段的数据值进行分组,数据列表中空数据和空字符串会被过滤掉。
在字符串类型的字段上右键,打开新建分组对话框,如图:
分组.png
       缺失值填充
       选择类型是字符串、数值类型(双精度、单精度、整数、长整数等)的字段,在元数据上选中字段或者在细节数据选中字段的列头右键菜单中可以选择缺失值填充,对字段数据进行填充。
       在整数类型的字段上右键,打开缺失值填充对话框,如图:
缺失值填充.png
       拆分列
       选择类型是字符串的字段,在元数据上选中字段或在细节数据选中字段的列头右键选择拆分列,可以根据分隔符对数据进行全部拆分或部分拆分。
在字符串类型的字段上右键,打开拆分列对话框,如图:
拆分列.png
       去空格
       选择类型是字符串的字段,在元数据上选中字段或者在细节数据选中字段的列头右键菜单中可以选择去空格,可以去除数据中前、后空格。
去空格.png
       值映射
       选择类型是字符串、布尔、字符、时间、日期或时间戳的字段,在元数据上选中字段或者在细节数据选中字段的列头右键菜单中可以选择值映射,对字段数据起别名,值列表中会列出空数据和空字符串。
       在字符串类型的字段上右键,打开值映射对话框,如图:
值映射.png
       当然产品中还包括其他数据类型的转换,数据表间组合等功能,有兴趣的童靴可以向永洪技术人员咨询。




回复

使用道具 举报

高级模式
您需要登录后才可以回帖 登录 | 免费注册

  • 官方微信

    欢迎关注永洪服务号!收费为0,价值无限

    扫码关注
  • 新浪微博

    让每位用户轻松挖掘数据价值!

    访问新浪微博
  • 智能客服
50W

会员等你来哦

Copyright   ©2012-2024  北京永洪商智科技有限公司  (京ICP备12050607) 京公网安备110110802011451号 |联系社区管理员|《永洪社区协议》
返回顶部