kettle | 您所在的位置:网站首页 › etl文件如何删除 › kettle |
一、数据结构
网址信息 url,标题 title,发布 时间 post_time,内容 content 二、实验目的 title,content 字段含有空值,将含有空值的数据记录去除。id 为 2 的记录,其 post_time 属性值相比其他记录多了时分秒, 对该属性值进行修改,使得全体数据格式保持一致。 三、实验步骤 3.1、步骤概览 点击预览查看导入数据: 3.2.2 、过滤记录(去除空值记录) 将属性 title 和 content 的值为空的数据记录进行过滤,存留下来的数 据则不含空值。 3.2.3、过滤记录,按post_time对数据记录进行分类处理 是否含有英文冒号。 3.2.4、剪切字符串 去除时间前面的文字并新增 post_time1 字段、去除时间前面的文字和时分秒并新增 post_time1 字段。 ![]() 3.2.5、剪切字符串 3.2.6、移除 post_time 3.2.7、移除 post_time 3.2.8、改名post_time1 3.2.9、改名post_time1 3.2.10、数据输出到MySQL 选择好目标表后,选择SQL,对表进行修改,新增属性。 选择指定数据库字段后,选择输入的数据库字段。
|
CopyRight 2018-2019 实验室设备网 版权所有 |