一、数据处理的内容
数据处理的内容主要有以下两项: 1.数据清洗。将多余重复的数据筛选出来,并剔除;将缺失的数据补足,将错误的数据纠正或删除。 2.数据加工。对清洗过后的数据进行字段的信息提取、计算、分组、转换等处理。
二、数据清洗
1.重复数据的处理
第一步,找出重复数据。
方法1:函数法 COUNTIF(range,criteria),对区域中满足单个指定条件的单元格进行计数。
range:要计数的单元格范围。
criteria:计算条件,可以为数字、表达式或文本,如32、>32或“三十二”。
在B2单元格输入=COUNTIF(A:A,A2),计算每一个员工编号出现的次数。 在C2单元格输入=COUNTIF(A$2:A2,A2),计算出现了两次及以上的重复项。以C9对应的编号为例,3表示从A1~A9,该编号是第3次出现。
方法2:高级筛选法
方法3:条件格式法
方法4:数据透视表 用数据透视表统计各项数据出现的频次,出现2次及以上为重复项。
第二步,删除重复数据。
方法1:通过菜单操作删除重复值
方法2:通过排序删除重复值 选择筛选功能,升序排序C列数据,删除大于1的数值即可。
方法3:通过筛选删除重复值