表格中如何筛选重复项-借助Excel自带功能快速精准筛除重复数据
上周整理季度客户报名台账,上千条杂乱数据堆在Excel里,急着清理冗余信息,被逼着实打实研究表格中如何筛选重复项,原本以为是很简单的操作,结果徒手踩了好几个没用的坑,白白浪费了半个多小时的工作时间。
最开始完全不懂正规操作,想着肉眼比对最稳妥,盯着姓名和手机号两列数据逐行翻看,密密麻麻的单元格看得眼睛发酸,偶尔能揪出几条明显重复的条目,但大部分相似度高、只有细微序号差的重复数据根本发现不了,翻来翻去不仅效率极低,还漏掉了二十多条重复记录,最后核对总数的时候数据对不上,整个人瞬间慌了神,只能推翻之前粗略整理的内容,从头开始核对梳理,大把的时间都耗在了这种低效的重复劳作上。
肉眼筛查,纯纯无用功。
后来瞎点菜单栏,看到了筛选功能,以为点开筛选、手动勾选相同内容就可以搞定,操作的时候才发现问题,普通筛选只能单一查看同类数据,没办法直接标记所有重复条目,筛选出来的内容混杂着原始数据和重复数据,根本区分不开,删错了好几条有效数据,越整理越乱,表格的数据逻辑彻底被打乱。
折腾好久才搞明白,Excel自带的重复值标记功能才是最适配的办法,不用手动比对、不用逐一勾选,只需要选中需要核对重复项的整列或者整片数据区域,点击顶部菜单栏的数据选项,找到高亮重复值功能,系统会自动用浅红色底色标注出所有重复的单元格内容,单次就能精准定位全部重复数据,不管是完全一致的整行重复,还是单列内容重复,都能一次性识别干净,全程不需要人工二次核对,比手动操作快了不止十倍,也不会出现人工遗漏的问题。
这里有个很容易忽略的小细节。只选中单列数据筛选,只会核对当前列的重复内容,如果是需要整行数据完全一致才算重复的场景,必须框选全部数据区域,不然会出现误判,把单列相同、其他信息不同的数据当成重复项,误删有效内容。
之前就是栽在这个细节上。筛选客户数据时只选了手机号列,系统标记了不少重复内容,着急忙慌批量删除之后,核对台账才发现,很多是不同客户共用门店备用手机号,信息本身是有效的,根本不是无效重复,白白弄丢了十几条有用数据,又得从原始备份里找回修复。
摸清门道之后,十分钟就清理完了整份表格的所有重复项,红色标记的内容一目了然,不用反复比对斟酌,直接批量删除冗余条目就行,剩下的数据规整又准确,后续做数据统计、报表汇总的时候,再也没有出现过总数对不上、数据错乱的问题。
关掉表格的时候,电脑屏幕的光还浅浅映在桌面的文件夹图标上。