数据清洗真是个磨人的小妖精 今天又在处理一堆乱码和重复值,感觉整个人都不好了。有时候看着那些奇怪的字段名和格式不统一的数据,真的想骂人,但又不得不一个个搞定。最近发现一个小技巧,用正则表达式批量处理字符串超级方便,比手动改快多了。不过还是要提醒自己,前期设计表结构的时候多花点心思,后期就能少受点罪。数据这东西,越干净越好弄,不然真是要命啊...
登录/注册