python解决pandas处理缺失值为空字符串的问题
下面就为大家分享一篇python解决pandas处理缺失值为空字符串的问题,具有很好的参考价值,希望对大家有所帮助。一起过来看看吧
踩坑记录:
用pandas来做csv的缺失值处理时候发现奇怪BUG,就是excel打开csv文件,明明有的格子没有任何东西,当然,我就想到用pandas的dropna()或者fillna()来处理缺失值。
但是pandas读取csv文件后发现那个空的地方isnull()竟然是false,就是说那个地方有东西。。。
后来经过排查发现看似什么都没有的地方有空字符串,故pandas认为那儿不是缺失值,所以就不能用dropna()或者fillna()来处理。
立即学习“Python免费学习笔记(深入)”;
解决思路:先用正则将空格匹配出来,然后全部替换为NULL,再在用pandas读取csv时候指定 read_csv(na_values='NULL')就是将NULL认为是nan处理,接下来就可以用dropna()或者fillna()来处理了
以上这篇python解决pandas处理缺失值为空字符串的问题就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持脚本之家。
-
django开发者模式中的autoreload是怎样实现的
在开发django应用的过程中,使用开发者模式启动服务是特别方便的一件事,只需要 python manage.p...
Python
刚刚 0 -
Python中关于input和raw_input的比较
这篇文章主要介绍了python中input与raw_input 之间的比较的相关资料,通过本文希望能帮助到大家,对于他们...
Python
33秒前 0 -
Python中关于str与repr的使用详解
这篇文章主要介绍了python 基础教程之str和repr的详解的相关资料,主要说明他们之家的区别,通过此文希望能帮助到...
Python
1分钟前 0 -
Python如何实现爬取需要登录的网站代码实例
这篇文章主要介绍了python实现爬取需要登录的网站,结合完整实例形式分析了python登陆网站及数据抓取相关操作技巧,...
Python
2分钟前 0 -
Python使用四种方法实现获取当前页面内所有链接的对比分析
这篇文章主要介绍了python获取当前页面内所有链接的方法,结合实例形式对比分析了python常用的四种获取页面链接的方...
Python
3分钟前 0
- django开发者模式中的autoreload是怎样实现的 刚刚
- Python中关于input和raw_input的比较 33秒前
- Python中关于str与repr的使用详解 1分钟前
- Python如何实现爬取需要登录的网站代码实例 2分钟前
- Python使用四种方法实现获取当前页面内所有链接的对比分析 3分钟前
- Python中关于numpy灵活定义神经网络结构的实例 4分钟前
- Python中关于正则捕获操作的示例 5分钟前
- python使用最有效的方法删除大文件中的某一行的实例 5分钟前
- python中函数赋值给变量时的问题注意详解 6分钟前
- python中子类如何调用父类函数的代码示例 6分钟前