Python pandas中缺失值的种类(None、NA、NaN)及删除方式

python缺失值有3种:

1)Python内置的None值。None,使用df['date'].isnull()进行判断是否为空值。

2)在pandas中,将缺失值表示为NA,表示不可用not available。

3)对于数值数据,pandas使用浮点值NaN(Not a Number)表示缺失数据。

所以,缺失值有3种:None,NA,NaN

pandas中的dataframe对象,删除缺失值的方式:

df.dropna(how='all')#删除所有内容均为缺失值的行
df.dropna(axis=1) #丢弃有缺失值的列
df.dropna(axis=1, how = 'all') #丢弃所有列中所有值均缺失的列
df.dropna(axis=0, subset=['name', 'age'])#丢弃name和age这两列中有缺失值的行

 


版权声明:本文为lost0910原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。