pandas 小技巧——dataframe、series如何删除指定列中有空值的行+如何删除多列都为空的行

series

# 目标series
import numpy as np
ser = pd.Series(['a','b',np.nan,'c',''])

# 删除空值(空字符串不算空值!).inplace=True表示在原series上进行修改
ser.dropna(inplace=True)

结果:

Out[1]:
0    a
1    b
3    c
4    
dtype: object

dataframe

# 目标df
df = pd.DataFrame({"name": ['A','B','C',np.nan],
                   "age": [np.nan,22,25,np.nan],
                   "gender": ['male','female','male','female'],
                  }) 

# 删除name、age列中,【任意一列】的值为空的行;
df.dropna(subset=['name', 'age'],
          axis=0, # axis=0表示删除行;
          how='any', # how=any表示若列name、age中,任意一个出现空值,就删掉该行
          inplace=True # inplace=True表示在原df上进行修改;
          )

# 删除name、age列中,二者都为空的行。
# 删除都为空的行,还是删除任意一列值为空的行,使用参数how来控制
df.dropna(subset=['name', 'age'],
          axis=0,
          how='all', # how='all'表示若指定列的值都为空,就删掉该行
          inplace=True)

结果:

Out[1]:删除name、age列中,【任一列值为空】的行
  name	age	    gender
1	B	22.0	female
2	C	25.0	male

Out[2]:删除name、age列中,【二者都为空】的行
	name	age	    gender
0	A	    NaN	    male
1	B	    22.0	female
2	C	    25.0	male

版权声明:本文为lanyuelvyun原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。