dropna是pandas库中的一个非常有用的函数,用来删除DataFrame中包含缺失值的行或列。
dropna的语法为:
dropna(axis=0, how=’any’, thresh=None, subset=None, inplace=False)
下面讲一下各参数的作用:
axis参数:用来指定删除哪个维度(行或列)上包含缺失值的行或列,默认值是0,表示删除行。如果设置为1,则表示删除列。
现在我们生成一个DataFrame并演示一下按行或者列删除,先生成DataFrame:
import numpy as np
import pandas as pd
a = np.random.random(size=(5,6))
for i in range(len(a)):
a[-i-1,:i] = np.nan
df = pd.DataFrame(a)
df
返回了一个5行6列,并且带有很多空值(NaN)的DataFrame:

先按行删除空值:
df.dropna()
返回:

可以看到,只有原先标号为4的行返回了,因为这一行没有一个空值。
再按列删除空值:
df.dropna(axis=1)
返回:

可以看到,原先没有空值的两列返回了,其他带有空值的列都被删除了。
发布者:股市刺客,转载请注明出处:https://www.95sca.cn/archives/74929
站内所有文章皆来自网络转载或读者投稿,请勿用于商业用途。如有侵权、不妥之处,请联系站长并出示版权证明以便删除。敬请谅解!