我正在使用著名的泰坦尼克号数据集来解决我的第一个 Kaggle 问题。我陷入了数据集的困境。
我想替换 Age 性别的 NaN 值,例如“男性”的缺失值应替换为男性的平均年龄,反之亦然。
虽然我的代码运行良好,但出现以下异常:
“设置复制警告:
尝试在 DataFrame 切片的副本上设置值
请参阅文档中的警告:http://pandas.pydata.org/pandas-docs/stable/indexing.html#indexing-view-versus-copy http://pandas.pydata.org/pandas-docs/stable/indexing.html#indexing-view-versus-copyself._update_inplace(新数据)”
import pandas as pd
df=pd.read_csv('train.csv')
df[(df['Sex']=='male') & (df['Age'].apply(np.isnan))]['Age'].fillna(df[df['Sex']=='male']['Age'].mean(),inplace=True)
import pandas as pd
import numpy as np
df = pd.read_csv('train.csv')
df['Age'].fillna(df.groupby(["Sex"])["Age"].transform(np.mean), inplace=True)
也许这就是你想要做的事情?但我没有收到任何警告。看一下我的博文 http://higee.io/220905703094如果有必要的话也可以。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)