我有一个非常大的 Pandas DataFrame,如下所示:
>>> d = pd.DataFrame({"a": ["1", "U", "3.4"]})
>>> d
a
0 1
1 U
2 3.4
目前该列设置为object
:
>>> d.dtypes
a object
dtype: object
我想将此列转换为浮动,以便我可以使用groupby()
并计算平均值。当我尝试使用astype
由于无法将字符串转换为浮点数,我正确地收到了错误:
>>> d.a.astype(float)
ValueError: could not convert string to float: 'U'
我想做的是将所有元素强制转换为浮动,然后替换那些无法通过 NaN 强制转换的元素。
我怎样才能做到这一点?
我尝试设置raise_on_error
,但它不起作用,dtype
还是object
.
>>> d.a.astype(float, raise_on_error=False)
0 1
1 U
2 3.4
Name: a, dtype: object
Use to_numeric并指定errors='coerce'
强制无法解析为数值的字符串变为NaN
:
>>> pd.to_numeric(d['a'], errors='coerce')
0 1.0
1 NaN
2 3.4
Name: a, dtype: float64
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)