我有一个系列中的分类变量。我想为每个唯一值分配整数 id,并使用 id 创建一个新系列,从而有效地将字符串变量转换为整数变量。最紧凑/最有效的方法是什么?
你可以使用pandas.factorize:
In [32]: s = pd.Series(['a','b','c'])
In [33]: labels, levels = pd.factorize(s)
In [35]: labels
Out[35]: array([0, 1, 2])
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)