我对 Python 编程相当陌生,我不明白为什么会发生这种情况......我正在使用 UCI 机器学习存储库中的“在线购物者购买意图数据集”。
我将具有数值特征和分类特征的数据分成两个单独的数据框(一个用于cat.data,一个用于num.data),以虚拟化分类变量,并对数值变量进行标准化。我创建的两个数据框是'StdNumFeat'
对于标准化数字和'DumData'
对于虚拟分类变量。
这是摘录StdNumFeat.head()
Administrative Administrative_Duration Informational Informational_Duration ProductRelated
0 -0.696993 -0.457191 -0.396478 -0.244931 -0.691003
1 -0.696993 -0.457191 -0.396478 -0.244931 -0.668518
2 -0.696993 -0.457191 -0.396478 -0.244931 -0.691003
3 -0.696993 -0.457191 -0.396478 -0.244931 -0.668518
4 -0.696993 -0.457191 -0.396478 -0.244931 -0.488636
这是摘录DumData.head()
Weekend Month_Aug Month_Dec Month_Feb Month_Jul Month_June Month_Mar
0 False 0 0 1 0 0 0
1 False 0 0 1 0 0 0
2 False 0 0 1 0 0 0
3 False 0 0 1 0 0 0
4 False 0 0 1 0 0 0
当我使用以下代码连接两个数据帧时:
data = pd.concat([StdNumFeat, DumData], axis=1)
生成的数据框如下所示:
(Administrative,) (Administrative_Duration,) (Informational,) (Informational_Duration,)
0 -0.696993 -0.457191 -0.396478 -0.244931
1 -0.696993 -0.457191 -0.396478 -0.244931
2 -0.696993 -0.457191 -0.396478 -0.244931
3 -0.696993 -0.457191 -0.396478 -0.244931
4 -0.696993 -0.457191 -0.396478 -0.244931
有谁知道为什么结果列名后面跟着一个逗号,并放在括号中?这意味着什么?注意:我在 Anaconda 中使用 Jupyter Notebooks。谢谢。