使用 pd.concat() 时,生成的数据框列名称显示在括号中并添加逗号

2024-06-20

我对 Python 编程相当陌生,我不明白为什么会发生这种情况......我正在使用 UCI 机器学习存储库中的“在线购物者购买意图数据集”。 我将具有数值特征和分类特征的数据分成两个单独的数据框(一个用于cat.data,一个用于num.data),以虚拟化分类变量,并对数值变量进行标准化。我创建的两个数据框是'StdNumFeat'对于标准化数字和'DumData'对于虚拟分类变量。

这是摘录StdNumFeat.head()

   Administrative   Administrative_Duration Informational   Informational_Duration  ProductRelated
0   -0.696993              -0.457191          -0.396478            -0.244931           -0.691003
1   -0.696993              -0.457191          -0.396478            -0.244931           -0.668518
2   -0.696993              -0.457191          -0.396478            -0.244931           -0.691003
3   -0.696993              -0.457191          -0.396478            -0.244931           -0.668518
4   -0.696993              -0.457191          -0.396478            -0.244931           -0.488636

这是摘录DumData.head()

    Weekend Month_Aug   Month_Dec   Month_Feb   Month_Jul   Month_June  Month_Mar
0    False      0          0            1           0           0           0
1    False      0          0            1           0           0           0
2    False      0          0            1           0           0           0
3    False      0          0            1           0           0           0
4    False      0          0            1           0           0           0

当我使用以下代码连接两个数据帧时:

data = pd.concat([StdNumFeat, DumData], axis=1)

生成的数据框如下所示:

   (Administrative,)    (Administrative_Duration,)  (Informational,)    (Informational_Duration,)
0      -0.696993               -0.457191               -0.396478               -0.244931
1      -0.696993               -0.457191               -0.396478               -0.244931
2      -0.696993               -0.457191               -0.396478               -0.244931
3      -0.696993               -0.457191               -0.396478               -0.244931
4      -0.696993               -0.457191               -0.396478               -0.244931

有谁知道为什么结果列名后面跟着一个逗号,并放在括号中?这意味着什么?注意:我在 Anaconda 中使用 Jupyter Notebooks。谢谢。


问题是一个级别MultiIndex in StdNumFeat,显然原因是通过嵌套列表设置列名称:

StdNumFeat.columns = [['Administrative', 'Administrative_Duration', 'Informational',
                      'Informational_Duration', 'ProductRelated']]

正确方法:

StdNumFeat.columns = ['Administrative', 'Administrative_Duration', 'Informational',
                     'Informational_Duration', 'ProductRelated']
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

使用 pd.concat() 时,生成的数据框列名称显示在括号中并添加逗号 的相关文章

随机推荐

  • 函数内开玩笑模拟函数

    我不知道如何在笑话中模拟内部函数的返回值 我尝试了不同的方法 最后我找到了这个answer https stackoverflow com questions 51269431 jest mock inner function但由于某种原因
  • 在 System.Xml.XPath 中启用 XPath2 查询(XPathException:无效令牌)

    Microsoft 的 System Xml XPath nuget package 可用于 NET 4 6 声称支持 XPath 1 0 和 2 0 德文档 https msdn microsoft com en us library s
  • 核心数据:尝试查找实体中属性的最小日期

    我正在尝试查找核心数据中特定属性中最旧的日期 我发现了核心数据编程指南中的示例 http developer apple com mac library documentation cocoa conceptual CoreData Art
  • 将二进制图像划分为像素数据“块”

    我使用 Python 和 PIL 作为在二进制图像中嵌入数据的工作的一部分 并且需要分析像素组以确定要操作的适当像素 以便嵌入数据 图像需要被分割成相等的像素数据 块 以供分析 但我正在努力想出一种适当的方法来做到这一点 我尝试过使用 Py
  • 使用 mod_proxy 进行反向代理,保留原始请求 URL

    我已经使用 mod proxy Apache2 配置了一个反向代理 监听 127 0 0 1 80 将所有请求代理到 127 0 0 1 8080 所以我配置了 mod proxy 如下所示 ProxyPreserveHost On Pro
  • 检测分段常数信号中的阶跃

    我有一个分段恒定信号 如下所示 我想检测步骤转换的位置 标记为红色 我目前的做法 使用移动平均滤波器平滑信号 http www mathworks com help signal examples signal smoothing html
  • 从 apk 文件生成 Android App Bundle aab

    我正在使用 Xamarin 开发 Android 应用程序 据我所知 它不支持 Android 应用程序包 https github com xamarin xamarin android issues 1709 所以我想知道是否有任何方法
  • React 文件预览 (FIREBASE)

    我目前将文件存储在 Firebase 存储中 我希望能够实时生成每个文件的文件预览 映射 例如 PDF 文件会将第一页显示为图像 docx 将是文档的第一页 pptx 将是第一张幻灯片 未知文档将是默认文档符号 有人知道有什么好的服务可以轻
  • 模板类的格式错误的非模板方法的实例化

    我正在研究两阶段名称查找 https stackoverflow com questions 7767626 two phase lookup explanation needed 一个非常合乎逻辑的解释表明主要推理之一 https sta
  • Vue - 在设置脚本中使用 i18n

    我需要找到一种方法来使用 t of i18n在我的设置脚本中vue project 我的 i18n 文件如下所示 import createI18n from vue i18n import en from en import es fro
  • SQLAlchemy 相当于 Django ORM 的关系跨越过滤器

    这个例子来自于Django 文档 https docs djangoproject com en 1 3 topics db queries 给定 Django 数据库模型 class Blog models Model name mode
  • 解析分隔字符串

    我怎样才能得到 connect 100 username example 从这个字符串 ngg connect gt 100 username gt example Using std string find有参数 and gt and s
  • Angular ng new 返回包安装失败错误-compiler.umd.js 丢失

    我正在尝试学习 Angular 并且正在学习在线教程 但是 我似乎无法通过 ng new 创建一个新项目 我在 Windows 7 上运行节点 v10 16 0 和 npm 6 9 0 我在日志中收到以下错误 15177 verbose c
  • 使用多线程并行化 Java 中的 for 循环

    我对java很陌生 我想使用执行器服务或使用java中的任何其他方法并行化嵌套for循环 我想创建一些固定数量的线程 这样CPU就不会完全被线程占用 for SellerNames sellerNames sellerDataList fo
  • 使用纯javascript选择最接近id的id

    div div TEXT div div div div TEXT div div div TEXT div 如何选择最接近div1的div2 关注w3docs https www w3 org TR html4 struct global
  • 注入实例上的 Guice 空指针异常

    我在 Jersey2 中使用 Guice 进行 DI 我想使用它 这样我就可以使用 Google App Engine gt 不使用 HK2 我的应用程序资源 public class ApplicationResource extends
  • 如何更改 Android 中的材质日期和时间选择器背景颜色?

    How to 更改材质日期和时间选择器背景颜色在安卓中 我发现许多解决方案默认日期和时间选择器不是材料设计 您可以使用以下方法覆盖默认颜色 val datePicker MaterialDatePicker Builder datePick
  • 动态查找 EJB

    我正在 Glassfish 3 上开发一个应用程序 我有一个如下所示的 EJB LocalBean Stateless public class MyBean public void doSomething 我的客户端代码 在同一应用程序内
  • Extjs 4.2:如何在 Ext.Ajax.Request POST 中正确发送参数

    我必须从 ExtJs 脚本执行 POST 才能从数据库中删除某些内容 Ext Ajax request url deleteRole html method POST headers Content Type text html waitT
  • 使用 pd.concat() 时,生成的数据框列名称显示在括号中并添加逗号

    我对 Python 编程相当陌生 我不明白为什么会发生这种情况 我正在使用 UCI 机器学习存储库中的 在线购物者购买意图数据集 我将具有数值特征和分类特征的数据分成两个单独的数据框 一个用于cat data 一个用于num data 以虚