使用 pd.concat() 时，生成的数据框列名称显示在括号中并添加逗号

2024-06-20

我对 Python 编程相当陌生，我不明白为什么会发生这种情况......我正在使用 UCI 机器学习存储库中的“在线购物者购买意图数据集”。我将具有数值特征和分类特征的数据分成两个单独的数据框（一个用于cat.data，一个用于num.data），以虚拟化分类变量，并对数值变量进行标准化。我创建的两个数据框是'StdNumFeat'对于标准化数字和'DumData'对于虚拟分类变量。

这是摘录StdNumFeat.head()

   Administrative   Administrative_Duration Informational   Informational_Duration  ProductRelated
0   -0.696993              -0.457191          -0.396478            -0.244931           -0.691003
1   -0.696993              -0.457191          -0.396478            -0.244931           -0.668518
2   -0.696993              -0.457191          -0.396478            -0.244931           -0.691003
3   -0.696993              -0.457191          -0.396478            -0.244931           -0.668518
4   -0.696993              -0.457191          -0.396478            -0.244931           -0.488636

这是摘录DumData.head()

    Weekend Month_Aug   Month_Dec   Month_Feb   Month_Jul   Month_June  Month_Mar
0    False      0          0            1           0           0           0
1    False      0          0            1           0           0           0
2    False      0          0            1           0           0           0
3    False      0          0            1           0           0           0
4    False      0          0            1           0           0           0

当我使用以下代码连接两个数据帧时：

data = pd.concat([StdNumFeat, DumData], axis=1)

生成的数据框如下所示：

   (Administrative,)    (Administrative_Duration,)  (Informational,)    (Informational_Duration,)
0      -0.696993               -0.457191               -0.396478               -0.244931
1      -0.696993               -0.457191               -0.396478               -0.244931
2      -0.696993               -0.457191               -0.396478               -0.244931
3      -0.696993               -0.457191               -0.396478               -0.244931
4      -0.696993               -0.457191               -0.396478               -0.244931

有谁知道为什么结果列名后面跟着一个逗号，并放在括号中？这意味着什么？注意：我在 Anaconda 中使用 Jupyter Notebooks。谢谢。

问题是一个级别MultiIndex in StdNumFeat，显然原因是通过嵌套列表设置列名称：

StdNumFeat.columns = [['Administrative', 'Administrative_Duration', 'Informational',
                      'Informational_Duration', 'ProductRelated']]

正确方法：

StdNumFeat.columns = ['Administrative', 'Administrative_Duration', 'Informational',
                     'Informational_Duration', 'ProductRelated']

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

concatenation

使用 pd.concat() 时，生成的数据框列名称显示在括号中并添加逗号的相关文章

Pandas 字符串提取所有匹配项

我正在学习 pandas 系列字符串方法中的正则表达式操作我能够从字符串中提取第一个数字但我的正则表达式与第二个数字不匹配如何捕获这两个数字注意第二行第二个元素在这里是 NAN CODE import pandas as pd d
如何忽略传递给函数的意外关键字参数？

假设我有一些功能 f def f a None print a 现在如果我有一本字典比如dct a Foo 我可以打电话f dct 并得到结果Foo打印但是假设我有一本字典dct2 a Foo b Bar 如果我打电话f dct2
如何为 Intellij/PyCharm 设置 PYTHONSTARTUP 脚本

我尝试添加PYTHONSTARTUP环境变量我还尝试了自定义启动脚本但更令人惊讶的是这also没有工作 npa别名无法识别出于一点绝望我什至尝试添加到interpreter options 那什么也没做实际上是什么Interpr
Python 按照层次结构按多个分隔符分割字符串

我只想根据多个分隔符例如 and 和按顺序分割字符串一次例子 121 34 adsfd gt 121 34 adsfd dsfsd and adfd gt dsfsd adfd dsfsd adfd gt dsfsd adfd dsf
Django 未在 404 页面上应用应用程序中的 CSS 文件

姜戈3 0 8 Python 3 7 x 我有一个包含一些应用程序的 Django 项目我正在尝试为 400 403 404 500 错误制作一些默认错误页面我已经这样做了并显示了适当的模板但没有任何样式或 JS 在 404 错
turtle.Screen().screensize() 未输出正确的屏幕尺寸[重复]

这个问题在这里已经有答案了我编写了一些代码来在屏幕周围随机放置点但是它并没有覆盖整个屏幕 import turtle import random t turtle Turtle color red green blue pink ye
在 vim 折叠线中语法高亮 Python

我发现代码折叠 http en wikipedia org wiki Code folding帮助我更好地组织我的文件因此在我的底部 vimrc 我启用vim代码折叠 http vimdoc sourceforge net htmldo
如何为 C 分配的 numpy 数组注册析构函数？

我想在 C C 中为 numpy 数组分配数字并将它们作为 numpy 数组传递给 python 我可以做的PyArray SimpleNewFromData http docs scipy org doc numpy reference
使用 boto3 从 s3 下载时使用 filename 作为文件名

我正在使用 boto3 上传文件如下所示 client boto3 client s3 aws access key id id aws secret access key key client upload file tmp test
类型错误：需要 Future 或协程

我尝试在 asyncssh 上自动重新连接 ssh 客户端 SshConnectManager 必须留在后台并在需要时进行 ssh 会话 class SshConnectManager object def init self host u
python-polars 通过分隔符将字符串列拆分为许多列

在 pandas 中以下代码会将 col1 中的字符串拆分为许多列有没有办法在极地做到这一点 d col1 a b c d a b c d df pd DataFrame data d df a b c d df col1 str sp
是否有更矢量化的方法来沿轴执行 numpy.outer ？

gt gt gt x np array a0 a1 b0 b1 gt gt gt y np array x0 x1 y0 y1 gt gt gt iterable np outer x i y i for i in xrange x sha
根据给定列表中的值替换列中的值[重复]

这个问题在这里已经有答案了我在数据框中有一列仅允许定义列表中存在的值例如给定列表 l1 1 2 5 6 如果列表中不存在列中的值我需要将每个值替换为 0 column Expected column 1 1 5 5 2 2 3 0
如何在交互式绘图（Python）中获得鼠标指向的（x，y）位置？

我使用 ipython 笔记本带有魔法 matplotlib nbagg 我正在审查matplotlib widget Cursor但仅查看光标widgets Cursor http matplotlib org 1 4 3 exampl
如何绘制多类分类器的精度和召回率？

我正在使用 scikit learn 我想绘制精度和召回曲线我正在使用的分类器是RandomForestClassifier scikit learn 文档中的所有资源都使用二元分类另外我可以绘制多类的 ROC 曲线吗另外我只找到
如何在数据框中绘制包含三列的无向图，形成 3 种不同类型的节点（三方）？

我正在尝试使用三个不同的列表绘制网络的可视化这三个列表形成 3 种类型的节点下面的代码正在运行如图所示需要两个列表用户 ID 评分但是我希望我的图表是三部分的即 user userId review ratings prod
如何在 Sublime 2 REPL Mac 中运行 Python 3

我的问题如下我安装了 sublime 2 和 sublime repl 插件一切正常我唯一需要的是更改在控制台内置的 sublimerepl 上运行的 python 版本我的意思是我有 python 2 7 5 预先安装了 mav
如何使用 pygame.mixer 重复音乐？

我创建了以下使用 pygame mixer 播放 mp3 音乐的代码然而音乐不会重复有什么想法可以让音乐重复播放吗这是代码 playlist list playlist append put music here mp3 playl
如何限制scrapy请求对象？

所以我有一个蜘蛛我认为它正在泄漏内存结果当我检查 telnet 控制台 gt gt gt prefs 时它只是从链接丰富的页面中抓取了太多链接有时它会超过 100 000 个现在我已经一遍又一遍地浏览文档和谷歌但我找不到一种方法
在多个图表上绘制一条线

I don t know how this thing is called or even how to describe it so the title may be a little bit misleading The first a

随机推荐

函数内开玩笑模拟函数

我不知道如何在笑话中模拟内部函数的返回值我尝试了不同的方法最后我找到了这个answer https stackoverflow com questions 51269431 jest mock inner function但由于某种原因
在 System.Xml.XPath 中启用 XPath2 查询（XPathException：无效令牌）

Microsoft 的 System Xml XPath nuget package 可用于 NET 4 6 声称支持 XPath 1 0 和 2 0 德文档 https msdn microsoft com en us library s
核心数据：尝试查找实体中属性的最小日期

我正在尝试查找核心数据中特定属性中最旧的日期我发现了核心数据编程指南中的示例 http developer apple com mac library documentation cocoa conceptual CoreData Art
将二进制图像划分为像素数据“块”

我使用 Python 和 PIL 作为在二进制图像中嵌入数据的工作的一部分并且需要分析像素组以确定要操作的适当像素以便嵌入数据图像需要被分割成相等的像素数据块以供分析但我正在努力想出一种适当的方法来做到这一点我尝试过使用 Py
使用 mod_proxy 进行反向代理，保留原始请求 URL

我已经使用 mod proxy Apache2 配置了一个反向代理监听 127 0 0 1 80 将所有请求代理到 127 0 0 1 8080 所以我配置了 mod proxy 如下所示 ProxyPreserveHost On Pro
检测分段常数信号中的阶跃

我有一个分段恒定信号如下所示我想检测步骤转换的位置标记为红色我目前的做法使用移动平均滤波器平滑信号 http www mathworks com help signal examples signal smoothing html
从 apk 文件生成 Android App Bundle aab

我正在使用 Xamarin 开发 Android 应用程序据我所知它不支持 Android 应用程序包 https github com xamarin xamarin android issues 1709 所以我想知道是否有任何方法
React 文件预览 (FIREBASE)

我目前将文件存储在 Firebase 存储中我希望能够实时生成每个文件的文件预览映射例如 PDF 文件会将第一页显示为图像 docx 将是文档的第一页 pptx 将是第一张幻灯片未知文档将是默认文档符号有人知道有什么好的服务可以轻
模板类的格式错误的非模板方法的实例化

我正在研究两阶段名称查找 https stackoverflow com questions 7767626 two phase lookup explanation needed 一个非常合乎逻辑的解释表明主要推理之一 https sta
Vue - 在设置脚本中使用 i18n

我需要找到一种方法来使用 t of i18n在我的设置脚本中vue project 我的 i18n 文件如下所示 import createI18n from vue i18n import en from en import es fro
SQLAlchemy 相当于 Django ORM 的关系跨越过滤器

这个例子来自于Django 文档 https docs djangoproject com en 1 3 topics db queries 给定 Django 数据库模型 class Blog models Model name mode
解析分隔字符串

我怎样才能得到 connect 100 username example 从这个字符串 ngg connect gt 100 username gt example Using std string find有参数 and gt and s
Angular ng new 返回包安装失败错误-compiler.umd.js 丢失

我正在尝试学习 Angular 并且正在学习在线教程但是我似乎无法通过 ng new 创建一个新项目我在 Windows 7 上运行节点 v10 16 0 和 npm 6 9 0 我在日志中收到以下错误 15177 verbose c
使用多线程并行化 Java 中的 for 循环

我对java很陌生我想使用执行器服务或使用java中的任何其他方法并行化嵌套for循环我想创建一些固定数量的线程这样CPU就不会完全被线程占用 for SellerNames sellerNames sellerDataList fo
使用纯javascript选择最接近id的id

div div TEXT div div div div TEXT div div div TEXT div 如何选择最接近div1的div2 关注w3docs https www w3 org TR html4 struct global
注入实例上的 Guice 空指针异常

我在 Jersey2 中使用 Guice 进行 DI 我想使用它这样我就可以使用 Google App Engine gt 不使用 HK2 我的应用程序资源 public class ApplicationResource extends
如何更改 Android 中的材质日期和时间选择器背景颜色？

How to 更改材质日期和时间选择器背景颜色在安卓中我发现许多解决方案默认日期和时间选择器不是材料设计您可以使用以下方法覆盖默认颜色 val datePicker MaterialDatePicker Builder datePick
动态查找 EJB

我正在 Glassfish 3 上开发一个应用程序我有一个如下所示的 EJB LocalBean Stateless public class MyBean public void doSomething 我的客户端代码在同一应用程序内
Extjs 4.2：如何在 Ext.Ajax.Request POST 中正确发送参数

我必须从 ExtJs 脚本执行 POST 才能从数据库中删除某些内容 Ext Ajax request url deleteRole html method POST headers Content Type text html waitT
使用 pd.concat() 时，生成的数据框列名称显示在括号中并添加逗号

我对 Python 编程相当陌生我不明白为什么会发生这种情况我正在使用 UCI 机器学习存储库中的在线购物者购买意图数据集我将具有数值特征和分类特征的数据分成两个单独的数据框一个用于cat data 一个用于num data 以虚

使用 pd.concat() 时，生成的数据框列名称显示在括号中并添加逗号

使用 pd.concat() 时，生成的数据框列名称显示在括号中并添加逗号 的相关文章

随机推荐

热门标签

使用 pd.concat() 时，生成的数据框列名称显示在括号中并添加逗号的相关文章