熊猫由长到宽的重塑,通过两个变量

2023-12-29

我有长格式的数据,并且正在尝试将其重塑为宽格式,但似乎没有一种简单的方法可以使用熔化/堆叠/取消堆叠来执行此操作:

Salesman  Height   product      price
  Knut      6        bat          5
  Knut      6        ball         1
  Knut      6        wand         3
  Steve     5        pen          2

Becomes:

Salesman  Height    product_1  price_1  product_2 price_2 product_3 price_3  
  Knut      6        bat          5       ball      1        wand      3
  Steve     5        pen          2        NA       NA        NA       NA

我认为 Stata 可以用 reshape 命令做类似的事情。


这是另一个更充实的解决方案,摘自克里斯·阿尔本的网站 https://chrisalbon.com/python/data_wrangling/pandas_long_to_wide/.

创建“长”数据框

raw_data = {'patient': [1, 1, 1, 2, 2],
                'obs': [1, 2, 3, 1, 2],
          'treatment': [0, 1, 0, 1, 0],
              'score': [6252, 24243, 2345, 2342, 23525]}

df = pd.DataFrame(raw_data, columns = ['patient', 'obs', 'treatment', 'score'])

制作“宽”数据

df.pivot(index='patient', columns='obs', values='score')
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

熊猫由长到宽的重塑,通过两个变量 的相关文章

  • 使用 Python 创建 MIDI

    本质上 我正在尝试从头开始创建 MIDI 并将它们放到网上 我对不同的语言持开放态度 但更喜欢使用Python 两种语言之一 如果这有什么区别的话 并且想知道我应该使用哪个库 提前致谢 看起来这就是您正在寻找的 适用于 Python 的简单
  • TensorFlow:带有轴选项的 bincount

    在 TensorFlow 中 我可以使用 tf bincount 获取数组中每个元素的计数 x tf placeholder tf int32 None freq tf bincount x tf Session run freq feed
  • NumPy linalg.eig

    我有这个烦人的问题 但我还没有弄清楚 我有一个矩阵 我想找到特征向量 所以我写 val vec np linalg eig mymatrix 然后我得到了 vec 我的问题是 当我小组中的其他人对相同的矩阵 mymatrix 做同样的事情时
  • Python 使用 Gstreamer 访问 USB 麦克风时遇到问题,以便在 Raspberry Pi 上使用 Pocketsphinx 执行语音识别

    所以Python的表现就好像它根本听不到我的麦克风发出的任何声音 问题就在这里 我有一个Python 2 7 假设使用的脚本Gstreamer通过以下方式访问我的麦克风并为我进行语音识别口袋狮身人面像 我在用着脉冲音频我的设备是树莓派 我的
  • Python tkinter.filedialog Askfolder 干扰 clr

    我主要在 Spyder 中工作 构建需要弹出文件夹或文件浏览窗口的脚本 下面的代码在spyder中完美运行 在 Pycharm 中 askopenfilename工作良好 同时askdirectory什么都不做 卡住了 但是 如果在调试模式
  • 根据 Pandas 中的列表对多列进行排序

    感谢有关如何根据 pandas 中的倍数列表对给定多列进行排序的任何提示 如下所示 import pandas as pd sort a a d e sort b s1 s3 s6 sort c t1 t2 t3 df pd DataFra
  • 如何使用正则表达式在 pandas 数据框中选择一行以及包含特定子字符串的行后面的固定行数

    Problem 我有一个 pandas 数据框 我试图从中提取特定行 我感兴趣的行是包含日期的行 以及紧随日期行之后的行 重要的是 我想将信息从日期后面的行移动到包含日期的行中的新列 通过这样做 我将在同一行上获得 一个人 的信息 需要明确
  • CNTK 抱怨 LSTM 中的动态轴

    我正在尝试在 CNTK 中实现 LSTM 使用 Python 来对序列进行分类 Input 特征是固定长度的数字序列 时间序列 标签是 one hot 值的向量 Network input input variable input dim
  • 如何根据 HTTP 请求使用 Python 和 Flask 执行 shell 命令并流输出?

    下列的这个帖子 https stackoverflow com questions 15092961 how to continuously display python output in a webpage 我能够tail f网页的日志
  • 在相同任务上,Keras 比 TensorFlow 慢

    我正在使用 Python 运行斩首 DCNN 本例中为 Inception V3 来获取图像特征 我使用的是 Anaconda Py3 6 和 Windows7 使用 TensorFlow 时 我将会话保存在变量中 感谢 jdehesa 并
  • 揭秘sharedctypes性能

    在 python 中 可以在多个进程之间共享 ctypes 对象 然而我注意到分配这些对象似乎非常昂贵 考虑以下代码 from multiprocessing import sharedctypes as sct import ctypes
  • 如何在 Django 中使用基于类的视图创建注册视图?

    当我开始使用 Django 时 我几乎使用 FBV 基于函数的视图 来处理所有事情 包括注册新用户 但当我更深入地研究项目时 我意识到基于类的视图通常更适合大型项目 因为它们更干净且可维护 但这并不是说 FBV 不是 无论如何 我将整个项目
  • Pandas 堆积条形图中元素的排序

    我正在尝试绘制有关某个地区 5 个地区的家庭在特定行业赚取的收入比例的信息 我使用 groupby 按地区对数据框中的信息进行排序 df df orig groupby District Portion of income value co
  • 使用 Conda 更新特定模块会删除大量软件包

    我最近开始使用 Anaconda Python 发行版 因为它提供了许多开箱即用的数据分析库 使用 conda 创建环境和安装软件包也轻而易举 但是当我想更新 Python 本身或任何其他模块时 我遇到了一些严重的问题 我事先被告知我的很多
  • Werkzeug 中的线程和本地代理。用法

    首先 我想确保我正确理解了功能的分配 分配本地代理功能以通过线程内的模块 包 共享变量 对象 我对吗 其次 用法对我来说仍然不清楚 也许是因为我误解了作业 我用烧瓶 如果我有两个 或更多 模块 A B 我想将对象C从模块A导入到模块B 但我
  • Python对象初始化性能

    我只是做了一些快速的性能测试 我注意到一般情况下初始化列表比显式初始化列表慢大约四到六倍 这些可能是错误的术语 我不确定这里的行话 例如 gt gt gt import timeit gt gt gt print timeit timeit
  • PIL - 需要抖动,但限制调色板会导致问题

    我是 Python 新手 正在尝试使用 PIL 来执行 Arduino 项目所需的解析任务 这个问题涉及到Image convert 方法以及调色板 抖动等选项 我有一些硬件能够一次仅显示 16 种颜色的图像 但它们可以指定为 RGB 三元
  • 如何使用Python保存“完整的网页”而不仅仅是基本的html

    我正在使用以下代码来使用 Python 保存网页 import urllib import sys from bs4 import BeautifulSoup url http www vodafone de privat tarife r
  • 使用Multiprocessing和Pool时如何访问全局变量?

    我试图避免将变量冗余地传递到dataList e g 1 globalDict 2 globalDict 3 globalDict 并在全球范围内使用它们 global globalDict然而 在下面的代码中并不是这样做的解决方案 是否有
  • tkinter:打开一个带有按钮提示的新窗口[关闭]

    Closed 这个问题需要调试细节 help minimal reproducible example 目前不接受答案 用户如何按下 tkinter GUI 中的按钮来打开新窗口 我只需要非常简单的解决方案 如果代码也能被解释那就太好了 这

随机推荐

  • PowerShell 使用 Start-Process 在脚本块中执行函数会用双引号做奇怪的事情

    我有一个编辑注册表的 PowerShell 脚本 因此需要以管理员身份运行 为此 我从正在运行的 PowerShell 脚本启动一个新的 PowerShell 进程 并使用其中包含函数的脚本块传递部分注册表项路径 当我在该函数中使用双引号时
  • ID3v2规范

    基于http id3 org id3v2 3 0 http id3 org id3v2 3 0规范中 帧头的布局是 Frame ID xx xx xx xx four characters Size xx xx xx xx Flags xx
  • 如何使用 JSP/Servlet 和 Ajax 将文件上传到服务器?

    我正在创建一个 JSP Servlet Web 应用程序 并且想通过 Ajax 将文件上传到 servlet 我该怎么做呢 我正在使用 jQuery 到目前为止我已经做了
  • 从多处理计算更新 TKinter GUI

    我正在创建一个GUI对于 python 模拟器 这GUI提供设置模拟并运行模拟的工具 当模拟运行时 我想将进度信息传递给GUI并将其显示在Label in my simulation frame 因为模拟需要使用多处理来运行 所以我使用Qu
  • url中的#/是什么意思?

    我正在开发 ROR Web 应用程序 我的网页网址如下所示 http dev ibiza jp 3000 facebook report advertiser id 2102 dashboard 这里我明白advertiser id是210
  • 仍然对协变和逆变以及输入/输出感到困惑

    好的 我在 stackoverflow 上读了一些关于这个主题的内容 观看了this http msdn microsoft com en us vcsharp ee672319 aspx this http channel9 msdn c
  • 托管 C++ 与非托管/本机 C++ 的性能

    我正在编写一个非常高性能的应用程序 每毫秒处理和处理数百个事件 非托管 C 比托管 C 更快吗 为什么 托管 C 处理 CLR 而不是操作系统 并且 CLR 负责内存管理 这简化了代码 并且可能比 程序员 在非托管 C 中编写的代码更高效
  • Django-REST 中关系字段的 KeyError

    我有以下型号 class ProductColor models Model color title models CharField max length 50 class BasicProduct models Model produc
  • Laravel 迁移添加外键的最佳方式

    简单的问题 我是 Laravel 的新手 我有这个迁移文件 Schema create lists function Blueprint table table gt increments id table gt string title
  • 如何在 jquery 中使用单个取消委托方法删除多个事件委托

    我可以使以下内容变得更简单 而不是使用 取消委托 两次 吗 div1 undelegate div mouseenter undelegate div mouseleave 我不希望除 mouseenter 和 mouseleave 之外的
  • 哪些后端正在消耗 Google Container Engine Kubernetes 配额

    我正在尝试在 Google Container Engine 上的 Kubernetes 上设置 Ingress 但收到超出配额的错误 请参阅下面的简短输出 Name my ingress Address Default backend d
  • 基于表单字段的查询条件

    因此 我有一个查询 在其中选择一个字段并设置条件 以便它仅根据表单中特定字段的当前值选择记录 标准看起来像这样 Forms FORMAL CERT REVIEW CHECK FORM REVIEW CHECK ID 很简单的东西 但我遇到了
  • 基于 HR 标签,使用 Javascript/JQuery 将 HTML 拆分为 div

    我想根据 HR 标签将从 Web 服务收到的文章 HTML 内容 拆分到不同的 DIV 中 我用一个例子来解释 这是我从服务中收到的 p This is an article bla bla p hr p this is the next
  • MFC 获取文件夹

    嘿 我如何在 MFC 中获取所有文件夹的名称 有什么例子或者我应该研究哪些课程 任何提示将非常感激 我所看到的只是 CFile 据我所见 尽管非常非常少 它看起来没有能力做我想做的事情 所以请指导我 Thanks 调查C文件查找 http
  • 无法在设置中更改 Android 应用程序名称

    我使用 ADT Eclipse 中的向导创建了一个应用程序 我在 strings xml 中编辑了应用程序名称 这更改了启动器图标上的标签 但是 如果我进入 设置 gt 应用程序 它会显示旧名称 我尝试卸载该应用程序 清理并再次运行 但它仍
  • JavaScript - 无法正确添加 2 个数字

    我正在使用 Javascript 模拟计算器 用户可以在给定的文本框中输入 2 个数字 它将显示总和 乘积 差值和除法 这是我的功能 function calculate num1 num2 console log First Number
  • Python pip 无法在 Linux mint 上运行

    我已经遇到这个错误一年了 但仍然找不到解决方案 我正在使用 Linux Mint 17 3 每次我尝试使用 pip 安装某些东西时 都会遇到一堆异常 pip install U scikit learns Exception Traceba
  • 我可以从 .html 页面链接到 .ejs 页面吗?

    我正在制作一个网页 并且一直在 stackoverflow 上查找如何从 html 文件链接到 ejs 文件 人们在说以下内容 在index html中 li a href twitter Twitter a li 在 script js
  • 在 React 中单击组件外部时更改状态

    I have a dropdown as is shown in the following image 当我单击文件夹图标时 它会打开和关闭 因为showingProjectSelector属性处于设置为 false 的状态 constr
  • 熊猫由长到宽的重塑,通过两个变量

    我有长格式的数据 并且正在尝试将其重塑为宽格式 但似乎没有一种简单的方法可以使用熔化 堆叠 取消堆叠来执行此操作 Salesman Height product price Knut 6 bat 5 Knut 6 ball 1 Knut 6