Pandas：将具有重复行名称的数据重塑为列

2023-12-21

我有一个类似这样的数据集（显示第一行）：

Sample  Detector        Cq
P_1   106    23.53152
P_1   106    23.152458
P_1   106    23.685083
P_1   135        24.465698
P_1   135        23.86892
P_1   135        23.723469
P_1   17  22.524242
P_1   17  20.658733
P_1   17  21.146122

“Sample”和“Detector”列都包含重复值（“Cq”是唯一的）：准确地说，每个“Detector”对于每个样本出现 3 次，因为它是数据中的重复项。

我需要做的是：

重塑表格，使列包含样本和行检测器
重命名重复的列，以便我知道它是哪个重复项

我以为DataFrame.pivot可以解决这个问题，但由于重复数据而失败。最好的方法是什么？重命名重复项，然后重塑形状，还是有更好的选择？

编辑：我想了想，我认为最好说明目的。我需要为每个“样本”存储其“检测器”的平均值和标准差。

看起来您可能正在寻找的是分层索引数据框 [link] http://pandas.pydata.org/pandas-docs/stable/indexing.html#hierarchical-indexing-multiindex.

像这样的东西会起作用吗？

#build a sample dataframe
a=['P_1']*9
b=[106,106,106,135,135,135,17,17,17]
c = np.random.randint(1,100,9)
df = pandas.DataFrame(data=zip(a,b,c), columns=['sample','detector','cq'])

#add a repetition number column
df['rep_num']=[1,2,3]*( len(df)/3 )

#Convert to a multi-indexed DF
df_multi = df.set_index(['sample','detector','rep_num'])

#--------------Resulting Dataframe---------------------

                             cq
sample detector rep_num    
P_1    106      1        97
                2        83
                3        81
       135      1        46
                2        92
                3        89
       17       1        58
                2        26
                3        75

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

Pandas：将具有重复行名称的数据重塑为列的相关文章

稀有对象的 python 类型注释，例如 psycopg2 对象

我了解内置类型但是我如何指定稀有对象例如数据库连接对象 def get connection and cursor gt tuple psycopg2 extensions cursor psycopg2 extensions conn
如何返回 cost, grad 作为 scipy 的 fmin_cg 函数的元组

我怎样才能使 scipy 的fmin cg使用一个返回的函数cost and gradient作为元组问题是有f对于成本和fprime对于梯度我可能必须执行两次操作非常昂贵 grad and cost被计算此外在它们之间共享变量可
是否可以从 Julia 调用 Python 函数并返回其结果？

我正在使用 Python 从网络上抓取数据我想使用这些数据在 Julia 中运行计算是否可以在 Julia 中调用该函数并返回其结果或者我最好直接导出到 CSV 并以这种方式加载数据绝对地看PyCall jl https gith
在Python中从大文件中搜索单词列表

我是新蟒蛇我有一个单词列表和一个非常大的文件我想删除文件中包含单词列表中的单词的行单词列表按排序给出并且可以在初始化期间输入我正在努力寻找解决这个问题的最佳方法我现在正在进行线性搜索这花费了太多时间有什么建议么您可以使用i
使用 Boto3 以字符串形式打开 S3 对象

我知道使用 Boto 2 可以使用以下命令将 S3 对象作为字符串打开 get contents as string http boto readthedocs org en latest ref file html highlight c
无法在 selenium 和 requests 之间传递 cookie，以便使用后者进行抓取

我用 python 结合 selenium 编写了一个脚本来登录网站然后从driver to requests这样我就可以继续使用requests进行进一步的活动 I used item soup select one div class
如何通过 python 多处理利用所有核心

我一直在摆弄Python的multiprocessing现在已经使用了一个多小时的功能尝试使用并行化相当复杂的图形遍历函数multiprocessing Process and multiprocessing Manager import
运行 Python 单元测试，以便成功时不打印任何内容，失败时仅打印 AssertionError()

我有一个标准单元测试格式的测试模块 class my test unittest TestCase def test 1 self tests def test 2 self tests etc 我的公司有一个专有的测试工具它将作为命令行
使用 for 循环创建一系列元组

我已经搜索过但找不到答案尽管我确信它已经存在了我对 python 很陌生但我以前用其他语言做过这种事情我正在以行形式读取数据文件我想将每行数据存储在它自己的元组中以便在 for 循环之外访问 tup i inLine wher
pandas 相当于 np.where

np where具有向量化 if else 的语义类似于 Apache Spark 的when otherwise数据帧方法我知道我可以使用np where on pandas Series but pandas通常定义自己的 API
可以使用哪些技术来衡量 pandas/numpy 解决方案的性能

Question 如何简洁全面地衡量下面各个功能的性能 Example 考虑数据框df df pd DataFrame Group list QLCKPXNLNTIXAWYMWACA Value 29 52 71 51 45 76 68 6
为什么 __dict__ 和 __weakref__ 类从未在 Python 中重新定义？

类创建似乎从来没有re 定义 dict and weakref class属性即如果它们已经存在于超类的字典中则它们不会添加到其子类的字典中但始终re 定义 doc and module class属性为什么 gt gt gt c
使用 PIL 在 Tkinter 中显示动画 GIF

我正在尝试制作一个程序来使用 Tkinter 显示动画 GIF 这是我最初使用的代码 from future import division Just because division doesn t work right in 2 7 4
AWS Lambda 不读取环境变量

我正在编写一个 python 脚本来查询 Qualys API 中的漏洞元数据我在 AWS 中将其作为 lambda 函数执行我已经在控制台中设置了环境变量但是当我执行函数时出现以下错误 module initialization
如何将带有参数的Python装饰器实现为类？

我正在尝试实现一个接受一些参数的装饰器通常带有参数的装饰器被实现为双重嵌套闭包如下所示 def mydecorator param1 param2 do something with params def wrapper fn def
minizinc python 安装

我通过 anaconda 提示符在 python 上安装了 minizinc 就像其他软件包一样 pip install minizinc 该软件包表示已成功安装我可以导入该模块但是我正在遵循基本示例https minizinc py
带 Flask 的 RPI dht22：无法将第 4 行设置为输入 - 等待 PulseIn 消息超时

我正在尝试制作一个 Raspberry Pi 3 REST API 使用 DHT22 提供温度和湿度整个代码 from flask import Flask jsonify request from sds011 import SDS01
如何编写一个接受 int 或 float 的 C 函数？

我想用 C 语言创建一个扩展 Python 的函数该函数可以接受 float 或 int 类型的输入所以基本上我想要f 5 and f 5 5 成为可接受的输入我认为我不能使用if PyArg ParseTuple args i v
rpy2 无法加载外部库

希望有人能帮忙解决这个问题 R版本 2 14 1rpy2版本 2 2 5蟒蛇版本 2 7 3 一直在尝试在 python 脚本中使用 rpy2 加载 R venneuler 包该包以 rJava 作为依赖项 venneuler 和 rJa
定义在文本小部件中双击时选择哪些字符

在 Windows 上双击文本小部件中的单词也将选择连接的标点符号有什么方法可以定义您想要选择的角色吗 tcl wordchars该变量的值是一个正则表达式可以设置它来控制什么被视为单词字符例如通过双击 Tk 中的文本来选择单

随机推荐

Ruby 浮点乘法的奇怪问题

有人在 ruby 中解决这个问题吗假设我们有 a 8 1999999 我们想将其四舍五入到小数点后两位即 8 20 然后乘以 1 000 000 得到 8 200 000 我们这样做 a round 2 1000000 to i 但是我
NSString 长度和保留计数。需要澄清

根据以下代码请指教 NSString str NSString alloc initWithString Hello world NSLog Length lu n str length 11 NSLog Retain count is
numpy 负索引 a[:-0]

我想使用数组切片来修剪我的数组 IE a trimmed a trim left trim right 这太棒了除非trim right是 0 我得到a trim left 0 这是一个空数组我想我可以 a trim left a sh
TransformClassesWithDesugarForDebug 出错

我在编译 APK 调试或发布时遇到问题 Android Studio 3 0 Beta 5 这是我的构建 gradle app buildscript repositories maven url https maven fabric i
Sql Server 中的按位与

我有一个非常典型的情况我们有一个名为 Users 的表其中有一列名为 Branches varchar 1000 该组织可以有 1000 个分支机构因此如果用户有权访问分支 1 5 和 10 则分支字符串将如下所示 10001000
为 JavaScript 代码创建循环[关闭]

很难说出这里问的是什么这个问题是含糊的模糊的不完整的过于宽泛的或修辞性的无法以目前的形式得到合理的回答如需帮助澄清此问题以便重新打开访问帮助中心 help reopen questions 我想为以下 js 代码创建一个循环
主键身份值因唯一键约束违规而增加

我有一个 Sql Server 2008 表其中有一个主键 Identity Yes 和构成唯一键约束的其他三个字段此外我有一个存储过程用于将记录插入表中并使用 SqlConnection 对象通过 C 调用存储过程 C 存储过程
如何更新 Angular Array 中的现有项目（已从外部更改）？

我是 Angular 新手正在努力更新 Angular 数组中已从外部更改不是通过 Angular 支持的 UI 的现有项目这是用例我的网页是通过服务器端调用填充的我将数组加载到 Angular 中并显示在列表上现在如果服务器
采访中的任务。我们该如何解决呢？

以这种方式转换字符串 let initialString atttbcdddd result must be like this at3bcd4 但重复次数必须大于2 例如如果我们有 aa 结果将是 aa 但如果我们有 aaa 结果将是
使用模式中的数组复制到 postgres 中？

我正在使用 Ruby Rails Postgres 我的表看起来像这样架构方面 CREATE TABLE my table name my num double precision NOT NULL my string arr chara
BST 中的第二个最大值

这是一道面试题找到 BST 中的第二个最大值最大元素是 BST 中最右边的叶子第二个最大值是其父级或其左子级所以解决方案是遍历 BST 找到最右边的叶子并检查其父节点和左子节点是否有意义不那是错误的考虑这个 BST 137

 内容不收缩的 Flex 项目[重复]

这个问题在这里已经有答案了我有一个需要握住的布局

手动安装 Ruby 1.8.7（和其他东西）

我不想再依赖一键安装程序我想学习如何手动安装 Ruby 有这方面的资源吗在此处下载 Ruby 1 8 7 的 Windows 二进制文件 http www ruby lang org en downloads http www ruby
关于多核CPU的x86 LOCK问题

当执行 LOCK 后面的指令时 x86 ASM LOCK 命令前缀是否会导致所有内核冻结我在一篇博客文章中读到了这一点但它没有意义我找不到任何东西表明这是否属实这是关于锁定该地址的内存总线 Intel 64 和 IA 32 架构软件
Gmail API：如何获取访问令牌？

我正在测试邮箱API https developers google com gmail api 到目前为止我已经做了以下事情我已经在中创建了该项目谷歌开发者控制台 https console developers google com
capybara：用终止输入键填写表单字段值

我正在测试条形码阅读器输入它的行为类似于键盘但用回车键字符终止每个条形码我的 javascript 检测到输入键并响应 backbone js 应用程序如何使用具有终止输入键值的字符串填写表单字段我的测试堆栈是cucumber
Windows 窗体上的甘特图控件 [关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心 help reopen questi
AsyncPostBackTrigger 在我的应用程序中不起作用

我遇到一个有趣的问题我们正在使用母版页运行一个网站在其中一个页面中我需要创建一个更新面板该面板将在完成时显示组 SSID 因此在内容占位符之一中我将其放入
Unicode“退格键”U+0008 的用途是什么？

Unicode 字符 BACKSPACE U 0008 在编程中的用途是什么它可以用于哪些应用 On output to a terminal it typically moves the cursor one position to t
Pandas：将具有重复行名称的数据重塑为列

我有一个类似这样的数据集显示第一行 Sample Detector Cq P 1 106 23 53152 P 1 106 23 152458 P 1 106 23 685083 P 1 135 24 465698 P 1 135 23

Pandas：将具有重复行名称的数据重塑为列

Pandas：将具有重复行名称的数据重塑为列 的相关文章

随机推荐

热门标签

Pandas：将具有重复行名称的数据重塑为列的相关文章