每个 id 创建 n 行 |熊猫

2024-05-06

我有一个数据框df如下：

id	lob	addr
a1	001	1234
a1	001	1233
a3	003	1221
a4	009	1234

我想生成n（让我们每个 id 取 4）行，其他列是null/na/nan价值观。因此，上表应改写为：

id	lob	addr	addr2
a1	001	1234	0
a1	001	1233	0
a1	001	na	na
a1	na	na	na
a3	003	1221	0
a3	na	na	na
a3	na	na	na
a3	na	na	na
a4	009	1234	0
a4	na	na	na
a4	na	na	na
a4	na	na	na

我怎样才能实现这个目标？执行时我将拥有 500-700 个 id，并且 n 始终为 70（因此每个 id 应该有 70 行）。

我想创建一个循环来创建一行，按 id 进行分组，看看它是否小于 70，然后重复该过程，但最终会执行很多不必要的操作。

下面是一个使用 Counter 来计算每个 ID 需要多少额外行的解决方案，然后仅附加新数据：

from collections import Counter
id_count = Counter(df['id'])
# Create lists of each id repeated the number of times each is needed:
n = 4
id_values = [[i] * (n - id_count[i]) for i in id_count.keys()]
# Flatten to a single list:
id_values = [i for s in id_values for i in s]
# Create as new DataFrame and append to existing data:
new_data = pd.DataFrame({"id": id_values})
df = df.append(new_data).sort_values(by="id")

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

DataFrame

NumPy

每个 id 创建 n 行 |熊猫的相关文章

UnicodeDecodeError：“charmap”编解码器无法解码位置 2483 中的字节 0x81：字符映射到 <未定义>

我正在解析 csv 文件但收到以下错误 import os import csv from collections import defaultdict demo data defaultdict list if os path exis
matplotlib 的 pcolor 中的白线

在某些 pdf 查看器例如 OSX 上的 Preview 中使用以下命令绘制的图matplotlib的 pcolor 有白线见下图我怎样才能摆脱它们源代码非常简单选择任何数据x y z import matplotlib mat
tkinter 上的“NoneType”对象没有属性“get”错误[重复]

这个问题在这里已经有答案了我最近开始使用 python 3 6 进行编码tkinter并尝试创建我自己的项目repl it 该项目是一个简单的交互式待办事项列表但是我陷入困境并且无法使该功能正常工作该函数只是简单地获取条目并将其添加到
gcloud app deploy：此部署有太多文件

当我尝试通过 gcloud 部署我的 GAE 应用程序时出现以下错误 Updating service default failed ERROR gcloud app deploy Error Response 400 This depl
将Python嵌入到C中——导入模块

我在使用嵌入式 Python for C 时遇到问题文档 http docs python org extending embedding html 每当我尝试使用导入的模块时我都会得到 PythonIncl exe 中 0x1e089e
在 Pyinstaller、语音识别和 Pyttsx3 中使用“-w”时，PySimpleGUI 中出现“OSError：[WinError 6] 句柄无效”

所以我用 PySimpleGUI 创建了一个程序然后用 Pyinstaller 从它创建了 exe 文件这是我的命令 pyinstaller hidden import pyttsx3 drivers hidden import pyt
Django 单元测试数据库没有被拆除？

我编写了一些单元测试来测试我的 Django 应用程序特别是一个测试套件中包含大量代码setUp 功能所述代码的目的是为数据库创建测试数据是的我了解固定装置并且选择在这种情况下不使用它们当我运行单元测试套件时运行的第一个测试通
如何在Python中比较列表列表中的元素以及比较列表列表中的键？

我有以下顺序 seq ATG ATG ATG ATG GAC GAT GAA CCT GCC GCG GCA GCT 这是一个字典键用于存储每个密码子的氨基酸值三联碱基例如ATG GCT etc aminoacid TTT F TTC
从 R 中的因子记录创建变量

我有点迷失了我有一个如下所示的数据框 tract ageClass count 1 0 4 71 2 0 4 192 3 0 4 81 1 5 8 9 2 5 8 86 3 5 8 42 我想要这样的结果 tract 0 4 5 8 1
Web 应用程序框架：C++ 与 Python

作为一名程序员我熟悉 Python 和 C 我正在考虑编写自己的简单 Web 应用程序并且想知道哪种语言更适合服务器端 Web 开发我正在寻找一些东西它必须是直观的我认识到 Wt 存在并且它遵循 Qt 的模型我讨厌 Qt 的一件
为什么Python 3中实例方法可以作为类方法调用？

考虑下面的类 class Foo object def bar self print self 在Python 2中 2 7 13 调用bar 作为类方法引发异常 gt gt gt Foo bar hello Traceback most
在Python中从整个图像中检测表格部分

我有一张尺寸为 3500x5000 的图像现在我只想检测整个图像中的表格部分如果不能直接进行 OCR 处理则对其进行裁剪和旋转经过所有搜索后我想到了使用裁剪图像中的每个单元格的想法https medium com coinmonk
更改 Windows 上的 virtualenv 文件夹

计算机修复后我的 python 项目目录 Windows 发生了变化比如从 d 到 f 现在我所有的 virtualenv 都坏了激活 env 后 virtualenv 中的项目无法找到依赖项并且自定义脚本来自 env scrip
如何使 cx-oracle 将查询结果绑定到字典而不是元组？

这是我的代码我想找到一种方法将查询结果作为字典列表而不是元组列表返回看起来 cx oracle 通过部分文档讨论绑定来支持这一点虽然我不知道它是如何工作的 def connect dsn cx Oracle makedsn hos
“gi.repository.Gtk”对象没有属性“gdk”

我正在尝试使用 GTK 创建多线程需要 Gtk gdk 但我收到有关没有 gdk 属性的错误我正在使用带有 Raspbian 的 Raspberry Pi 这就是我导入 GTK 库的方式 try import pygtk pygtk r
无法从源 pylance 解析导入烧瓶

我正在学习 Python 课程的一部分是使用 Flask 设置网络服务器我按照 Flask 安装文档执行了步骤由于某种原因 flask 模块带有下划线如下所示当我将鼠标悬停时我会得到如下附加信息无法从源 pylance 解析导入
编写 CherryPy 装饰器以进行授权

我有一个cherrypy应用程序在某些视图上我想开始只允许某些用户查看它们并将其他任何人发送到需要授权的页面有没有办法使用自定义装饰器来做到这一点我认为这将是最优雅的选择这是我想做的一个基本示例 class MyApp autho
PyQt 和 QSignalMapper/lambdas - 多个信号，单槽

我在 PyQt 的菜单上有一个操作列表每个操作对应我想要显示的每个不同的提要所以我有一个 Y 将活动源设置为 Y Z 将其设置为 Z 等等对于网络漫画阅读程序我的菜单上都有并且觉得自动化方法可能更好而不是每次都打字类似于将其添
Pandas 将时间序列数据重新采样为 15 分钟和 45 分钟 - 使用多索引或列

我有一些时间序列数据作为 Pandas 数据框它从每小时过去 15 分钟和过去 45 分钟时间间隔为 30 分钟的观察开始然后将频率更改为每分钟我想对数据进行重新采样以便整个数据帧的频率为每 30 分钟一次 15 点和 45 点
我收到错误：rest_framework.request.WrappedAttributeError：'CSRFCheck'对象没有属性'process_request'

urls py from django conf urls import url from django contrib import admin from django conf import settings from django c

随机推荐

Node.js 中的 HTTPS 代理服务器

我正在开发一个node js代理服务器应用程序我希望它支持HTTP and HTTPS SSL 协议作为服务器我目前正在使用node http proxy https github com nodejitsu node http pr
Sinatra 请求对象

我可能在这里遗漏了一些非常明显的东西但我似乎无法找到答案或者自己解决它在西纳特拉他们有一个self get方法捕获块当调用块时您可以使用request里面有变量这怎么可能 Sinatra module Sinatra cla
计算指向 CLLocation 的罗盘航向 - 适用于 iOS 的半正弦函数

我了解如何获取 2 个 CLLocation 之间的距离我需要确定从 CLLocation 到另一个 CLLocation 的广义罗盘方位 N NE E 等在我实现使用半正矢公式推导方位之前是否有一个通用的开源库或代码片段您发现可以
如何在 Intellij Idea 12 中重命名/移动项目？

就像声明的那样here http link sheidaei com mozcw人们可以更改项目的名称但是它仅更改项目名称不会更改文件夹结构例如如果您的项目名为sample1并且位于 user1 development IdeaP
在 Ruby 中构建字符串时，为什么铲运算符 (<<) 优于加等于 (+=)？

我正在通过 Ruby Koans 进行工作 The test the shovel operator modifies the original string公案中about strings rb包括以下评论 Ruby 程序员倾向于使用铲子
Galaxy Tab 和 Motorola XOOM 的绘图和布局

我正在 Galaxy Tab 和 Motorola XOOM 模拟器皮肤上测试我的应用程序我不明白为什么从错误的文件夹中获取可绘制对象我有drawable xhdpi 文件夹我在其中存储大尺寸图片但是 Tab 从drawable h
socket.io 广播功能 & Redis pub/sub 架构

如果有人能帮助我解决一个小疑问我将不胜感激使用socket io广播功能和在Redis上使用pub sub设计架构有什么区别例如在另一个示例中 node js 服务器正在侦听 socket io 针对键模型 todo 和值数据
如何在书架中取出整数钥匙？

我想在架子上存储一个整数密钥但是当我尝试将整数密钥存储在搁置中时它给了我一个错误 Traceback most recent call last File write py line 12 in data id Id id Name n
如何使用QLPreviewPanel？

我该如何使用QLPreviewPanel 我知道它以前不是公共 API 但在 10 6 中已经有了如何使用它在标准 QuickLook 面板中显示文件预览查看快速查看下载器 http developer apple com librar
Azure AD 的 MVC/SPA 身份验证方案

以下是 Azure AD 支持的应用程序类型和场景 Web 浏览器到 Web 应用程序 http msdn microsoft com en us library azure dn499820 aspx BKMK Browser 本机应用程
使用 chrome headless 和 selenium 下载

我正在使用 python selenium 和 Chrome 59 并尝试自动执行简单的下载序列当我正常启动浏览器时下载可以工作但是当我在无头模式下这样做时下载不起作用 Headless implementation from se
Groovy 安装 HTTPBuilder 现在 Codehaus 关闭了？

我是一个 groovy n00b 并尝试使用 http builder 但网络上的所有示例都引用相同的内容 Grab声明不起作用我认为这是因为 codehaus org 不再托管常规内容我尝试过从以下位置下载源代码github http
在Android中存储和恢复cookie（持久cookie存储）

搜索了很多我有一个应用程序应用程序登录服务器并接收一些cookie 然后它可以使用它们执行一些POST请求例如获取用户个人资料我想在会话之间存储它们这意味着我可以重新启动设备运行应用程序并获取配置文件而无需额外登录或者换句
mysql中相同字符集和排序规则的varchar和nvarchar有什么区别

谁能告诉我具有相同字符集和整理的 varchar 和 nvarchar 之间有什么区别例子 varchar CHARACTER SET utf8mb4 COLLATE utf8mb4 unicode ci and nvarchar CHA
将纪元时间转换为日期 PHP

我现在正在使用一个 API 它提供了一个 epochTime 我已尝试一切方法将此纪元转换为日期但它似乎不起作用包括 epoch time 1000然后使用date 函数来转换它纪元时间看起来像这样 1353430853299 有办法
如何继承构造函数？

Imagine具有许多构造函数和虚方法的基类 public class Foo public Foo public Foo int i public virtual void SomethingElse 现在我想创建一个重写虚拟方法的后代类
数据绑定方法（例如 Eval()、XPath() 和 Bind()）只能在数据绑定控件的上下文中使用

我收到以下错误数据绑定方法例如 Eval XPath 和 Bind 只能在数据绑定控件的上下文中使用但我想做的只是在 ASP NET REPEATER 控件内
如何避免数据绑定的“警告：[cast]冗余转换为字符串”

Android Studio 会生成大量警告如下所示 fooBindingImpl java 106 警告 cast 冗余强制转换为 String fooActivityOfUserName set java lang String ca
如何创建一个包含滚动桶集中数据计数的集合

我有一个月的流量的服务器日志下面是部分示例 UploadDateGMT UserFileSize TotalBusinessUnits 2012 01 01 00 00 38 1223 1 2012 01 01 00 01 16 1302
每个 id 创建 n 行 |熊猫

我有一个数据框df如下 id lob addr addr2 a1 001 1234 0 a1 001 1233 0 a3 003 1221 0 a4 009 1234 0 我想生成n 让我们每个 id 取 4 行其他列是null na n

每个 id 创建 n 行 |熊猫

每个 id 创建 n 行 |熊猫 的相关文章

随机推荐

热门标签

每个 id 创建 n 行 |熊猫的相关文章