Pandas 重新索引以填充缺失的日期，还是更好的填充方法？

2023-12-13

我的数据是工厂的缺勤记录。有些日子没有缺勤，因此没有记录当天的数据或日期。然而，与所示的其他示例相比，这变得很棘手，在任何一天，都可能由于各种原因而出现多次缺勤。数据中的日期与记录的比率并不总是 1:1。

我希望的结果是这样的：

(index)    Shift        Description     Instances (SUM)
01-01-14   2nd Baker    Discipline      0
01-01-14   2nd Baker    Vacation        0
01-01-14   1st Cooks    Discipline      0
01-01-14   1st Cooks    Vacation        0
01-02-14   2nd Baker    Discipline      4
01-02-14   2nd Baker    Vacation        3
01-02-14   1st Cooks    Discipline      3
01-02-14   1st Cooks    Vacation        3

等等。这个想法是所有班次和描述都将具有该时间段内所有日期的值（在此示例中为 2014 年 1 月 1 日 - 2014 年 12 月 31 日）

我读过几个例子，最接近的例子是here.

ts = pd.read_csv('Absentee_Data_2.csv'
                , encoding = 'utf-8'
                ,parse_dates=[3]
                ,index_col=3
                ,dayfirst=True
                )

idx =  pd.date_range('01.01.2009', '12.31.2017')

ts.index = pd.DatetimeIndex(ts.index)
# ts = ts.reindex(idx, fill_value='NaN')
df = pd.DataFrame(index = idx)
df1 = df.join(ts, how='left')

但是，当我取消注释时ts = ts.reindex(idx, fill_value='NaN')我收到错误消息。我已经尝试了至少 10 种其他方法来完成我想要做的事情，所以我不能 100% 确定这是正确的道路，但它似乎让我最接近任何进展。

这是一些示例数据：

Description Unexcused   Instances   Date        Shift
Discipline  FALSE              1    Jan 2 2014  2nd Baker
Vacation    TRUE               2    Jan 2 2014  1st Cooks
Discipline  FALSE              3    Jan 2 2014  2nd Baker
Vacation    TRUE               1    Jan 2 2014  1st Cooks
Discipline  FALSE              2    Apr 8 2014  2nd Baker
Vacation    TRUE               3    Apr 8 2014  1st Cooks
Discipline  FALSE              1    Jun 1 2014  2nd Baker
Vacation    TRUE               2    Jun 1 2014  1st Cooks
Discipline  FALSE              3    Jun 1 2014  2nd Baker
Vacation    TRUE               1    Jun 1 2014  1st Cooks
Vacation    TRUE               2    Jul 5 2014  1st Cooks
Discipline  FALSE              3    Jul 5 2014  2nd Baker
Vacation    TRUE               2    Dec 3 2014  1st Cooks

预先感谢您的帮助，我是新手，两天后没有太大进展。我真的很感激这里的人们如何帮助解答，但最重要的是关于解决方案为何有效的指导。

我认为您只是在使用日期时间时遇到问题，这种方法对我有用

ts.set_index(['Date'],inplace=True)
ts.index = pd.to_datetime(ts.index,format='%b %d %Y')
d2 = pd.DataFrame(index=pd.date_range('2014-01-01','2014-12-31'))

print ts.join(d2,how='right')

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Pandas 重新索引以填充缺失的日期，还是更好的填充方法？的相关文章

Python在postgresql表中查找带有单引号符号的字符串

我需要从 psql 表中查找包含多个单引号的字符串我当前的解决方案是将单引号替换为双单引号如下所示 sql query f SELECT exists SELECT 1 FROM table name WHERE my column m
Jupyter Notebooks 不显示进度条

我正在尝试在 Jupyter 笔记本中显示进度条这是一台新电脑我通常做的事情似乎不起作用 from tqdm import tqdm notebook example iter 1 2 3 4 5 for rec in tqdm not
当我在 Pandas 中使用 df.corr 时，我的一些列丢失了

这是我的代码 import numpy as np import pandas as pd import seaborn as sns import matplotlib pyplot as plt data pd read csv dea
当单词以“|”分隔时如何读取文件（埃因霍温）？

在Python中我有一个文件其中的单词由例如 city state zipcode 我的文件阅读器无法区分单词另外我希望我的文件阅读器从第 2 行而不是第 1 行开始如何让我的文件阅读器分隔单词 import os import
更改 Altair 中的构面标题位置？

如何将方面标题在本例中为年份移动到每个图的上方默认值似乎位于图表的一侧这可以轻易改变吗 import altair as alt from vega datasets import data df data seattle weat
WindowsError：[错误 126] 使用 ctypes 加载操作系统时

python代码无法在Windows 7平台上运行 def libSO lib ctypes cdll LoadLibrary ConsoleApplication2 so lib cfoo2 1 3 当我尝试运行它时得到来自python
Apache Spark 中的高效字符串匹配

我使用 OCR 工具从屏幕截图中提取文本每个大约 1 5 句话然而当手动验证提取的文本时我注意到时不时会出现一些错误鉴于文本你好我真的很喜欢 Spark 我注意到 1 像 I 和 l 这样的字母被替换 2 表情符号未被正确提
distutils.errors.DistutilsPlatformError：需要 Microsoft Visual C++ 14.0

我想安装Pandas在我的机器上但出现以下消息错误 distutils errors DistutilsPlatformError 需要 Microsoft Visual C 14 0 获取它与 Microsoft Visual C 构
如何使用 sys.path.append 在 Python 中导入文件？

我的桌面上有两个目录 DIR1 and DIR2其中包含以下文件 DIR1 file1 py DIR2 file2 py myfile txt 这些文件包含以下内容 file1 py import sys sys path append s
将文本注释到轴并对齐为圆

我正在尝试在轴上绘制文本并将该文本与圆对齐更准确地说有一些具有不同坐标 x y 的点位于该圆内并使用以下命令创建 ax scatter x y s 100 我想用圆圈连接并标记每个点 Cnameb 文本的坐标由 xp yp 定义因此
Python 类型安全吗？

根据维基百科 https en wikipedia org wiki Type system Type safety and memory safety 如果一种语言不允许违反类型系统规则的操作或转换计算机科学家就认为该语言是类型安全的
由于 json 字符串化 dict 键导致数据丢失

考虑下面的例子 gt gt gt import json gt gt gt d 0 potato 0 spud gt gt gt json dumps d 0 potato 0 spud gt gt gt json loads json d
Python 声音（“铃声”）

我想让一个 python 程序在完成任务时通过发出嘟嘟声来提醒我目前我使用import os然后使用命令行语音程序说进程完成我更愿意它是一个简单的铃我知道有一个函数可以用于Cocoa apps NSBeep 但我认为这与此没有太
Python]将两个文本文件合并为一个（逐行）[关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我是蟒蛇新手我想做的是将文件 a 和文件 b 逐行合并到一个文件中例如 text file a a n b n c text fi
无法在 python 3.8 上将带有 webapp 的 python 部署到 azure

我正在尝试使用部署一个测试项目Flask使用以下方法将框架迁移到 Azure 云中Azure CLI https learn microsoft com en us azure app service containers quicksta
如何使用 Keras ImageDataGenerator 预测单个图像？

我已经训练 CNN 对图像进行 3 类分类在训练模型时我使用 keras 的 ImageDataGenerator 类对图像应用预处理功能并重新缩放它现在我的网络在测试集上训练得非常准确但我不知道如何在单图像预测上应用预处理功能如
处理大文件的最快方法？

我有多个 3 GB 制表符分隔文件每个文件中有 2000 万行所有行都必须独立处理任何两行之间没有关系我的问题是什么会更快逐行阅读 with open as infile for line in infile 将文件分块读入内存
Django 模型：如何使用 mixin 类来覆盖 django 模型以实现 save 等功能

我想在每次保存模型之前验证值所以我必须重写保存函数代码几乎是一样的我想把它写在 mixin 类中但失败了我不知道如何写 super func 我英语不好抱歉 class SyncableMixin object def sav
如何为所有用户安装 Anaconda python？

Anaconda python 发行版 https store continuum io cshop anaconda 非常方便地部署科学计算环境 SCE 并根据需要切换python版本默认情况下安装会将 python 定位到 anac
缓存 Flask-登录 user_loader

我有这个 login manager user loader def load user id None return User query get id 在我引入 Flask Principal 之前它运行得很好 identity loa

随机推荐

用gson解析Json返回null对象

我正在通过 gson 解析 Json 字符串这是 Json 字符串 ID 1 Name Australia Active true ID 3 Name Kiev Active true ID 4 Name South Africa Act
构造一个从字节数组读取的 java.io.File

我正在使用需要 java io File 作为输入的 API 但我只想向 API 发送一个字节数组有没有办法创建一个从我的字节数组而不是从磁盘读取的 File 对象 A File不读任何内容它代表操作系统中的文件或目录对象或虚拟文
让 UiViewController 保持纵向模式 iOS6 VS iOS5

我正在为 iOS5 和 iOS6 构建一个应用程序我在 UINavigationController 中有这个 UIViewController 我希望它保持纵向模式该代码适用于 iOS5 但不适用于 iOS6 iOS5 rotatio
关闭 XCode CoreData 模型的 codegen

我自己在 XCode 中使用已声明的类制作 CoreData 模型编译器代码为我生成了重复项如何摆脱它在数据模型编辑器中将右侧数据模型检查器中的 Codegen 选项更改为手动无遗憾的是据我所知您必须分别为每个实体执行此操
将数组值添加到 MongoDB 中，其中元素不在数组中

在 MongoDB 中这是我的简化结构account文档 id ObjectId 5a70a60ca7fbc476caea5e59 templates name Password Reset content AAAAAAAA name W
在python中将ndjson转换为json

我需要在 python 中将 ndjson 对象转换为 json 我看到 pypi org 中有一个库但我无法使用它这是 ndjson 0 3 1 license mit count 1551711 license apache 2 0
捕获 C# 表单上的关闭事件

嘿我并不是想在这里碰碰运气但我还有另一个 c 问题我已经尝试了使用谷歌找到的所有可能的事件这是代码 private void Form1 OnClose MessageBox Show I was closed 2 private
使用 Action-Cable 的 Ruby-on-Rails 应用程序在开发中运行，但在生产模式中失败

当从 GPS 接收器收到消息时我的 RoR 应用程序使用 Action Cable 更新页面这在开发模式下工作得很好但在生产模式下浏览器不会收到页面更新顺便说一句这是在 Docker 容器中运行的浏览器出现 404 错误 Err
vCard .vcf 文件下载浏览器支持 - godaddy [关闭]

Closed 这个问题需要细节或清晰度目前不接受答案我在网站上有一个下载 vCard vcf 链接它可以在本地运行但不能在线运行只需在浏览器中打开文件而无需下载我宁愿不用压缩它仔细阅读后发现我需要这样写 AddType tex
如何增加 ASP.NET 中的最大上传文件大小？

我有一个接受 ASP NET 中文件上传的表单我需要将最大上传大小增加到默认值 4 MB 以上我发现在某些地方引用了以下代码msdn ConfigurationPropertyAttribute maxRequestLength Def
Powershell - 仅打印引号之间的文本？

如何让以下文本的输出仅显示引号中的文本不带引号示例文本 this is an apple it is red this is an orange it is orange this is an blood orange it is re
如何使用 LINQ 在集合中选择集合？

我有以下结构 public class ToolSettings public string Extension get set public ObservableCollection
如何检测 Latin1 编码列中的 UTF-8 字符 - MySQL

我即将承担将数据库从 Latin1 转换为 UTF 8 的繁琐且充满陷阱的任务此时我只想检查表中存储的数据类型因为这将确定我应该使用什么方法来转换数据具体来说我想检查 Latin1 列中是否有 UTF 8 字符最好的方法是什么
this._callback.apply 不是一个函数！ Node.js Mysql错误

控制器代码 app post savedata function req res var cope req body console log On server side console log cope Client ID var que
在java中以300dpi打印到硬打印机

好吧我刚刚开始编写一个应该打印出图形的程序我的几乎与位于此处的 Oracle 受版权保护的一模一样http docs oracle com javase tutorial 2d printing examples HelloWorldP
WooCommerce 3 中的条件产品价格购物车问题

我修改了一个函数来为我的一些会员创建自定义价格即正常价格为 1 美元但如果您是铜牌会员则为 2 美元银牌会员为 3 美元依此类推价格在商店和单品页面上发生变化但是当产品添加到购物车时价格将恢复为原始金额我是否应该添加额外
以非 root 用户身份运行厨师客户端

我想在我的 Linux 机器上以测试用户身份运行 Chef client 为此我在 client rb 文件中添加了来自 etc chef client rb 的缓存路径 cache path chef cache 然后我从测试用户非r
如何使用 Laravel Sanctum 和 React 修复 401 Unauthorized 错误？

我有以下设置 Laravel 与 Homestead 一起运行 Domain laravel api test指向我的 Homestead 环境使用自定义主机在本地运行 React npx create react app app lar
从顺序很重要的未排序的 2D 点数组中插值轨迹

我需要一种从 Nx2 点数组获取 Lx2 轨迹的方法即将这些点连接成单个轨迹的方法例如从 5x2 点数组创建 10000x2 点数组我尝试过使用interp1 and interp2但要么我不完全理解他们要么他们没有做我需要的事情
Pandas 重新索引以填充缺失的日期，还是更好的填充方法？

我的数据是工厂的缺勤记录有些日子没有缺勤因此没有记录当天的数据或日期然而与所示的其他示例相比这变得很棘手在任何一天都可能由于各种原因而出现多次缺勤数据中的日期与记录的比率并不总是 1 1 我希望的结果是这样的 index S

Pandas 重新索引以填充缺失的日期，还是更好的填充方法？

Pandas 重新索引以填充缺失的日期，还是更好的填充方法？ 的相关文章

随机推荐

热门标签

Pandas 重新索引以填充缺失的日期，还是更好的填充方法？的相关文章