read_excel（来自 readxl 包）将 1899-12-30 之前的日期读取为 NA，如何解决此问题？

2024-04-06

我有一个包含 130 场足球比赛的数据集，这些比赛的历史可以追溯到 1893 年。

当我从 Excel 导入数据集时，1900 年的日期与 R (RStudio) 中应有的日期相同。但是，1900 年之前的日期以 NA 形式出现。

我该如何解决这个问题，以便所有日期都以正确的格式来自 Excel？

或者，如何用正确的 (18XX-MM-DD) 日期替换 NA？

这是 Excel 中显示的数据：

    Home_Team, Away_Team, SUFC, SWFC, H,  A,  Score, Season, Date

Sheffield United, Sheffield Wednesday, 1, 1, 1, 1, 1–1, 1893/94, 1893-10-16

Sheffield United, Sheffield Wednesday, 1, 0, 1, 0, 1–0, 1894/95, 1895-01-12

Sheffield United, Sheffield Wednesday, 1, 1, 1, 1, 1–1, 1895/96, 1895-12-26

Sheffield United, Sheffield Wednesday, 2, 0, 2, 0, 2–0, 1896/97, 1896-12-26

Sheffield United, Sheffield Wednesday, 1, 1, 1, 1, 1–1, 1897/98, 1897-12-27

Sheffield United, Sheffield Wednesday, 2, 1, 2, 1, 2–1, 1898/99, 1898-12-26

Sheffield United, Sheffield Wednesday, 1, 0, 1, 0, 1–0, 1900/01, 1900-12-15

Sheffield United, Sheffield Wednesday, 3, 0, 3, 0, 3–0, 1901/02, 1902-03-01

Sheffield United, Sheffield Wednesday, 2, 3, 2, 3, 2–3, 1902/03, 1902-09-01

Sheffield United, Sheffield Wednesday, 1, 1, 1, 1, 1–1, 1903/04, 1903-12-12

Sheffield United, Sheffield Wednesday, 4, 2, 4, 2, 4–2, 1904/05, 1905-04-08

Sheffield United, Sheffield Wednesday, 0, 2, 0, 2, 0–2, 1905/06, 1905-10-21

这是我应用到它的 R 代码：

library(tidyverse)
library(readxl)
library(magrittr)
library(dplyr)
library(ggplot2)
library(tidyr)

Sheff_derby_R <- read_excel("sheffield_derby/Sheff_derby_R.xlsx", 
                        col_types = c("text", "text", "text", 
                                      "text", "text", "text", "text", 
                                       "text", 
                                      "date", "text", "numeric", "numeric", 
                                      "numeric", "numeric", "numeric", 
                                      "numeric", "numeric", "numeric", 
                                      "numeric", "numeric", "numeric", 
                                      "numeric", "numeric", "numeric", 
                                      "numeric", "numeric", "numeric", 
                                      "numeric", "numeric", "numeric", 
                                      "numeric", "numeric", "numeric", 
                                      "numeric", "numeric", "numeric", 
                                      "numeric", "numeric", "numeric", 
                                      "numeric", "numeric", "numeric", 
                                      "numeric", "numeric", "numeric", 
                                      "numeric", "numeric", "numeric", 
                                      "numeric", "numeric", "numeric", 
                                      "numeric", "text"))
 View(Sheff_derby_R)

在 R 中，18xx 日期（最后一栏，不是 18xx/xx 季节栏）被 NA 替换。这是头部，前 12 行：

    Home_Team Away_Team SUFC  SWFC  H     A     Score Season Date                
   <chr>     <chr>     <chr> <chr> <chr> <chr> <chr> <chr>  <dttm>              
 1 Sheffiel~ Sheffiel~ 1     1     1     1     1 – 1 1893/~ NA                  
 2 Sheffiel~ Sheffiel~ 1     0     1     0     1 – 0 1894/~ NA                  
 3 Sheffiel~ Sheffiel~ 1     1     1     1     1 – 1 1895/~ NA                  
 4 Sheffiel~ Sheffiel~ 2     0     2     0     2 – 0 1896/~ NA                  
 5 Sheffiel~ Sheffiel~ 1     1     1     1     1 – 1 1897/~ NA                  
 6 Sheffiel~ Sheffiel~ 2     1     2     1     2 – 1 1898/~ NA                  
 7 Sheffiel~ Sheffiel~ 1     0     1     0     1 – 0 1900/~ 1900-12-15 00:00:00 
 8 Sheffiel~ Sheffiel~ 3     0     3     0     3 – 0 1901/~ 1902-03-01 00:00:00 
 9 Sheffiel~ Sheffiel~ 2     3     2     3     2 – 3 1902/~ 1902-09-01 00:00:00 
10 Sheffiel~ Sheffiel~ 1     1     1     1     1 – 1 1903/~ 1903-12-12 00:00:00 
11 Sheffiel~ Sheffiel~ 4     2     4     2     4 – 2 1904/~ 1905-04-08 00:00:00 
12 Sheffiel~ Sheffiel~ 0     2     0     2     0 – 2 1905/~ 1905-10-21 00:00:00

无论存在什么错误，这里都有一个可能的（临时）解决方法：

首先，读入为"text"看看 R 有点窒息的原因之一。（我过于简单化了read_excel这里的争论，因为"text"是它的默认值Date在这种情况下。在你的情况下，只需更新"date" to "text"在你的向量中col_types.)

library(readxl)
x <- read_excel("Sheff_derby_SO.xlsx")
x$Date
#  [1] "1893-10-16" "1895-01-12" "1895-12-26" "1896-12-26" "1897-12-27"
#  [6] "1898-12-26" "350"        "791"        "975"        "1442"      
# [11] "1925"

对于 1900 年及之后的日期，它们将作为整数传递。它们都恰好基于相同的日期来源，因此作为黑客我们可以这样做：

wrong <- !grepl("-", x$Date)
as.Date("1900-01-01") + as.integer(x$Date[wrong]) - 2L
# [1] "1900-12-15" "1902-03-01" "1902-09-01" "1903-12-12" "1905-04-08"

这与 excel 告诉我的相符thinks他们应该是。

注意：我原以为这是一个简单的偏移，但是+ 2L需要使其对齐。这表明可能还有其他事情正在发生，所以please使用您的所有数据（如果这不是全部数据）验证此技巧是否适用于其他值。

在数据集中替换它们就像

sav <- as.Date("1900-01-01") + as.integer(x$Date[wrong]) - 2L
x$Date <- as.Date(x$Date) # 'wrong' ones will be NA
x$Date[wrong] <- sav
x$Date
#  [1] "1893-10-16" "1895-01-12" "1895-12-26" "1896-12-26" "1897-12-27"
#  [6] "1898-12-26" "1900-12-15" "1902-03-01" "1902-09-01" "1903-12-12"
# [11] "1905-04-08"

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

read_excel（来自 readxl 包）将 1899-12-30 之前的日期读取为 NA，如何解决此问题？的相关文章

R 多元一步预测和准确性

我想使用 R 来比较两个预测模型的 RMSE 均方根误差第一个模型使用 1966 年至 2000 年的估计值来预测 2001 年然后使用 1966 年至 2001 年的估计值来预测 2002 年依此类推直至 2015 年第二个模型使
使用 pkg:sjPlot 函数创建一个生成部分斜体单元格的数据框

我正在尝试创建一个简单的数据表其中 Coral taxon 列中的属名称为斜体而 spp 列中的属名称为斜体属名后面的部分不大写我尝试使用 expression 函数对 Coral taxon 的每一行进行编码但没有成功 sum
更快的 %in% 运算符

The 快速匹配 https cran r project org web packages fastmatch index html包实现了更快的版本match对于重复匹配例如在循环中 set seed 1 library fastma
排序因素与水平

有人能解释一下 R 中 ordered 参数的用途吗 R says ordered逻辑标志来确定级别是否应被视为有序按给定的顺序所以如果我有一个名为名称的因素并设置ordered TRUE names lt factor c fred
按特定样本前缀对列名称向量进行子集化

假设我有一个如下所示的数据框 ca01 lt c 1 10 ca02 lt c 2 11 ca03 lt c 3 12 stuff 1 lt rep test 10 other lt rep 9 10 data lt data frame
ubuntu中R的igraph包的安装

我使用以下命令在 ubuntu 中安装 R 的 igraph 包 install packages igraph 但我收到一条错误消息警告无法访问存储库的索引 http ftp iitm ac in cran src contrib h
删除字符串末尾的句点和数字

如何删除尾随句点后面紧跟一个数字长度为一位或两位数字例子 z lt c awe p 56 red 45 ted 5 you 88 tom 我只想删除 45和 5 你只需要一个简单的正则表达式 z new gsub 0 9 z 一些评论
R 中按时间划分的平均值

我每秒测量一次化合物浓度我想求 30 秒和 60 秒的平均值我一直在阅读这里的帖子我尝试过lubridate and dplyr 但没有运气我正在努力完成这项工作但我一直没能做到我正在从 SAS 过渡到 R 所以请耐心等待这是
R 将多个值与向量进行比较并返回向量[重复]

这个问题在这里已经有答案了我有一个向量 A 对于 A 的每个元素我想检查它是否等于第二个向量 Targets 中的任何元素我想要一个逻辑值向量其长度为 A 作为返回也提到了同样的问题here http r 789695 n4 na
dplyr 返回每个组的全局平均值，而不是每个组的平均值

有人可以解释一下我在这里做错了什么 library dplyr temp lt data frame a c 1 2 3 1 2 3 1 2 3 b c 1 2 3 1 2 3 1 2 3 temp gt group by temp 1 g
获取函数的命名空间

我正在开发一个包我希望在其中向对象添加编辑历史记录该包允许其他包注册用于编辑对象的函数我正在寻找一种方法来记录注册用于编辑的函数的包的版本问题是给定一个函数如何从导出的位置获取包我的想法是调查它的搜索路径但是search 仅
如何添加链接以从我的 R闪亮应用程序在新窗口中打开 pdf 文件？

我可以使用 a 从我的 Shiny 应用程序添加到外部站点的超链接 a google href http www google com 但如何创建一个链接来打开 pdf 或类似文件看起来应该很简单但我找不到任何例子我的问题与此类似
randomForest 包在删除一个预测类时的奇怪行为

我正在运行一个随机森林模型它产生的结果从统计角度来看对我来说完全没有意义因此我确信有些东西mustrandomForest 包的代码出现错误至少在模型的本次迭代中预测左侧变量是具有 3 种可能结果的政党 ID 民主党独立党共和
R 可以创建带有可单击条形图的条形图图像以插入网页吗？

我知道如何创建条形图以及如何将其粘贴在网页上例如使用hwriteImage in the 作家包 http www embl de gpau hwriter 我想要的是每个栏都是一个在鼠标悬停时突出显示的区域并且每个栏在单击时都有不
Quantmod 的简单功能不再起作用

我明天要交论文我收到了一条关于 quantmod 的非常奇怪的错误消息这是我在过去几周使用这个包时从未遇到过的我无法导入特定于道琼斯指数 DJI 的数据我收到以下错误消息 getSymbols DJI src yahoo from
purrr::可能函数可能无法与map2_chr函数一起使用

我怀疑这是 purrr 包中的错误但想先在 StackOverflow 中检查我的逻辑在我看来 possibly功能在内部不起作用map2 chr功能我正在使用 purrr 版本 0 2 5 考虑这个例子 library dplyr
R 中两个时间戳之间的左连接

我的目标是执行左连接intervals哪里的bike id比赛和created at时间戳在records在之间start and end in the intervals table gt class records 1 data ta
需要在R中按行绑定列表数据

我在 R 中按行绑定列表时遇到问题我的列表数据集是 id 1 data k 1 id k b c 1 1 1 3 data k 2 id k b c 1 2 1 4 id 2 data k 1 id k b c 2 1 1 6 data
如何在 data.table 中分组后使用条件计算行数

我有以下数据框 dat lt read csv s1 s2 v1 v2 a b 10 20 a b 22 NA a b 13 33 c d 3 NA c d 4 5 NA c d 10 20 dat gt A tibble 6 x 4 gt
在R中循环子文件夹

我正在 R 环境中包含多个子文件夹的文件夹中工作我想要循环遍历多个子文件夹然后在每个子文件夹中调用 R 脚本来执行我想出了下面的代码但我的代码似乎添加了到子文件夹列表我收到错误文件中的错误文件名 r 编码编码无效的描述

随机推荐

对选定的文本使用replaceText()，而不是对Google 文档的整个元素使用replaceText()

我该如何使用replaceText 要替换元素的选定区域中的单词以下代码将替换整个元素而不是选定区域中的匹配项有什么想法可以解决这个问题吗我知道我可以使用isPartial 分离部分选择但无法弄清楚如何替换所选文本 function
不知道如何使用 ms-appx (wp8) 引用我的项目中的文件

我想引用我的项目中的语法文件 Rootfile gt 名为 Grammar 的文件夹 gt 名为 NumbersGrammar 的文件我使用了这行代码但它告诉我 0x80070002 错误系统找不到指定的文件 Uri Numbers
关闭时 Boost Log 中的 Boost 线程访问冲突

我有一个使用增强日志记录的应用程序在关闭期间它会因空指针访问而发生访问冲突当我单步执行代码直至失败时似乎 boost log dll 正在被解除分配然后 boost thread 代码尝试访问曾经被 log dll 占用的内存我
错误：无法为 python-ldap 构建轮子，这是安装基于 pyproject.toml 的项目所必需的

我在 Ubuntu 20 04 上的 Python 虚拟环境中安装 Odoo 15 我从官方 GitHub 存储库下载了 Odoo 并使用 Nginx 作为反向代理按照文档在 ubuntu 22 04 中安装和设置 odoo 后我确实遵
为什么 Java 终结器存在安全问题？

我正在阅读有效的 Java 作者 Joshua Bloch https www amazon com au Effective Java Joshua Bloch dp 0134685997 In 第 8 项避免定型剂和清洁剂 of 第2
Chaco MultiLinePlot - 无法显示简单的绘图，想知道包是否损坏？

我正在尝试创建一个多线图来显示 2D NumPy 数组中的多个时间序列数据电压我开始非常简单地尝试用 2x10 数组中的 10 个数据点绘制两条线但我什至无法在没有获得大量我无法调试的错误输出的情况下使其工作 Imports impo
使用 MongoDB 官方 C# 驱动程序进行按位枚举（标志）查询

当我尝试运行以下形式的 LINQ 查询时 MongoCollection
CKEditor 新实例始终卸载

我在 Angular 应用程序中使用 CKEditor 并且有一个视图每次用户访问新模型时都会重新加载我的 CKEditor 实例我使用以下 JS 来初始化编辑器 var initEditor function js editor wr
在 Postgres 函数中使用参数作为列名

我有一个带有以下形式的 Postgres 表 CREATE TABLE public days id integer NOT NULL day character varying 9 NOT NULL visits bigint NOT N
异常值：找不到 libmagic。检查您在 Windows 7 中的安装

当我尝试打开 django 管理面板时显示此错误 ImportError at admin failed to find libmagic Check your installation Request Method GET Reques
使用 C 中的宏初始化未知大小的二维数组

我正在开发一个小型宏项目该项目要求我将二维数组文字传递给我的宏之一如下所示 myMacro 0 1 2 2 1 0 不必将数组文字的大小传递给宏有没有办法将其扩展为以下内容 int 2 3 0 1 2 2 1 0 或等效的东西任何保
Numpy where 和除以零

我需要计算x通过以下方式旧代码 x numpy where b 0 a 1 b 我想它在python 2 x questions tagged python 2 x 就像在一个python 2 7 questions tagged pyt
如何在自定义 CMS 中嵌入或重新创建 Google Analytics 图表

我想知道如何使用 Google Analytics 创建图表也许使用 api 但我不确定是否已经有插件或教程介绍如何执行此操作 Google com 上的 Javascript API 参考很糟糕另外任何有关如何创建折线图画布元素
了解 Python 位运算符、算术运算符和布尔运算符

我是Python新手无法理解这一点有人可以帮我分解一下这个陈述吗 n 和奇偶校验都是整数 n parity n 1 表达式计算为n parity n 1 结果是 n 1 is a bitmask 它掩盖了整数n直至最低有效位如果n是奇
Java - Google App Engine - 当我更改存储在会话范围中的类时出现 InvalidClassException

我更新了我的 User 类现在每当在其会话范围中存储了旧版本 User 类的人访问我的网站时我都会收到InvalidClassException javax servlet ServletException java lang Runt
ApplicationBar 始终为 NULL

我有以下 XAML 代码
Random.nextFloat 不适用于浮点数？

float minX 50 0f float maxX 100 0f Random rand new Random float finalX rand nextFloat maxX minX 1 0f minX Random 类型中的 ne
使用dimplejs创建组合条形图/折线图并使用自定义颜色

我正在尝试使用 dimplejs 创建基于简单数据集列国家 index1 index2 index3 的组合条形图折线图 Index1 将是条形图 index2 向上应动态根据用户交互添加和删除索引在顶部显示为折线图我发现我似乎
如何向 Stripe 客户申请优惠券

我找不到任何方法将优惠券折扣应用于重复付款的现有客户我正在使用stripe宝石我继续在 Stripe 仪表板上创建了优惠券我在他们的 API 页面上没有看到如何添加优惠券我已经尝试过下面的解决方案但没有成功 cu Stripe
read_excel（来自 readxl 包）将 1899-12-30 之前的日期读取为 NA，如何解决此问题？

我有一个包含 130 场足球比赛的数据集这些比赛的历史可以追溯到 1893 年当我从 Excel 导入数据集时 1900 年的日期与 R RStudio 中应有的日期相同但是 1900 年之前的日期以 NA 形式出现我该如何解决这个

read_excel（来自 readxl 包）将 1899-12-30 之前的日期读取为 NA，如何解决此问题？

read_excel（来自 readxl 包）将 1899-12-30 之前的日期读取为 NA，如何解决此问题？ 的相关文章

随机推荐

热门标签

read_excel（来自 readxl 包）将 1899-12-30 之前的日期读取为 NA，如何解决此问题？的相关文章