R 编码:如何保存 4 个完整季度的数据记录

2023-12-05

我有一个包含公司季度数据的数据框,并且有这个问题:

如何只保留那些拥有 4 个季度数据的公司的记录(因为公司有时会出现 1、2 或 3 个季度的数据,但我需要在整个数据框架中为每个公司保留 4 个完整的季度)

我在下面包含了示例 R 代码:

company<-c("xray", "xray", "xray",  "xray", "foxrot", "foxrot", "delta", "kilo", "kilo", "kilo", "kilo", "kilo", "kilo" )  

year <-c("1984","1984","1984","1984", "1985", "1985","1986", "1987","1988","1989","1989","1989","1989" )

qtr <-c("1","2","3","4", "1", "2","3", "4","1", "1","2","3","4")

IQ <- rnorm(13,0,10)  
REVQ <- rnorm(13,0,10)  
AssetQ <- rnorm(13,0,10)  
CashQ  <- rnorm(13,0,10)  

#Show dataframe  
data<-data.frame( year, qtr, company, IQ, REVQ, AssetQ, CashQ )

在此示例中,1984 年的“xray”和 1989 年的“kilo”应该是新数据框中仅保留的公司。此示例的独特之处在于,您会注意到季度序列 1-2-3-4 出现了三次,但其中只有两个序列是好的,因为另一个序列(位于第 5-8 行)是随机出现的。为了使清理工作有意义,每个序列 1-2-3-4 需要分配给同一年份和同一公司。

这种情况使任务相当棘手(至少对我自己来说),我已经尝试了近一天,搜索网络并尝试不同的方法,但似乎没有任何方法可以正常工作。

因此,我真诚地寻求帮助。

谢谢你~M


这是可以帮助您的代码:

library(data.table)
data<-data.table( year, qtr, company, IQ, REVQ, AssetQ, CashQ)
fullyr <- data[,.(len=.N),by=.(year)][len == 4]
data <- data[year %in% fullyr$year]

要求您下次提供您尝试过的解决方案的代码:)

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

R 编码:如何保存 4 个完整季度的数据记录 的相关文章

  • 将强化的 data.frame 转换回 sf 对象

    五十斯塔特包提供了一张很棒的美国地图 其中有夏威夷和阿拉斯加 如下图所示 对象五十 州已经得到加强 可以与 ggplot2 一起使用 但是 我想使用 geom sf 将其绘制为 sf 对象 作为一个更普遍的问题 将强化的 data fram
  • 零膨胀泊松分布的经验和理论分布图

    以下是我正在研究的一种数据集 data lt c 0 1 0 11 2 0 3 0 0 2 1 3 1 0 1 0 0 0 2 3 0 0 0 8 1 1 1 0 1 1 2 7 0 0 0 5 2 3 6 1 1 5 2 9 0 0 1
  • 如何在不指定数据集的情况下调整函数

    我有一个函数 基本上可以过滤SPV行 如下所示 请注意 我这样做return coef lt function df1 idd dmda CategoryChosse 然而 我不希望df1作为函数的参数 而是函数的属性df1数据集 在本例中
  • 在 R 中使用两个 for 循环创建矩阵/数据框

    这是我在 SO 上的第一篇文章 所以请友善 我的问题与这个问题隐约相关 R中的双for循环创建矩阵 https stackoverflow com questions 44376020 double for loop in r creati
  • 如何找到对象的创建位置?

    我目前正在努力改进对其他脚本有不同调用的代码 我想知道在哪里创建对象 对于其中一些人来说 只需使用文本编辑器的搜索选项即可 只要看看是否obj lt or obj 有什么结果 但这不适用于使用assign功能 在加载的脚本中创建的也不是 T
  • lme4:如何指定 2 个与随机截距的相关性,而不添加随机斜率之间的相关性

    重新发布自stats stackexchange com https stats stackexchange com q 195385 33560 我试图在 R 的 lme4 包中指定一个模型 其中随机截距和随机斜率之间有 2 个相关性 但
  • 数据集子集的回归

    我想做以下事情并需要一些帮助 分别计算 身高 与 年龄 的斜率和截距 lm Height Age 一 每个人 二 性别 并创建一个包含结果 斜率和截距 的表 我可以使用 申请 吗 在下一步中 我想做一个统计测试 以确定性别之间的斜率和截距是
  • 使用 geom_bar 和 stat="identity" 绘制平均值的 hline

    我有一个条形图 其中确切的条形高度位于数据框中 df lt data frame x LETTERS 1 6 y c 1 6 1 6 1 g rep x c a b each 6 ggplot df aes x x y y fill g g
  • 什么是 data.frame 可以做而 data.table 不能做的事情?

    我刚刚开始使用 R 并遇到了 data table 我发现它很棒 一个非常天真的问题 我可以忽略 data frame 来使用 data table 以避免两个包之间的语法混淆吗 来自数据表常见问题解答 http datatable r f
  • 不同的分位数:箱线图与小提琴图

    require ggplot2 require cowplot d iris ggplot2 ggplot d aes factor 0 Sepal Length geom violin fill black alpha 0 2 draw
  • R 中的 For 循环分配给数据框

    运行 for 循环后 我在分配给数据帧时遇到问题 当我使用 print 时 它给出了我的价值 有什么解释吗 salesdate lt rep seq from as Date 2013 12 19 to as Date 2013 12 23
  • 没有垂直线的直方图

    当我创建直方图时 它看起来很像这样 set seed 1 x lt 1 100 y lt x rnorm 50 y round y hist y Is there a way to make a histogram look a bit l
  • R Plotly 禁用图例单击和图例双击

    我想使用 R Plotly 从服务器端禁用绘图图例选择 我们看here https community plot ly t disable legend click functionality hiding traces 1345 2可以使
  • R:使用 as.formula 修复模型中的模型调用

    我有一个gls模型 其中我将公式 来自另一个对象 分配给模型 equation lt as formula aic obj row model gt equation temp avg I year 1950 mod1 lt gls equ
  • R 中整数向量的大小

    我原以为 R 有一个用于存储对象的标准开销 看起来是 24 字节 至少对于整数向量而言 但一个简单的测试表明它比我意识到的要复杂 例如 采用长度为 100 的整数向量 使用随机采样 希望避免任何可能存在的偷偷摸摸的序列压缩技巧 https
  • 将英寸高度的字符向量转换为厘米?

    我得到一个字符向量 tibble H c 6 2 5 10 5 5 5 1 5 5 5 4 我想将其转换为厘米 请告知我该怎么做 有几种方法可以使用 1 阅读与fread粘贴到单个字符串后 library data table fread
  • 整理包中的字段说明

    我很抱歉 因为我知道这个答案可能出现在编写 R 包的手册中 但在我阅读和查看其他包的整理字段时 我无法 100 弄清楚该字段的用途 用简单的语言 我的是英语 来看 包的描述文件中的整理字段有什么作用 人们想在那里放什么 我认为这来自于某个时
  • 在R中提取其他两个字符串之间的字符串

    我试图找到一种简单的方法来提取出现在两个已知子字符串之间的未知子字符串 可以是任何内容 例如 我有一个字符串 a lt anything goes here STR1 GET ME STR2 anything goes here 我需要提取
  • 生成与现有变量具有预定义相关性的二进制变量

    对于模拟研究 我想生成一组随机变量 连续变量和二元变量 这些变量与已经存在的变量具有预定义的关联binary变量 此处表示为x 对于这篇文章 假设x是按照下面的代码生成的 但请记住 在现实生活中 x是一个已经存在的变量 set seed 1
  • 如何解决 R 估计中的整数溢出错误

    我正在尝试使用估计模型speedglm在 R 中 数据集很大 约 6988 万行和 38 列 行数和列数相乘得到约 27 亿 超出了整数限制 我无法提供数据 但以下示例重现了该问题 library speedglm large exampl

随机推荐

  • 以编程方式在scale_fill_manual ggplot调用中指定颜色

    我想根据特定列中给出的值对 ggplot2 分面图的背景进行着色 利用我之前提出的问题的答案 我能够将我需要的东西拼凑在一起 joran 的回答this问题特别有用 因为它说明了创建单独的数据框以传递给 ggplot 的技术 This al
  • MySQL Group by - 获取计数为零的列

    我尝试谴责其他答案 但没有运气 因此提出了要求 我有一张桌子 还有几张与其他年份类似的桌子 这是表结构 STATUS Year Company Name Certified 2010 Google Cert Denied 2010 Goog
  • 预期第一层具有 x 尺寸,但得到形状为 y 的数组

    我刚刚在节点上启动tensorflow js 我一直在网上上下搜索答案 混乱我有来自的图像数据image1 tf fromPixels img 我尝试将其与其他图像数据一起输入xs tf tensor image1 image2 困惑在于无
  • 获取请求IP的正确方法是什么[重复]

    这个问题在这里已经有答案了 我发现了一些在 servlet 中获取 ip 的不同方法 但我不知道哪一个是正确的以及为什么 1 request getHeader X Real IP 2 String ip request getHeader
  • BETWEEN 查询返回零或一

    我有这样的疑问 SELECT fecha BETWEEN 1390950000 AND 1391126400 GROUP CONCAT CONCAT WS idItem nombreItem cantidad diferencia ORDE
  • mod_rewrite:从 URL 中删除查询字符串?

    我正在尝试使用 htaccess 进行以下重定向 301 page 1 重定向到 其中 是通配符 基本上 我只是想阻止任何人访问 URL 末尾带有 page 1 的页面 而是将他们定向到相同的 url 减去 page 1 有没有快速的方法来
  • 如何在单页网站的导航中实现活动状态

    我正在开发一个一页网站 在这个网站中 我希望在导航栏中的活动部分或 页面 带有下划线 目前 我点击链接后会显示带下划线的链接 但是 当我单击转到另一个活动 页面 时 它仍然带有下划线 以下是在 HTML 中设置导航的方式 div class
  • 有没有办法将 @mention 插入到使用 pyfacebook 发布的 Facebook 状态更新中?

    我的应用程序中有一些如下代码 message Hi John Doe postID fb stream publish message loader render to string wall post phtml message mess
  • /dev 与 /exec 文档和错误处理

    让我们从没有太多文档的事实开始 dev vs exec端点 如果你有一些我找不到的有价值的信息 我非常乐意看到它 没有讽刺 据我所知 dev 是当前的编辑版本 exec 是脚本的最后发布版本 或者如果您选择旧版本 这告诉我 我应该能够编辑我
  • 如何让 Z3 返回最小模型?

    如果我给 Z3 一个像 p 这样的公式q 我希望 Z3 返回 p true q dont care 或者 p 和 q 切换 但它似乎坚持为 p 和 q 赋值 即使我没有完成转换 通话时亮起Eval 除了对此感到惊讶之外 我的问题是如果 p
  • 如何扩展或重写 CakePHP 核心助手的功能/方法

    This Cakephp 覆盖 HtmlHelper link问了一个非常相似的问题 但没有完整的答案 也许现在 随着 蛋糕2 的推出 就会有 我想创建一个自定义助手 它是 Cake 的 Paginator Helper 的子类 我希望我的
  • iPhone sdk - 使用自定义相机

    我正在开发一个需要连续拍摄两张照片的应用程序 我目前正在使用 iPhone 相机 但是 我不想取消 左下角的按钮 我不想预览我的照片 蓝色 按钮 使用 我应该怎么办 我应该自己制作相机吗 我找不到只有 拍照 按钮的自定义相机的简单教程 创建
  • Elasticsearch 数据二进制文件内存不足

    我尝试将 800GB 文件上传到 Elasticsearch 但我不断收到内存错误 告诉我数据二进制文件内存不足 我的系统有 64GB RAM 和 3TB 存储空间 curl XPOST http localhost 9200 carrie
  • 在 UWP 中保存图像时访问被拒绝。访问被拒绝。 (HRESULT 异常:0x80070005 (E_ACCESSDENIED))

    我正在 Windows 10 SDK 上开发通用 Windows 应用程序 以在图像中识别的面部上绘制矩形 我正在使用Win2D编辑图片并在其上绘制矩形 我可以从图片库中读取文件 但是当我尝试在编辑后保存图像时 会出现以下错误 访问被拒绝
  • 较低的喜欢与iLIKE

    以下两个查询组件的性能比较如何 较低的喜欢 LOWER description LIKE abcde iLIKE description iLIKE abcde 答案取决于许多因素 例如 Postgres 版本 编码和区域设置 LC COL
  • 使用 Django 进行 CSRF,使用 Axios 进行 React+Redux

    这是一个教育项目 不用于生产 我并不打算让用户登录作为其中的一部分 我可以在没有用户登录的情况下使用 CSRF 令牌对 Django 进行 POST 调用吗 我可以在不使用 jQuery 的情况下完成此操作吗 我在这里超出了我的深度 并且肯
  • Android - FEATURE_NO_TITLE 不起作用

    我试图通过布局显示我的关于我们页面 所以我不需要任何标题栏 我试过 Dialog d new Dialog this d setContentView R layout about us d setCanceledOnTouchOutsid
  • 使用 Grunt grunt-contrib-less) 在 Visual Studio 2013 中编译 Bootstrap 3.1 LESS

    我在 Visual Studio 2013 中使用以下内容作为预构建事件 根据以下内容编译 Bootstrap 3 0 这个答案它起作用了 recess ProjectDir Content bootstrap bootstrap less
  • 本季度平均销售额与上一季度平均销售额的比较

    我有一张表 其中有各种属性 例如区域产品 年份 季度 月份 销售 我必须计算具有相同区域的每个产品的 avg qtr 销售并显示其之前的 avg qtr 销售 我已阅读有关滞后的信息 但在这里无法使用 因为它在重复多少行后不固定 我的表结构
  • R 编码:如何保存 4 个完整季度的数据记录

    我有一个包含公司季度数据的数据框 并且有这个问题 如何只保留那些拥有 4 个季度数据的公司的记录 因为公司有时会出现 1 2 或 3 个季度的数据 但我需要在整个数据框架中为每个公司保留 4 个完整的季度 我在下面包含了示例 R 代码 co