如何在非零价格行之前重复数据框中价格为 0 的行？

2023-12-10

我有一个数据

   WEEK PRICE QUANTITY SALE_PRICE
   4992  3.49 1908.750       0.00
   4999  2.50 5681.000       2.50
   5001  3.00 3187.000       3.00
   5002  3.49 1455.000       0.00
   5008  2.69 2263.500       2.69
   5011  3.49 1515.500       0.00
   5013  2.69 3297.000       2.69
   5015  3.49 1059.500       0.00
   5023  2.50 6056.000       2.50
   5024  3.00 1954.500       3.00
   5026  3.49 1163.833       0.00
   5037  2.50 6797.000       2.50
   5038  3.00 2109.000       3.00
   5040  2.50 4521.000       2.50
   5041  3.33 2469.000       3.33

我想仅在具有销售价格的行之前不存在销售价格为 0 的行的地方，在非零销售价格之前重复最后观察到的销售价格为 0 的行。输出应如下所示：

  WEEK PRICE QUANTITY SALE_PRICE TYPE
  4992  3.49 1908.750       0.00    3
  4999  2.50 5681.000       2.50    3
  4992  3.49 1908.750       0.00    3
  5001  3.00 3187.000       3.00    3
  5002  3.49 1455.000       0.00    3
  5008  2.69 2263.500       2.69    3
  5011  3.49 1515.500       0.00    3
  5013  2.69 3297.000       2.69    3
  5015  3.49 1059.500       0.00    3
  5023  2.50 6056.000       2.50    3
  5015  3.49 1059.500       0.00    3
  5024  3.00 1954.500       3.00    3
  5026  3.49 1163.833       0.00    3
  5037  2.50 6797.000       2.50    3
  5026  3.49 1163.833       0.00    3
  5038  3.00 2109.000       3.00    3
  5026  3.49 1163.833       0.00    3
  5040  2.50 4521.000       2.50    3
  5026  3.49 1163.833       0.00    3
  5041  3.33 2469.000       3.33    3

Data

structure(list(WEEK = c(4992L, 4999L, 5001L, 5002L, 5008L, 5011L, 
5013L, 5015L, 5023L, 5024L, 5026L, 5037L, 5038L, 5040L, 5041L
), PRICE = c(3.49, 2.5, 3, 3.49, 2.69, 3.49, 2.69, 3.49, 2.5, 
3, 3.49, 2.5, 3, 2.5, 3.33), QUANTITY = c(1908.75, 5681, 3187, 
1455, 2263.5, 1515.5, 3297, 1059.5, 6056, 1954.5, 1163.833, 6797, 
2109, 4521, 2469), SALE_PRICE = c(0, 2.5, 3, 0, 2.69, 0, 2.69, 
0, 2.5, 3, 0, 2.5, 3, 2.5, 3.33)), .Names = c("WEEK", "PRICE", 
"QUANTITY", "SALE_PRICE"), class = "data.frame", row.names = c(NA, 
-15L))

我努力了

 if(nrow(price.hierarchy) > 2) {
  for(i in 2: (nrow(price.hierarchy) - 1)) {
      if(price.hierarchy$SALE_PRICE[i] !=0 & price.hierarchy$SALE_PRICE[i+1] !=0 & price.hierarchy$SALE_PRICE[i-1]==0) {
        price.hierarchy1 <- price.hierarchy[which(price.hierarchy[, 1] > price.hierarchy[i,1]), ]
        price.hierarchy[i+1, ] <- NA 
        price.hierarchy[i+1, ] <- price.hierarchy[i-1, ]
        price.hierarchy2 <- price.hierarchy[which(price.hierarchy[, 1] < price.hierarchy[i+2,1]), ] 
        price.hierarchy <- rbind(price.hierarchy2, price.hierarchy1)        
      }
      else 
        price.hierarchy
    }
  }

这使：

> price.hierarchy
    WEEK PRICE QUANTITY SALE_PRICE
1   4992  3.49 1908.750       0.00
2   4999  2.50 5681.000       2.50
3   4992  3.49 1908.750       0.00
31  5001  3.00 3187.000       3.00
4   5002  3.49 1455.000       0.00
5   5008  2.69 2263.500       2.69
6   5011  3.49 1515.500       0.00
7   5013  2.69 3297.000       2.69
8   5015  3.49 1059.500       0.00
9   5023  2.50 6056.000       2.50
10  5015  3.49 1059.500       0.00
101 5024  3.00 1954.500       3.00
11  5026  3.49 1163.833       0.00
12  5037  2.50 6797.000       2.50
13  5026  3.49 1163.833       0.00
131 5038  3.00 2109.000       3.00
14  5040  2.50 4521.000       2.50
15  5041  3.33 2469.000       3.33

The shift函数来自data.table在这里可能有用。

我想重复之前观察到的最后一行，销售价格为 0 仅在没有销售行的地方非零销售价格价格为 0 的行前有促销价

如果没有更多解释，我不确定后面的要求。这是一个快速解决方案，可以为观察结果提供标识符i出于排序目的，然后复制并附加零销售价格之前的内容。最后，对标识符进行排序，调整为将重复行放置在原始行之后两行。

library(data.table)

setDT(d)
d[, i := seq_len(.N)]
d[, led_zero := shift(SALE_PRICE, type = "lead") == 0]
d_duped = d[(led_zero)][, i := i + 1.5]
d_out = rbind(d, d_duped)
d_out[order(i)]
#     WEEK PRICE QUANTITY SALE_PRICE    i led_zero
#  1: 4992  3.49 1908.750       0.00  1.0    FALSE
#  2: 4999  2.50 5681.000       2.50  2.0    FALSE
#  3: 5001  3.00 3187.000       3.00  3.0     TRUE
#  4: 5002  3.49 1455.000       0.00  4.0    FALSE
#  5: 5001  3.00 3187.000       3.00  4.5     TRUE
#  6: 5008  2.69 2263.500       2.69  5.0     TRUE
#  7: 5011  3.49 1515.500       0.00  6.0    FALSE
#  8: 5008  2.69 2263.500       2.69  6.5     TRUE
#  9: 5013  2.69 3297.000       2.69  7.0     TRUE
# 10: 5015  3.49 1059.500       0.00  8.0    FALSE
# 11: 5013  2.69 3297.000       2.69  8.5     TRUE
# 12: 5023  2.50 6056.000       2.50  9.0    FALSE
# 13: 5024  3.00 1954.500       3.00 10.0     TRUE
# 14: 5026  3.49 1163.833       0.00 11.0    FALSE
# 15: 5024  3.00 1954.500       3.00 11.5     TRUE
# 16: 5037  2.50 6797.000       2.50 12.0    FALSE
# 17: 5038  3.00 2109.000       3.00 13.0    FALSE
# 18: 5040  2.50 4521.000       2.50 14.0    FALSE
# 19: 5041  3.33 2469.000       3.33 15.0       NA

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

如何在非零价格行之前重复数据框中价格为 0 的行？的相关文章

在 R 中绘制决策树（插入符）

我已经训练了一个数据集rf方法例如 ctrl lt trainControl method LGOCV repeats 3 savePred TRUE verboseIter TRUE preProcOptions list thresh
如何在 R 中使用别名运行系统可执行文件？

假设我正在 R 中运行系统命令来运行executable inputfile lt path myfile txt 我该如何更换 path myfile txt在下面的命令中inputfile如下面命令所示 system executabl
rgdax（coinbase）数据未按预期收集数据

我正在尝试使用rgdaxR 包用于下载一些历史价格我设置了 API 密钥等并尝试在过去 24 小时内加载 start lt strftime Sys time Y m dT H M SZ tz UTC end lt strftime S
R中的预测和预测函数之间的区别

两者之间有什么区别吗predict and forecast R 中的函数如果是在哪些具体情况下应该使用它们 Intro predict 适用于多种 R 对象模型基础库的一部分 forecast 对于时间序列预测包的一部分参见示
在 R 中根据时间序列数据制作 3D 曲面

我有一个大型数据集我想从中制作 3D 表面我希望 x 轴为日期 y 轴为时间 24 小时 z 轴高度为我的值我是 R 初学者所以越简单越好 http www quantmod com examples chartSeries3d
spplot 的图例范围和颜色分布问题

我的绘图和图例中的颜色范围是否正确存在问题这是我使用的代码 data ch4 lt read csv2 v42 CH4 1970 TOT txt skip 3 stringsAsFactors FALSE header F num dat
如何很好地注释 ggplot2（手册）

Using ggplot2我通常使用geom text和类似的东西position jitter注释我的情节然而对于一个漂亮的情节我经常发现手动注释是值得的像下面这样 data2 lt structure list type str
如何根据值扩展数据框？ [复制]

这个问题在这里已经有答案了我有以下输入数据框 df lt data frame x c a b c y c 4 5 6 from c 1 2 3 to c 2 4 6 df x y from to 1 a 4 1 2 2 b 5 2 4
直接来自数据的马尔可夫模型图（makovchain 或 deemod 包？）

我想读取一堆因子数据并从中创建一个可以很好地可视化的转换矩阵我发现了一个非常好的软件包称为 heemod 它与 diagram 一起工作得不错对于我的第一个快速而肮脏的方法我运行了一段 Python 代码来获取矩阵然后使用这个 R
R + ggplot2 - 无法分配大小为 128.0 Mb 的向量

我有一个 4 5MB 9 223 136 行的文件其中包含以下信息 0 0 0 0147938 3 67598e 07 0 0226194 7 35196e 07 0 0283794 1 10279e 06 0 033576 1 470
dplyr::mutate 添加多个值

网上有几个与此相关的问题dplyr Github 存储库 https github com hadley dplyr已经并且至少有一个相关的问题但没有一个问题完全涵盖了我的问题我认为在 dplyr mutate 调用中添加多列 ht
如果我有一个包含计数的表格，如何获得直方图/摘要统计数据？ [复制]

这个问题在这里已经有答案了我习惯了像这样的观察向量c 1 1 1 3 4 我可以在上面看到汇总统计数据和绘制直方图等但现在我发现自己拥有相同的数据但采用如下压缩格式 value numObs 1 3 3 1 4 1 当数据以data
如何在 R 中更新和重新编译 nlme 源代码

我正在尝试更新 nlme 包以便我可以在 gls 命令中使用大圆距离进行相关性我正在尝试使用指定的更改来编辑源代码here http r 789695 n4 nabble com nlme spatial autocorrelation
列表列表中出现的频率

我有一个列表列表其中每个列表都已排序我想调查的是某个元素在特定位置出现了多少次例如 pnc 曾两次出现在第二位一次出现在第三位我的数据结构如下 dput degree l list c schwab 0 pnc 0 0344827
如何在双对数图（ggplot2）中添加趋势线？

我需要绘制一个遵循幂律分布的数据向量所以如果我将它们绘制在对数轴上它们将是一条直线但是如果我没有明确提供 y 参数我不知道如何绘制这是代码 library poweRlaw library ggplot2 xmin 1 alph
将 dplyr 中的starts_with与部分列名称的向量一起使用

我想使用 dplyr 选择与字符串向量匹配的某些列 one lt seq 1 10 two lt rnorm 10 three lt runif 10 1 2 four lt 10 1 df lt data frame one two th
R 中自定义函数的等高线图

我正在使用一些自定义函数我需要根据参数的多个值为它们绘制轮廓这是一个示例函数我需要画这样的等高线图任何想法 Thanks 首先你构造一个函数 fourvar它将这四个参数作为参数在这种情况下您可以使用 3 个变量来完成此操作其
R中不重复的组合

我试图获取变量元素长度为 3 的所有可能组合虽然它部分地与combn 一起工作但我没有完全得到我正在寻找的输出这是我的例子 x lt c a b c d e t combn c x x 3 我得到的输出看起来像这样 1 2 3 1 a
将从数据透视表包生成的数据透视表转换为数据帧

我正在尝试制作一个数据透视表pivottabler包裹我想将数据透视表对象转换为数据框以便我可以将其转换为数据表带有 DT 并在 Shiny 应用程序中渲染它以便可以下载 library pivottabler pt qpvt mt
R中的引用调用（使用函数修改对象）

我刚刚接触 R 很惊讶地发现函数不会修改对象至少看起来这是默认的例如我编写了一个函数只是为了在表格中的一个标签上粘贴一个星号它在函数内部工作但表本身没有改变我主要来自Ruby 那么在 R 中使用函数更改对象的正常可接受的方

随机推荐

如何使三根柱子高度相同？

我已经查看了这个问题的十几个问题和答案但似乎没有一个适合我的情况的最佳答案我有一个页面 http awesomealbums info 1062 chris cornell 具有三个垂直列我希望各列看起来具有相同的高度无论其中是否有
使用 pandas 对数据框进行排序。保持柱子完好无损

如下图所示我想按以下方式对聊天进行排序Type按字母顺序排列不过我不想打乱顺序 Date User id 每个内Chat name 鉴于我的输入数据框位于左侧我应该如何执行此操作在Python中使用Pandas 您想使用对值进行排
AVPlayerLayer 显示黑屏但声音正常

我正在尝试在中显示本地录制的视频AVP播放器层哪个有效有时我可以听到录制视频中的音频但看不到视频有时视频和音频都可以工作有时只有音频我都尝试过AVP播放器层 and AVPlayerViewController但这两种情况都会出现
对没有默认构造函数的控件使用 XamlReader

我有一些 Xaml 对象的字符串表示形式并且我想构建控件我正在使用XamlReader Parse函数来执行此操作对于像 Button 这样的简单控件它有一个不带任何参数的默认构造函数这样可以很好地工作 var buttonStr
1.7+ 中的 jQuery live() 与 on()

我知道从 jQuery 1 7 开始 live 方法已被弃用所以这就是我想出的 document body on click list function console log this 这几乎可以达到目的并且相当于 list live
如何将 JSON 数组值传递到 Jasper Reports 子报表中？

Jasper 报告和子表有问题我正在使用以下 JSON 格式 dataObjects objectId 025b3873ebe640aa9d6a34f9306548ae employeeFullName John Smith employ
Next.js - Eslint 不会在开发模式下检查任何页面（pages/_app.js 除外）

我在使用 Next js 设置 eslint 时遇到问题当我运行时它实际上正确地检查了我的所有文件next build 但是当我在开发模式下运行应用程序时 next eslint 实际上只是 lintspages app js 并完全忽
如何通过.NET验证xml代码文件？ + 如果我使用 XML 序列化，我该怎么做？

我希望用户能够将数据导出为 XML 文件当然我希望他们稍后能够导入相同的 XML 文件但他们总是可以更改它或者它可能是不同的 XML 文件所以我想验证 XML 文件以检查它是否采用我期望的格式所以我想我需要像模式这样的东西来检查
Java 数学运算语法（按位或等于）

谷歌似乎没有帮助解决以下问题在Java中以下是什么意思 long num1 long num2 Means long num1 long num1 long num2 The 是按位或
JPA 和 JSF：注入 EntityManager 的正确方法

我已经花了几个小时来处理这个问题但我仍然没有弄清楚将 JPA 与 JSF 结合使用的正确方法是什么我有一个会话范围的托管 bean 它可以做很多事情其中之一就是保存一些实体对象一开始我创建了一个请求范围的生产者方法用于构建我的
在 IDLE (Python 3.4) 中运行模块而不重新启动

看来在过去当您运行脚本模块时 IDLE 不会重新启动清理环境然而今天的情况却是这样但对于原型设计我希望环境分配的变量导入的模块函数能够在运行不同的模块文件时生存示例我正在开发一个函数我们称之为 f7 它需
将 C++ dll 导入 Windows Phone 项目

我是 Windows Phone 开发新手我有一个问题不知道如何解决问题是我有一个 C 项目我用 Visual C 2010 编译了它这创建了一个带有编译代码的 DLL 所以我知道 C 导入 dll 库但是当我添加引用时会出现
向 ListView 添加元素时如何设置动画/过渡？

我有一个 ListView 我通过绑定添加了元素 ListView 看起来像
CRTP编译错误

以下内容将使用 GCC 5 2 进行编译但不能使用 Visual Studio 2015 进行编译 template
如何从 res/raw 文件夹打开 PDF 文件？

我正在编写一个应用程序当您单击按钮时它会打开 pdf 文件下面是我的代码 File pdfFile new File android resource com dave pdfviewer R raw userguide Uri pa
将从 Oracle Java 切换到 OpenJDK，以避免支付 2019 年 1 月工作费用 [已关闭]

Closed 这个问题需要多问focused 目前不接受答案我有几个在生产中使用 JDK 1 8 的项目不过 Java 从 2019 年 1 月起开始收费如果我将项目迁移到 OpenJDK 1 8 因为它是开源的我的问题是否可以解决
不允许使用 HTTP 谓词 POST 来访问路径“/test.html”

下面是我的代码
如何将NameValueCollection转换为JSON字符串？

I tried NameValueCollection Data new NameValueCollection Data Add foo baa string json new JavaScriptSerializer Serialize
“由于‘内部’保护级别，‘isSuccess’无法访问”，AlamoFire 无法像以前一样工作

我在 swift 上使用 alamoFire 但遇到了这个问题由于内部保护级别 isSuccess 无法访问我努力了this我也尝试过this 这是我的代码 AF request jsonURL method get paramet
如何在非零价格行之前重复数据框中价格为 0 的行？

我有一个数据 WEEK PRICE QUANTITY SALE PRICE 4992 3 49 1908 750 0 00 4999 2 50 5681 000 2 50 5001 3 00 3187 000 3 00 5002 3 49

如何在非零价格行之前重复数据框中价格为 0 的行？

如何在非零价格行之前重复数据框中价格为 0 的行？ 的相关文章

随机推荐

热门标签

如何在非零价格行之前重复数据框中价格为 0 的行？的相关文章