如何在 R 中对多维面板数据运行回归

2024-04-29

我需要对面板数据进行回归。它有 3 个维度（年份 * 公司 * 国家/地区）。例如：

============================================
 year | comp | count |  value.x |  value.y
------+------+-------+----------+-----------
 2000 |   A  |  USA  |  1029.0  |  239481   
------+------+-------+----------+-----------
 2000 |   A  |  CAN  |  2341.4  |  129333   
------+------+-------+----------+-----------
 2000 |   B  |  USA  |  2847.7  |  187319   
------+------+-------+----------+-----------
 2000 |   B  |  CAN  |  4820.5  |  392039
------+------+-------+----------+-----------
 2001 |   A  |  USA  |  7289.9  |  429481
------+------+-------+----------+-----------
 2001 |   A  |  CAN  |  5067.3  |  589143
------+------+-------+----------+-----------
 2001 |   B  |  USA  |  7847.8  |  958234
------+------+-------+----------+-----------
 2001 |   B  |  CAN  |  9820.0  | 1029385
============================================

然而，R 包plm似乎无法应对超过二维的情况。

我努力了

result <- plm(value.y ~ value.x, data = dataname, index = c("comp","count","year"))

它返回错误：

Error in pdata.frame(data, index) : 
'index' can be of length 2 at the most (one individual and one time index)

当面板数据（个体 * 时间）在“个体”内具有超过 1 个维度时，如何运行回归？

如果有人遇到同样的情况，我将我的解决方案放在这里：

R似乎无法应对这种情况。你唯一能做的就是添加假人。如果您添加虚拟变量所依据的分类变量包含太多类别，您可以尝试以下操作：

makedummy <- function(colnum,data,interaction = FALSE,interation_varnum)
{
  char0 = colnames(data)[colnum]
  char1 = "dummy"
  tmp = unique(data[,colnum])
  valname = paste(char0,char1,tmp,sep = ".")
  valname_int = paste(char0,char1,"int",tmp,sep = ".")
  for(i in 1:(length(tmp)-1))
  {
    if(!interaction)
    {
      tmp_dummy <- ifelse(data[,colnum]==tmp[i],1,0)
    }
    if(interaction)
    {
      index = apply(as.matrix(data[,colnum]),1,identical,y = tmp[i])
      tmp_dummy = c()
      tmp_dummy[index] = data[index,interation_varnum]
      tmp_dummy[!index] = 0
    }
    tmp_dummy <- data.frame(tmp_dummy)
    if(!interaction)
    {
      colnames(tmp_dummy) <- valname[i]
    }
    if(interaction)
    {
      colnames(tmp_dummy) <- valname_int[i]
    }
    data<-cbind(data,tmp_dummy)
  }
  return(data)
}

例如：

## Create fake data
fakedata <- matrix(rnorm(300),nrow = 100)
cate <- LETTERS[sample(seq(1,10),100, replace = TRUE)]
fakedata <- cbind.data.frame(cate,fakedata)

## Try this
fakedata <- makedummy(1,fakedata)

## If you need to add dummy*x to see if there is any influences of different categories on the coefficients, try this
fakedata <- makedummy(1,fakedata,interaction = TRUE,interaction_varnum = 2)

这里可能有点啰嗦，我没有润色。欢迎任何建议。现在您可以对数据执行 OLS。

如果您想控制模型内的另一个维度，只需为其添加一个虚拟值：

plm(value.y ~ value.x + count, data = dataname, index = c("comp","year"))

或者（特别是对于高维数据），请查看lfe可以“吸收”附加维度的包，因此汇总输出不会被虚拟变量污染。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

multidimensionalarray

panel

plm

如何在 R 中对多维面板数据运行回归的相关文章

ggplot堆叠条 - 隐藏标签但保留标签位置

我在 ggplot 中有一个堆积条形图其中 geom text 标签位于每个条形的中心我想隐藏小条上的标签以便图表看起来不会过于拥挤我可以使用下面的代码来完成此操作但它会弄乱标签的位置正如您在下面的链接图片中看到的那样它们不再
如何从多边形数据中提取栅格值然后加入到空间数据框中？

我想将多边形数据和栅格数据合并到一个数据框中以便随后在 R 中使用 randomForests 包这涉及首先提取每个多边形的平均栅格值到目前为止我有以下内容 load libraries library raster library
R：使用带有 .Call 和 C/C++ 包装器的 Fortran 子例程而不是 .Fortran 的优点？

我有一个 R 包它使用大量 Fortran 子例程来进行递归线性代数计算的嵌套循环很大程度上依赖于 BLAS 和 LAPACK 例程作为 Fortran 的接口我使用 Fortran功能我刚刚读过乔纳森卡拉汉的博客文章 http
修复 ggplot 中构面中的数据顺序

我在使用 ggplot 绘制数据时遇到问题我无法使每个方面内的数据正确排序我的样本数据是 data lt structure list Parameter c 0 1 0 7 0 0 0 2 0 2 0 7 0 0 0 1 0 3 0
根据不平凡的标准有效合并两个数据帧

正在接听这个问题 https stackoverflow com questions 18821862 data selection error 18823432 18823432昨晚我花了一个小时试图找到一个没有增长的解决方案data
删除 R 中具有重复属性的行

我有一个大数据框其中包含以下列 ID time OS IP 该数据帧的每一行对应一个条目在该数据框中对于某些IDs存在多个条目行我想删除这些多行显然同一 ID 的其他属性会有所不同或者换句话说我只想要每个 ID 一个条目行
获取所有矩阵列逐元素乘积对的快速方法

假设我有一个数字matrix set seed 1 mat lt matrix rnorm 1000 ncol 100 我想生成所有向量它们是中所有唯一向量对的逐元素乘积的结果mat 我们如何改进下面的代码 all pairs lt t
按具有作业的组划分的 R 分位数

我有以下 df group rep seq 1 3 30 variable runif 90 5 0 7 5 df data frame group variable 我需要 i 按组定义分位数 ii 将每个人分配到相对于其组的分位数因此
R：如何根据规范更改数据框中的列名称

我有一个数据框它的开头如下 SM H1455 SM V1456 SM K1457 SM X1461 SM K1462 ENSG00000000419 8 290 270 314 364 240 ENSG00000000457 8 252
从 R 到 C 处理列表并访问它

我想使用从 R 获得的 C 列表我意识到这个问题与此非常相似使用 call 在 R 和 C 之间传递数据帧 https stackoverflow com questions 6658168 passing a data frame f
如何将 R 数据框中的多个字符列合并为单个列

我正在处理人口普查数据需要将四个字符列合并为一列 Example LOGRECNO STATE COUNTY TRACT BLOCK 60 01 001 021100 1053 61 01 001 021100 1054 62 01 00
在 mutate 和 across 之后使用 ~separate

目的是将所有物种 setosa 行转换为一行 setosa 这是一个最小的示例实际上有更多列和更多组我有这个数据框 head iris 2 gt select 1 2 5 gt group by Species Sepal Length
使用 data.table 进行分组并选择最短日期

My Data df1 lt structure list ID c A A A B B C c1 1 6 c2 1 6 myDate c 01 01 2015 02 02 2014 03 01 2014 09 09 2009 10 10
R：编写抛硬币的随机采样程序

假设我们有以下情况有一枚硬币如果它正面朝上那么下一次抛掷正面的概率是 0 6 如果是反面那么下一次抛掷反面的概率也是 0 6 一个班有100名学生每个学生随机抛掷硬币几次 Student n 的最后一次抛硬币不会影响 Studen
如何将带有观察计数的标签添加到 stat_summary ggplot？

我有一个数据集例如 outcome lt c rnorm 500 45 10 rnorm 250 40 12 rnorm 150 38 7 rnorm 1000 35 10 rnorm 100 30 7 group lt c rep A
如何使用 sprintf 函数在字符中添加前导“0”而不是空格？

我正在尝试使用sprintf函数为字符添加前导 0 并使所有字符长度相同然而我得到的是领先空间 My code a lt c 12 123 1234 sprintf 04s a 1 12 123 1234 我试图得到什么 1 0012 0
R闪亮主面板显示样式和字体

我正在学习闪亮的应用程序并且有一些关于调整布局的基本问题特别是样式和字体希望得到指点或明确的答案谢谢考虑一个基本的输入输出应用程序用户在 sidebarPanel 中输入数据然后在 mainPanel 中反应性地输出结果如何
从 data.frame 中提取时用 NA 填充缺失的列

我有一个函数它将具有某些列的数据框作为输入 columns a b z 现在我有一个数据框DF只有很少的这些列DF columns f u z 如果列不在其中如何创建一个包含所有值为 NA 的列的数据框DF这与DF在柱子上 f u z
美人鱼图：调整图表周围的空白

我在用 Rstudio 编译的 Rmd 报告中使用了美人鱼图在 HTML PDF 输出中图表上方和下方有大量空白请参见下面的示例 Header Text r library DiagrammeR mermaid graph TD cl
R闪亮：使用闪亮的JS从数据表中获取信息

我想读出所有列名称以及它们在数据表中显示的顺序由于不同的原因我无法使用 stateSave 等选项我对 JS 没有什么把握但我确信用它可以完成所以我需要你帮助我我尝试过类似的代码片段 datatable data callbac

随机推荐

Azure AD 和 Azure AD B2C 令牌之间的区别

这些天我一直在研究 Azure AD 授权代码流突然开始将所有内容转移到 Azure AD B2C 我发现 Azure AD 和 Azure AD B2C 之间有很多差异有人可以回答我下面的问题吗在Azure AD中当我们注册本机应
我如何（或可以）在多个列上选择 DISTINCT？

我需要从表中检索所有行其中两列的组合都不同因此我希望同一天没有任何其他销售的所有销售都以相同的价格进行基于日期和价格的唯一销售将更新为活动状态所以我在想 UPDATE sales SET status ACTIVE WHERE i
VB.NET LINQ 查询：获取特定结构成员的所有值的总和

在 VB NET 中假设我有以下结构 Public Structure Product Public ItemNo As Int32 Public Description As String Public Cost As Decimal
java - 如何在密钥库中存储密钥

我需要将 2 个密钥存储到 KeyStore 中这是相关代码 KeyStore ks KeyStore getInstance JKS String password password char ksPass password toCha
Swift 在数组切片中的“fromAfter”调用是什么？

斯威夫特 3 有upTo and through 分别是非包含的包含的 func 前缀 upTo Int 返回从集合开头开始的子序列最多但不包括指定位置 func 前缀通过 Int 返回从集合开头开始的子序列through指定位置另
C# 无法加载 DLL（找不到模块 HRESULT：0x8007007E）

错误无法加载 DLL x dll 找不到指定的模块 HRESULT 异常 0x8007007E 操作系统 Windows 7 我有两个站 Visual Studio 2012 使用 net 4 0 另一个没有安装VS 在使用 VS2012
使用类作为具有前向声明的模板化类的模板参数

我知道在诸如此类的前向声明之后 class Foo 我可以将变量声明为Foo or Foo 但不是Foo 如果我有一个模板化类和实例化 template
如何格式化 .CSV 文件的日期字段并在字符串字段中包含多个逗号

我有一个 CSV 文件 file csv 其数据全部用双引号引起来文件的示例格式如下 column1 column2 column3 column4 column5 column6 column7 Column8 Column9 Colu
包含 SqlGeometry 的数据表导致存储过程执行失败...为什么？

我正在尝试保存一系列SqlGeometry值到 SQL Server 2008 数据库基本上我在 SQL Server 存储过程中有一个表类型如下所示 CREATE TYPE dbo TableType Example AS TABLE
无法在转换中使用 `fill = NA`

我收到以下错误 dcast rep data country variable mean fill NA Error in vapply indices fun default values must be type logical but
Mysql工作台外键选项[Restrict、Cascade、Set Null、No Action]，它们的作用是什么？

在更新和删除的外键选项中每个字段 Restrict Cascade Set Null No Action 的作用是什么如果你一一采取对于更新和删除如果您尝试更新删除父行 Restrict 如果有子行则不会删除任何内容 Casca
如何仅在内存中运行 Django 测试数据库？

我的 Django 单元测试需要很长时间才能运行因此我正在寻找加快速度的方法我正在考虑安装一个SSD http en wikipedia org wiki Solid state drive 但我知道这也有其缺点当然我可以用我的代码
在空的 ggplot 中获取图例着色

在呈现实际数据之前我想制作一张与带有数据的图相同的图但其中没有数据点这有助于我解释如何解释这样的情节而不用情节中的实际数据分散观众的注意力所以在下面的代码中我基本上想交换geom point with geom blank 没问题
Android 索引滚动

http developer android com design building blocks scrolling html http developer android com design building blocks scrol
如何选择下拉单元格验证值

我正在尝试在 Excel 工作表的数据验证中选择一个值 Set r Sheets DASHBOARD Cells Find What Selection Location gt LookAt xlWhole searchorder xlBy
正则表达式：验证没有查询参数的 URL 路径

我不是正则表达式专家我正在绞尽脑汁尝试做一个看起来非常简单并且在 python 2 7 中工作的事情在没有查询字符串的情况下验证 URL 的路径无主机名换句话说以开头的字符串允许字母数字值并且不允许任何其他特殊字符除了这些
Twitter 为开发者提供“离线”访问？

我一直在与社交整合和授权的 oauth 框架密切合作我知道像 Facebook 一样 Twitter 为其应用程序实现了 oauth hook 我的问题是有没有办法让访问令牌永远保持活动状态就像 Facebook 拥有离线访问权限一
是否有更有效或更简洁的方法来根据索引列表划分 df？

我正在尝试切片划分以下数据框 df pd DataFrame time 4 10 15 6 0 20 40 11 9 12 11 25 value 0 0 0 50 100 0 0 70 100 0 100 20 根据要分割的索引列表 5
“else”在Python中被认为是有害的？

In an answer https stackoverflow com questions 855759 python try else 855783 855783 by S Lott https stackoverflow com us
如何在 R 中对多维面板数据运行回归

我需要对面板数据进行回归它有 3 个维度年份公司国家地区例如 year comp count value x value y 2000 A USA 1029 0 239481 2000 A CAN 2341 4 129333 2

如何在 R 中对多维面板数据运行回归

如何在 R 中对多维面板数据运行回归 的相关文章

随机推荐

热门标签

如何在 R 中对多维面板数据运行回归的相关文章