有序 logit R polr 的聚类标准误差 - 估计中删除的值

2024-03-13

我对 R 很陌生,并且习惯了非常基本的应用程序。 现在我遇到了一个问题需要帮助:

我正在寻找一种方法聚类标准误 for an 有序逻辑回归 (my estimation is similar to this https://stats.idre.ucla.edu/r/dae/ordinal-logistic-regression/例子)

我已经尝试过了robcov and vcovCL他们给我类似的错误消息:

  • eatCL(x, cluster = cluster, type = type, ...) 中的错误:数字 “cluster”和“estfun()”中的观测值不匹配
  • u[ ii]

提前谢谢了!

编辑: 我发现了一些有关缺失值的更多信息,但这似乎不是问题 - 因为即使我使用它来解决它,它仍然存在this https://stackoverflow.com/questions/23313907/clustered-standard-errors-with-data-containing-nas答案,或者当使用没有 NA 的数据集时。就像下面的例子一样。问题似乎是 polr 没有将残差作为输出的一部分提供给我。我该如何解决这个问题?

 dat <- read.dta("https://stats.idre.ucla.edu/stat/data/ologit.dta")
    length(dat$apply)
    twenty <- seq(from=1, to=20, by=1)
    dat$clustervar<-sample(twenty, size=400, replace=TRUE)



    m <- polr(apply ~ pared + public + gpa, data = dat, Hess=TRUE)
    vcovCL <- function(x, cluster.by, type="sss", dfcw=1){
      # R-codes (www.r-project.org) for computing
      # clustered-standard errors. Mahmood Arai, Jan 26, 2008.

      # The arguments of the function are:
      # fitted model, cluster1 and cluster2
      # You need to install libraries `sandwich' and `lmtest'

      # reweighting the var-cov matrix for the within model
      require(sandwich)
      cluster <- cluster.by
      M <- length(unique(cluster))
      N <- length(cluster)
      stopifnot(N == length(x$residuals))
      K <- x$rank
      ##only Stata small-sample correction supported right now
      ##see plm >= 1.5-4
      stopifnot(type=="sss")
      if(type=="sss"){
        dfc <- (M/(M-1))*((N-1)/(N-K))
      }
      uj  <- apply(estfun(x), 2, function(y) tapply(y, cluster, sum))
      mycov <- dfc * sandwich(x, meat=crossprod(uj)/N) * dfcw
      return(mycov)
    }
    vcovCL(dat, m, dat$clustervar)

这给了我:

Error: N == length(x$residuals) is not TRUE
Called from: vcovCL(dat, m, dat$clustervar)

我在 ?sandwich::vcovCL 的帮助页面上取得了成功,该页面显示该函数的第一个参数是模型对象。需要使用::运算符来屏蔽您提供的功能:

 m <- polr(apply ~ pared + public + gpa, data = dat, Hess=TRUE)
 ( clval <- sandwich::vcovCL(m, dat$clustervar) )
                                  pared       public         gpa unlikely|somewhat likely
pared                       0.085218306  0.005588259  0.04584255               0.15545404
public                      0.005588259  0.092283173 -0.01890725              -0.05875859
gpa                         0.045842552 -0.018907254  0.07067573               0.22455931
unlikely|somewhat likely    0.155454041 -0.058758588  0.22455931               0.72408670
somewhat likely|very likely 0.165079639 -0.058282514  0.23631756               0.75713049
                            somewhat likely|very likely
pared                                        0.16507964
public                                      -0.05828251
gpa                                          0.23631756
unlikely|somewhat likely                     0.75713049
somewhat likely|very likely                  0.80749182

您可能需要使用diag如果你想要 Wald 测试,请使用该矩阵。我认为这就是 coeftest 将提供的:

coeftest( m, vcov = clval)

t test of coefficients:

        Estimate Std. Error t value  Pr(>|t|)    
pared   1.047690   0.291922  3.5889 0.0003738 ***
public -0.058786   0.303781 -0.1935 0.8466565    
gpa     0.615941   0.265849  2.3169 0.0210210 *  
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

促使 Rhelp 成功搜索并由 Achim Zeileis 找到答案的另一个问题是here https://stackoverflow.com/questions/44209496/r-clustering-standard-errors-in-masspolr

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

有序 logit R polr 的聚类标准误差 - 估计中删除的值 的相关文章

  • 使用 data.table 对分组数据进行插值

    这是我最初发布的问题的延续http r 789695 n4 nabble com subset Between data table list and single data table object tp4673202 html http
  • 根据一个或多个下拉选项创建具有不同类型线型的折线图

    在下面闪亮的应用程序中 我尝试根据侧边栏中的下拉选择创建点线图 我已成功在选择一个指标时创建折线图 但无法选择 2 个指标 为了x and y我想要一个solid线 对于x1 and y1我想要一个dashed线和对于x2 and y2一条
  • 如何根据另一列的条件语句将因子列添加到数据框?

    我有一个数据框 我需要根据条件语句添加一个因子列 这里是data https www dropbox com s hujiacus8ek5o5z MoroccoCGE CC Stats csv Code morstats agri f lt
  • 安装 R 包。包含目录为空。开发标头

    我目前正在尝试运行一些最初在 2 11 0 下运行的 R 代码 我使用的 R 版本 2 14 1 无法运行该代码 我不熟悉 R 及其向后兼容性 据我所知 我的问题可能与版本无关 我会很高兴得知这是我做错的事情 其余的代码是无关紧要的 即使我
  • 在 R 中使用 apply() 时出现未使用参数错误

    当我尝试对日期列使用 apply 条件以返回一组系数时 收到错误消息 我有一个数据集 为简单起见 此处进行了修改 但可重现 ADataset lt data table Epoch c 2007 11 15 2007 11 16 2007
  • 对 data.table 进行子集化的最快方法是什么?

    在我看来 这是执行行 列子集的最快方法data table是使用 join 和nomatch option 它是否正确 DT data table rep 1 100 100000 rep 1 10 1000000 setkey DT V1
  • 将 SAS sas7bdat 数据读入 R

    R 有哪些选项可以读取本机 SAS 格式的文件 sas7bdat 进入R The NCES 共同核心 https nces ed gov ccd pubschuniv asp例如 包含以此格式保存的大量数据文件存储库 为了具体起见 让我们集
  • 如何使用“downloadHandler”在闪亮的可反应内部创建下载按钮?

    我创建downloadlinksa 的行内reactable 我这样做是为了DT datatable and a reactable reactable 我还创建了相应的output downloadHandler在 ids 上使用 app
  • 获取数据集 R 包中所有对象名称的列表?

    如何获取对象中对象的确切名称列表datasets https stat ethz ch R manual R devel library datasets html 00Index html包裹 我在这里找到了很多 data package
  • R:交换两个变量而不使用第三个变量

    我有两个变量 即 a lt 1 b lt 2 我想交换他们的价值观 是否有任何内置的 R 函数能够执行该操作 或者是否有其他优雅的方式 而不使用第三个 临时 变量 Note 如果可能的话适用于字符串或其他数据类型 有一个通用的解决方案或 技
  • 如何通过在R闪亮循环中读取.csv文件来动态生成dataTableOutput?

    我有一个函数可以生成 n 个数据帧并将其作为 csv 文件保存在某个位置 并且该函数返回已保存 CSV 的文件名 我希望获取这些 csv 文件 使用以下命令读取它read csv 然后使用 renderUI 和 renderDataTabl
  • 数据框中按行相关

    我正在尝试计算大型数据帧的所有行之间的相关性 到目前为止已经提出了一个有效的简单 for 循环 例如 name lt c a b c d col1 lt c 43 78 43 84 37 92 31 72 col2 lt c 43 80 4
  • R 监督潜在狄利克雷分配包

    我在用着这个LDA包 https cran r project org web packages lda 对于 R 具体来说 我正在尝试做监督潜在狄利克雷分配 slda https www cs princeton edu blei pap
  • ‘!’ 对于 R 中的因子没有意义

    我需要从数据框中排除变量 PABI 所以 我按如下方式进行子集化 MyData4 lt subset MyData PROV PABI newdata lt MyData MyData4 但我得到了这个错误 Error in FUN lef
  • 挑战:优化取消列出[简单]

    因为 SO 最近有点慢 所以我发布了一个简单的问题 如果大鱼们能在这场比赛中留在替补席上并给新秀们一个回应的机会 我将不胜感激 有时我们的对象具有大量的大列表元素 向量 您如何将这个对象 取消列出 到单个向量中 证明你的方法比unlist
  • 如何从数据框中按降序获取前n家公司

    我正在尝试从数据框中获取排名前 n 的公司 下面是我的代码 data Forbes2000 package HSAUR sort Forbes2000 profits decreasing TRUE 现在我想从这个排序向量中获取前 50 个
  • 将一长行带空格的数据导入R中

    这个问题是我上一个问题的后续问题 将一长行数据导入到 R 中 https stackoverflow com questions 8389913 我有一个由单行文本组成的大型数据文件 格式类似于 Cat 14 15 Horse 16 我最终
  • R:igraph、社区检测、edge. Betweenness 方法、统计/列出每个社区的成员?

    我有一个相对较大的图表 其中顶点 524 边 1125 是现实世界的交易 边是有向的并且具有权重 包含是可选的 我正在尝试调查图中的各个社区 并且本质上需要一种方法 计算所有可能的社区 计算最佳社区数量 返回每个 最佳 社区的成员 成员数量
  • 省略 RColorBrewer 调色板上较亮的颜色以在 ggplot2 中使用

    我想在 RColorBrewer 的 Oranges 调色板中使用较深的颜色 以便在我的 ggplot 条形图 中使用 然而我却做不到 帮助 下面是示例代码 my palette brewer pal n 9 Oranges 4 9 Bar
  • do.call 的 envir 选项如何工作?

    的文档do call states If quote is FALSE 默认值 然后对参数进行求值 在调用环境中 而不是在envir 这句话向我暗示 当quote FALSE 指定envir没有什么区别 然而 事实并非如此 事实上我遇到过需

随机推荐

  • 按值字母顺序对 Javascript 对象进行排序

    我有一个 JS 对象如下 var obj 00 11 22 33 44 55 AddressB 66 77 88 99 AA BB AddressA 55 44 33 22 11 00 AddressC AA BB CC DD EE FF
  • Apache Kafka 主题名称限制有哪些?

    我刚刚尝试创建一个 Kafka 主题 user created 并在 Kafka 日志中看到此错误 Invalid character in value part of property 我用谷歌搜索发现 在邮件列表中 人们正在谈论弃用 a
  • React Native 后台计时器永远不会停止

    我正在构建一个应用程序 它有一个计时器 可以在计时器处于活动状态时请求地理位置 对于我正在使用的计时器反应本机背景计时器 https github com ocetnik react native background timer 这是可行
  • 调用 sp_rename 时使用变量

    我尝试制作一个存储过程 它将 删除主键 重命名设置主键的列名 创建新的主键 我正在努力解决第 2 点 我正在尝试将列重命名为sp rename将参数传递给存储过程 如下所示 EXEC sp rename SCHEMA TABLE ID Id
  • 为什么我运行 python manage.py runserver 时有两个进程

    wenzhixue 80384 0 4 1 1 2464788 22584 s001 S 10 37AM 0 01 06 usr bin python manage py runserver 0 0 0 0 8000 wenzhixue 8
  • 如何处理大量浮点数据?

    我们有一个二进制文件 其中包含大量float数据 约80MB 我们需要在 Java 应用程序中处理它 数据来自医疗扫描仪 一个文件包含来自一个文件的数据Rotation One Rotation包含 960Views One View包含
  • 为构建器配置 lombok

    我想避免多个构造函数 所以我想使用建造者设计模式 https en wikipedia org wiki Builder pattern 通过使用lombok https projectlombok org setup maven图书馆 它
  • Tensorflow tf.data.Dataset.cache似乎没有达到预期的效果

    我正在尝试按照以下方法提高我的模型训练性能使用 tf data API 获得更好的性能 https www tensorflow org guide data performance指导方针 然而 我观察到使用的性能 cache 如果与没有
  • 将键、值对添加到新字典中

    我当前的字典中有一个现有的键 值对列表 称为total list 我想检查我的列表 看看每个的长度是否Key 1 in total list 我想将该键及其值对添加到新字典中 这是我想出的代码 total list 104370544 31
  • 导入 SMOTE 引发 AttributeError:模块“sklearn.metrics._dist_metrics”没有属性“DistanceMetric32”

    Running from imblearn over sampling import SMOTE会引发以下错误 AttributeError Traceback most recent call last d A OneDrive UBC
  • ggplot:向现有分组箱线图添加新数据

    我用 ggplot2 创建了一个分组箱线图 现在我想通过以下方式向现有绘图添加附加数据 我每个月都有one 最佳 值应显示为点 并且这些点应通过线连接 这是期望的状态 我如何将这些点和线添加到我的绘图中 我可以将连接线放在箱线图后面吗 这是
  • IIS SSL 错误“ssl_error_rx_record_too_long”

    我使用以下 SSL 命令创建了一个证书 makecert r pe n CN www yourserver com b 01 01 2000 e 01 01 2036 eku 1 3 6 1 5 5 7 3 1 ss my sr local
  • 我在哪里可以了解“shell:”URI?

    我刚刚意识到有一个shell URI 但每个搜索引擎似乎都认为shell and shell是同一件事 我唯一发现的是你可以输入shell startup直接在资源管理器中 XP 和 7 测试过 可以看到明显的效果 这已经很好了 因为没有
  • 强制 JTable 在仍处于编辑模式时将数据“提交”到模型

    我有一个 JTable 如下 因此 当 JTable 仍处于编辑模式时 在 Dividend 列处有键盘光标闪烁 直接单击 确定 不会将数据提交到表模型中 单击 确定 仅关闭对话框 我需要明确按 ENTER 键 以便将数据提交到表模型中 当
  • SNMP:创建自定义 OID

    我需要自定义 OID 来监控我的一些软件状态 但我就是不明白 如何在Windows XP系统中创建自定义OID 如 1 3 6 1 4 1 30891 100 103 我需要其中一些人在那里写一些信息并在需要时阅读它 但我不知道如何在系统中
  • Java/LWJGL:OpenGL 中的 Z 轴表现得像左手坐标系

    最近 我寻求帮助 https stackoverflow com q 18836484 1530508关于 OpenGL 中的 3D 相机旋转 这个答案 https stackoverflow com a 18836618 1530508接
  • PyTorch:如何使用 DataLoaders 自定义数据集

    如何利用torch utils data Dataset and torch utils data DataLoader根据您自己的数据 不仅仅是torchvision datasets 有没有办法使用内置的DataLoaders他们使用的
  • 我可以使用 *.tlb 文件而不使用 Regasm 在计算机上注册它吗

    我们正在支持老化的 VB6 系统 我们已在 Net 中为其编写了新代码 将代码放入程序集中 然后导出 tlb 文件以与 VB6 代码库一起使用 我的问题是 在我希望运行代码的每台计算机上 我是否必须使用 Regasm 来注册类型库 我之所以
  • WCF 最大消息大小配额

    我正在尝试调用 WCF 服务 托管在 Windows 服务中 而不是 IIS 但收到以下错误 最大消息大小配额 传入消息已超出 对于远程通道 请参阅 服务器日志以获取更多详细信息 我尝试将 MaxReceivedMessageSize 和
  • 有序 logit R polr 的聚类标准误差 - 估计中删除的值

    我对 R 很陌生 并且习惯了非常基本的应用程序 现在我遇到了一个问题需要帮助 我正在寻找一种方法聚类标准误 for an 有序逻辑回归 my estimation is similar to this https stats idre uc