R：如何将我的数据格式化为多项式 Logit？

2024-03-20

我正在 R 上复制一些 Stata 代码，我想使用以下命令执行多项式逻辑回归：mlogit函数，来自同名包（我知道有一个multinom函数于nnet但我不想用这个）。

我的问题是，使用mlogit，我需要使用以下方式格式化我的数据mlogit.data我不知道如何正确格式化它。将我的数据与文档和示例中使用的数据进行比较这个问题 https://stackoverflow.com/questions/9355535/how-should-i-format-my-data-for-the-r-mlogit-package，我意识到它不是同一个形式。

事实上，我使用的数据是这样的：

df <- data.frame(ID = seq(1, 10),
                 type = c(2, 3, 4, 2, 1, 1, 4, 1, 3, 2),
                 age = c(28, 31, 12, 1, 49, 80, 36, 53, 22, 10),
                 dum1 = c(1, 0, 0, 0, 0, 1, 0, 1, 1, 0),
                 dum2 = c(1, 0, 1, 1, 0, 0, 1, 0, 1, 0))

   ID type age dum1 dum2
1   1    2  28    1    1
2   2    3  31    0    0
3   3    4  12    0    1
4   4    2   1    0    1
5   5    1  49    0    0
6   6    1  80    1    0
7   7    4  36    0    1
8   8    1  53    1    0
9   9    3  22    1    1
10 10    2  10    0    0

而他们使用的数据如下：

         key altkey    A      B   C D
1  201005131      1  2.6 118.17 117 0
2  201005131      2  1.4 117.11 115 0
3  201005131      3  1.1 117.38 122 1
4  201005131      4 24.6     NA 122 0
5  201005131      5 48.6  91.90 122 0
6  201005131      6 59.8     NA 122 0
7  201005132      1 20.2 118.23 113 0
8  201005132      2  2.5 123.67 120 1
9  201005132      3  7.4 116.30 120 0
10 201005132      4  2.8 118.86 120 0
11 201005132      5  6.9 124.72 120 0
12 201005132      6  2.5 123.81 120 0

正如你所看到的，在他们的例子中，有一列altkey详细说明了每个类别的每个key还有一个专栏D显示该人选择了哪种替代方案。

但是，我只有一栏（type）它显示了个人的选择，但没有显示其他替代方案或每个替代方案的其他变量的值。当我尝试申请时mlogit，我有：

library(mlogit)
mlogit(type ~ age + dum1 + dum2, df)

data.frame(lapply(index, function(x) x[drop = TRUE]), row.names = rownames(mydata)) 中的错误：提供的行名称长度错误

因此，如何格式化我的数据，使其与数据类型相对应mlogit需要？

Edit:按照@edsandorf的建议，我修改了我的数据框并mlogit.data有效，但现在所有其他解释变量对于每个替代方案都具有相同的值。我是否应该在所选替代项为 0 或 FALSE 的行中将这些变量设置为 0 ？（事实上，有人可以告诉我从我所在的位置到结果的过程吗？mlogit因为我不明白我的估计错在哪里？）

我在这里显示的数据（df）不是我的真实数据。然而，它的形式完全相同：一列包含替代项的选择（type）、包含虚拟人和年龄的列等。

这是我到目前为止所做的过程（我没有将替代项设置为 0）：

# create a dataframe with all alternatives for each ID
qqch <- data.frame(ID = rep(df$ID, each = 4),
                   choice = rep(1:4, 10))

# merge both dataframes
df2 <- dplyr::left_join(qqch, df, by = "ID")

# change the values in stype by 1 or 0
for (i in 1:length(df2$ID)){
  df2[i, "type"] <- ifelse(df2[i, "type"] == df2[i, "choice"], 1, 0)
}

# format for mlogit
df3 <- mlogit.data(df2, choice = "type", shape = "long", alt.var = "choice")
head(df3)

    ID choice  type age dum1 dum2
1.1  1      1 FALSE  28    1    1
1.2  1      2  TRUE  28    1    1
1.3  1      3 FALSE  28    1    1
1.4  1      4 FALSE  28    1    1
2.1  2      1 FALSE  31    0    0
2.2  2      2 FALSE  31    0    0

如果我做：

mlogit(type ~ age + dum1 + dum2, df3)

我有错误：

solve.default(H, g[!fixed]) 中的错误：系统在计算上是奇异的：条件数倒数

除非我们做出更多假设，否则您的数据不适合使用 MNL 模型进行估计。一般来说，由于所有变量都是个体特定的，并且不会因替代方案（类型）而异，因此无法识别模型。除非我们将它们视为替代特定特征，否则您的所有个人特定特征都将被删除。听起来，每个专业项目都有其自身的意义。在这种情况下，我们可以仅使用常量来估计 MNL 模型，其中常量捕获了使个人选择它的程序的所有信息。

library(mlogit)
df <- data.frame(ID = seq(1, 10),
                 type = c(2, 3, 4, 2, 1, 1, 4, 1, 3, 2),
                 age = c(28, 31, 12, 1, 49, 80, 36, 53, 22, 10),
                 dum1 = c(1, 0, 0, 0, 0, 1, 0, 1, 1, 0),
                 dum2 = c(1, 0, 1, 1, 0, 0, 1, 0, 1, 0))

现在，为了安全起见，我为每个程序创建虚拟变量。type_1参考方案1，type_2编程 2 等

qqch <- data.frame(ID = rep(df$ID, each = 4),
                   choice = rep(1:4, 10))

# merge both dataframes
df2 <- dplyr::left_join(qqch, df, by = "ID")

# change the values in stype by 1 or 0
for (i in 1:length(df2$ID)){
  df2[i, "type"] <- ifelse(df2[i, "type"] == df2[i, "choice"], 1, 0)
}

# Add alternative specific variables (here only constants)
df2$type_1 <- ifelse(df2$choice == 1, 1, 0)
df2$type_2 <- ifelse(df2$choice == 2, 1, 0)
df2$type_3 <- ifelse(df2$choice == 3, 1, 0)
df2$type_4 <- ifelse(df2$choice == 4, 1, 0)

# format for mlogit
df3 <- mlogit.data(df2, choice = "type", shape = "long", alt.var = "choice")
head(df3)

现在我们可以运行模型了。我包含了每个备选方案的虚拟模型，并保留备选方案 4 作为我的参考水平。仅识别 J-1 个常数，其中 J 是替代方案的数量。在公式的后半部分（在管道运算符之后），我确保删除模型将创建的所有替代特定常量，并添加您的各个特定变量，将它们视为替代特定变量。请注意，只有当您的替代方案（程序）具有意义并且不通用时，这才有意义。

model <- mlogit(type ~ type_1 + type_2 + type_3 | -1 + age + dum1 + dum2,
                reflevel = 4, data = df3)
summary(model)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

mlogit

R：如何将我的数据格式化为多项式 Logit？的相关文章

如何缩放（标准化）每列内的 ggplot2 stat_bin2d 值（按 X 轴）

我有一个 ggplot stat bin2d 热图 library ggplot2 value lt rep 1 5 1000 df lt as data frame value df group lt rep 1 7 len 5000 d
如何在RcppParallel中调用用户定义的函数？

受到文章的启发http gallery rcpp org articles parallel distance matrix http gallery rcpp org articles parallel distance matrix 我
使用 lpSolve 优化 R 团队名单

我是 R 新手有一个想要解决的特定幻想运动队优化问题我见过其他帖子使用 lpSolve 来解决类似的问题但我似乎无法理解代码下面的示例数据表每个球员都在一个球队中扮演着特定的角色有薪水并且每场比赛都有平均得分我需要的限制是
通过 :: 调用包中的函数是一个好习惯吗

我正在编写一些 R 函数这些函数在其他包中使用一些有用的函数例如stringr and base64enc 不打电话好不好library or require 首先加载这些包但要使用直接引用我需要的功能比如stringr str m
在R闪亮中，如何在UI端使用在SERVER端计算的值？

在我的 R闪亮应用程序中我想调整我的高度d3heatmap 见包装d3热图 https cran r project org web packages d3heatmap index html 作为我的数据框行数的函数有一个论点heig
R 未获取用户库

我有一个带 R 3 6 0 的 Fedora 30 系统用户库设置在Renviron就像这个 R LIBS USER R LIBS USER R x86 64 redhat linux gnu library 3 6 事实上它出现在交互
如果指定了多个存储库，install.packages 的行为是什么？

从文档中并不清楚如果在 install packages 中指定了多个存储库会出现什么行为我的直觉告诉我它将尝试第一个存储库如果找不到包它将尝试第二个存储库依此类推不幸的是情况似乎并非如此我看到的是只尝试了第一个并返回错
R（或替代方案？）中的高（或非常高）阶多项式回归

我想对 R 中的一组数据进行非常高阶回归拟合但是poly 函数的阶数极限为 25 对于此应用程序我需要的订单范围为 100 到 120 model lt lm noisy y poly q 50 Error in poly q 50
矩阵中两个字符串的最大 nchar

我想找到更好的方法来找到我正在相互比较的两个字符串的更大的 nchar 假设我有字符串句子匹配data frame 和我需要创建一个 max nchar string1 nchar string2 矩阵但没有 for 循环这是非常慢的方
如何使用 R 或 PowerShell 从文本文件中提取数据？

我有一个包含如下数据的文本文件 This is just text Username SOMETHI C Text Account DFAG Finish time 1 JAN 2011 00 31 58 91 Process ID 202
准备编程竞赛的缩写和函数[关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心 help reopen questi
递归累积函数

我需要在 R 中编写一个累积求和函数但我一直碰壁该函数具有以下结构 a x1 a x2 a 2 x1 a x3 a 2 x2 a 3 x1 a x4 a 2 x3 a 3 x2 a 4 x1 等等 cumsum 似乎不适用于此类功能有
使用 sapply 的列表和矩阵

我有一个也许是基本的问题我在网上搜索过我在读取文件时遇到问题尽管如此我还是按照 Konrad的建议设法读取了我的文件我很欣赏这一点 How to get R to read in files from multiple subdi
使用 ape 包在 R 中进行标签和色叶树状图（系统发育）

继上一篇文章之后 r 中的标签和彩色叶树状图 https stackoverflow com questions 18802519 label and color leaf dendrogram in r 我有一个后续问题我的问题与提到的
用于不规则时间序列的滚动窗口函数，可以处理重复项

我有以下数据框 grp nr yr 1 A 1 0 2009 2 A 2 0 2009 3 A 1 5 2009 4 A 1 0 2010 5 B 3 0 2009 6 B 2 0 2010 7 B NA 2011 8 C 3 0 2014
获取行名以 ABC111 开头的所有行

我们有以下数据框 col1 col2 col3 ABC111001 12 12 13 ABC111002 3 4 5 ABC000111 7 6 1 ABC000112 9 23 1 如何获取行名以开头的所有行ABC111 如下 ABC1
ggplot() 使用scale::percent_format() 缩放产生奇怪的结果

library tidyverse mtcars gt count cyl gt mutate prop n sum n gt ggplot aes x cyl y prop geom point scale y continuous la
如何在主图区域之外的 ggplot2 中添加多个标题

我想为页脚添加两个标题但 ggplot 似乎只需要 1 是否有解决方法可以将注释或 geom text 添加到左下角和右下角 library ggplot2 p lt ggplot mtcars aes x wt y mpg geom p
替换向量中非 %in% 向量的值

简短的问题我可以像这样替换某些变量值 values lt c a b a b c a b df lt data frame values 将 df values 的所有值替换为 x 其中值是neither a 或 b 输出应该是 c a
如何在R中绘制仪表图表？

如何在 R 中绘制以下图 Red 30 Yellow 40 Green 30 Needle at 52 所以这里有一个完整的ggplot解决方案注意从原始帖子中编辑在仪表中断处添加数字指示器和标签这似乎是OP在评论中所要求的如果不

随机推荐

将 git lfs ls-files 与 git ls-files ':(attr:filter=lfs)' 进行比较是否是检测不受 lfs 管理的 lfs 文件的可靠方法？

我尝试找到一种方法来确定 git 存储库中的文件是否由 git lfs 正确管理到目前为止我发现比较结果git lfs ls files and git ls files attr filter lfs 似乎给了我我想要的 Add Ty
Ruby 相当于“grep -C 5”来获取匹配周围行的上下文？

我对此进行了一些搜索但我一定使用了错误的术语 ruby 是否有办法 grep 查找字符串正则表达式并返回周围的 5 行上面和下面我知道我可以打电话 grep C 5 或者甚至编写我自己的方法但这似乎是 ruby 拥有的东西而我只
Mac 上的 auctex 和 emacs

我想要的是能够成功使用 emacs 和 auctex 一些系统信息 ProductName Mac OS X ProductVersion 10 8 5 BuildVersion 12F45 Emacs Version 24 3 9 0 A
如何在 iPad 版 Objective C 中解析 PDF

我一直在解析 PDF 文件请指导我如何做到这一点头文件 PDFViewer h interface PDFViewer UIView CGPDFDocumentRef pdf void drawInContext CGContextRe
如何通过 XSLT 在 Java 中合并 2 个 XML 流

我想在 Java 中合并 2 个 XML 流字符串必须通过 XSLT 我可以更改转换但问题是 XML 作为字符串出现有很多例子但是通过文件可以在不将它们保存在文件中的情况下完成此操作吗 Thanks 我只知道一种使用自己的实现的
c++ max_element 每n个元素

有没有办法比较每 N 个元素来找到容器中的最大元素并返回索引使用 STL BOOST 或其他库对于每个 N 我的意思是使用 std max element 但将 for 的增加从 first 更改为 first n based on
该算法的名称是什么？它与其他图像重采样算法相比如何？

这个算法已经在我脑海中存在了很长一段时间但我找不到任何地方描述它虽然它是如此简单但我不可能是唯一一个想到它的人它的工作原理如下你从一张图片开始比如说 7x7px 您需要将其重新采样例如 5x5px 所以你要做的就是取每个新方块
UITextView 和浮动自动更正窗口的位置

我有一个启用自动更正的 UITextView 视图的高度约为 30 像素当自动更正启动时自动更正视图在文本下方几乎不可见有没有办法控制小自动更正窗口的位置或确保它是顶层以便它始终可见并且用户可以轻松查看并与之交互我发现在 UITe
Backbone.js 和 requirejs：如何将模型、视图和集合转换为 requirejs 模块？

我正在使用backbone js开发一个javascript应用程序也就是说为了便于开发我以这种方式构建我的文件 app views L movieRow js L movieDetail js models L movie js L
Java 8 构造函数参考的可怕性能和大堆占用？

我刚刚在我们的生产环境中经历了一次相当不愉快的经历导致OutOfMemoryErrors heapspace 我将问题追溯到我的使用ArrayList new在一个函数中验证这实际上比通过声明的构造函数正常创建执行得更差 t gt ne
等待设备时出错：等待模拟器上线 300 秒后超时

我一直在尝试使用 android studio 2 0 模拟器但我无法在模拟器上运行我的应用程序当我运行我的应用程序时它会显示模拟器其中包含以下详细信息哈克斯已启用 Hax ram size 0x800000000 HAx 正在运
如何设置 UIBarButtonItem 的字体大小？

我找不到自定义标题字体大小的方法UIBarButtonItem 我能想到解决这个问题的唯一方法是将其设置为图像我想避免这种情况还有其他建议吗 Objective C NSUInteger fontSize 20 UIFont font
在 Rails 中的 find 中使用 lambda

我有一个方法可以进行分页查找调用例如 1 coll paginate all lambda conditions gt status AND expires lt a DateTime now select gt Constants PO
在 BeautifulSoup 中替换文本而不转义

我想用 BeautifulSoup 中的锚链接包装一些尚未链接的单词我用这个来实现它 from bs4 import BeautifulSoup import re text replace this string soup Beauti
PHPUnit 在运行第一个测试之前进行设置，并在运行最后一个测试之后进行拆除

我正在尝试使用 PHPUnit 为 php 应用程序实现类似 Django 的测试实用程序类似 Django 我的意思是在运行第一个测试之前从主数据库创建一个单独的测试数据库并在运行最后一个测试后将其删除即使一次运行许多测试用例测试
用dense_rank数填充多维数组的rank列

我的数组结构如下 points gt 10 details gt name gt Team A rank gt points gt 10 details gt name gt Team B rank gt points gt 8 detai
c++ 可以通过引用传递临时 lambda（适用于 msvc/windows，但不适用于 gcc/linux）？

假设我有以下代码片段 global variable std thread worker thread Template function template
ui 中的输入绑定：jsf 中的重复

我正在使用facelets jsf 2 0和primefaces 3 0 M2组件库我正在尝试实现动态行数包括发生数据表选择时填充的输入字段每当进行选择时动态行都会使用输入字段正确生成但在后续选择的第一个选择之后动态行计数会正确
如何将本地MYSQL数据库移动到远程数据库服务器

我有一个在 WAMP 下运行的本地 MYSQL 数据库我需要将其移至生产数据库服务器 MySQL 新手需要了解提升此数据库的最佳方法您可以在当前服务器上运行它 mysqldump u user p database name gt d
R：如何将我的数据格式化为多项式 Logit？

我正在 R 上复制一些 Stata 代码我想使用以下命令执行多项式逻辑回归 mlogit函数来自同名包我知道有一个multinom函数于nnet但我不想用这个我的问题是使用mlogit 我需要使用以下方式格式化我的数据mlogit

R：如何将我的数据格式化为多项式 Logit？

R：如何将我的数据格式化为多项式 Logit？ 的相关文章

随机推荐

热门标签

R：如何将我的数据格式化为多项式 Logit？的相关文章