是否有与 Stata“order”命令等效的 R 函数？

2023-11-26

R 中的“顺序”类似于 Stata 中的“排序”。例如，这是一个数据集（仅列出变量名称）：

v1 v2 v3 v4 v5 v6 v7 v8 v9 v10 v11 v12 v13 v14 v15 v16 v17 v18

这是我期望的输出：

v1 v2 v3 v4 v5 v7 v8 v9 v10 v11 v12 v17 v18 v13 v14 v15 v6 v16

在R中，我有两种方法：

data <- data[,c(1:5,7:12,17:18,13:15,6,16)]

names <- c("v1", "v2", "v3", "v4", "v5", "v7", "v8", "v9", "v10", "v11", "v12",  "v17", "v18", "v13", "v14", "v15", "v6", "v16")
data <- data[names]

为了在 Stata 中获得相同的输出，我可以运行 2 行：

order v17 v18, before(v13)
order v6 v16, last

在上面的理想数据中，我们可以知道我们想要处理的变量的位置。但在大多数实际情况下，我们有“年龄”“性别”等变量，没有位置指示符，并且一个数据集中可能有 50 多个变量。那么Stata中“顺序”的优势就更加明显了。我们不需要知道变量的确切位置，只需输入它的名称：

order age, after(gender)

R 中是否有一个基本函数可以处理这个问题或者我可以获得一个包？提前致谢。

tweetinfo <- data.frame(uid=1:50, mid=2:51, annotations=3:52, bmiddle_pic=4:53, created_at=5:54, favorited=6:55, geo=7:56, in_reply_to_screen_name=8:57, in_reply_to_status_id=9:58, in_reply_to_user_id=10:59, original_pic=11:60, reTweetId=12:61, reUserId=13:62, source=14:63, thumbnail_pic=15:64, truncated=16:65)
noretweetinfo <- data.frame(uid=21:50, mid=22:51, annotations=23:52, bmiddle_pic=24:53, created_at=25:54, favorited=26:55, geo=27:56, in_reply_to_screen_name=28:57, in_reply_to_status_id=29:58, in_reply_to_user_id=30:59, original_pic=31:60, reTweetId=32:61, reUserId=33:62, source=34:63, thumbnail_pic=35:64, truncated=36:65)
retweetinfo <- data.frame(uid=41:50, mid=42:51, annotations=43:52, bmiddle_pic=44:53, created_at=45:54, deleted=46:55, favorited=47:56, geo=48:57, in_reply_to_screen_name=49:58, in_reply_to_status_id=50:59, in_reply_to_user_id=51:60, original_pic=52:61, source=53:62, thumbnail_pic=54:63, truncated=55:64)
tweetinfo$type <- "ti"
noretweetinfo$type <- "nr"
retweetinfo$type <- "rt"
gtinfo <- rbind(tweetinfo, noretweetinfo)
gtinfo$deleted=""
gtinfo <- gtinfo[,c(1:16,18,17)]
retweetinfo <- transform(retweetinfo, reTweetId="", reUserId="")
retweetinfo <- retweetinfo[,c(1:5,7:12,17:18,13:15,6,16)]
gtinfo <- rbind(gtinfo, retweetinfo)
write.table(gtinfo, file="C:/gtinfo.txt", row.names=F, col.names=T, sep="\t", quote=F)
# rm(list=ls(all=T))

因为我正在拖延并尝试不同的事情，所以这是我提出的一个函数。最终，这取决于append:

moveme <- function(invec, movecommand) {
  movecommand <- lapply(strsplit(strsplit(movecommand, ";")[[1]], ",|\\s+"), 
                        function(x) x[x != ""])
  movelist <- lapply(movecommand, function(x) {
    Where <- x[which(x %in% c("before", "after", "first", "last")):length(x)]
    ToMove <- setdiff(x, Where)
    list(ToMove, Where)
  })
  myVec <- invec
  for (i in seq_along(movelist)) {
    temp <- setdiff(myVec, movelist[[i]][[1]])
    A <- movelist[[i]][[2]][1]
    if (A %in% c("before", "after")) {
      ba <- movelist[[i]][[2]][2]
      if (A == "before") {
        after <- match(ba, temp)-1
      } else if (A == "after") {
        after <- match(ba, temp)
      }    
    } else if (A == "first") {
      after <- 0
    } else if (A == "last") {
      after <- length(myVec)
    }
    myVec <- append(temp, values = movelist[[i]][[1]], after = after)
  }
  myVec
}

以下是一些代表数据集名称的示例数据：

x <- paste0("v", 1:18)

现在想象一下，我们想要“v17”和“v18”在“v3”之前，“v6”和“v16”在末尾，“v5”在开头：

moveme(x, "v17, v18 before v3; v6, v16 last; v5 first")
#  [1] "v5"  "v1"  "v2"  "v17" "v18" "v3"  "v4"  "v7"  "v8"  "v9"  "v10" "v11" "v12"
# [14] "v13" "v14" "v15" "v6"  "v16"

所以，明显的用法是，对于data.frame名为“df”：

df[moveme(names(df), "how you want to move the columns")]

并且，对于一个data.table名为“DT”（正如 @mnel 指出的那样，内存效率更高）：

setcolorder(DT, moveme(names(DT), "how you want to move the columns"))

请注意，复合移动是用分号指定的。

公认的动作是：

before（将指定列移动到另一个命名列之前）
after（将指定列移动到另一个命名列之后）
first（将指定列移动到第一个位置）
last（将指定列移动到最后位置）

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

stata

是否有与 Stata“order”命令等效的 R 函数？的相关文章

如何使用 R 将每个文件的数据添加为附加行，从而将不同的 .csv 文件合并为一个完整的文件？

我有几个不同的文件夹它们都包含一个 csv 文件所有这些 csv 文件都有一个单独的列其中包含实验的一种条件的数据我想以将每个文件的数据添加为新列的方式合并这些 csv 文件目前它看起来像这样 C1 csv 102 106 15
如何在knitr和RStudio中为word和html设置不同的全局选项？

我正在使用 RStudio 0 98 932 和 knitr 1 6 想要为word和html设置不同的全局knitr选项例如想要将word的fig width和fig height设置为6 html的fig width和fig hei
跟踪循环迭代

抛硬币成功你赢100 否则你输50 你会一直玩直到你口袋里有钱a 的价值如何a在任何迭代中都被存储 a lt 100 while a gt 0 if rbinom 1 1 0 5 1 a lt a 100 else a lt a 50
从日期变量创建月末日期

我有一个包含日期变量的大型数据框它反映了该月的第一天有没有一种简单的方法来创建代表该月最后一天的新数据框日期变量以下是一些示例数据 date start month seq as Date 2012 01 01 length 4 by
无法更新/编辑从 R 中的包（`gratia`）导出的 ggplot2 对象

我希望我在这里遗漏了一些令人痛苦的明显的东西我希望更新例如修复标题实验室等由生成的 ggplot 对象gratia draw 不太确定为什么我无法更新该对象有一个简单的解决方案吗 devtools install github
从 n,k 维矩阵数组中减去 n,k 维矩阵

如果我有一个数组A A lt array 0 c 4 3 5 for i in 1 5 set seed i A i lt matrix rnorm 12 4 3 如果我有矩阵 B set seed 6 B lt matrix rnorm
如何在 Caret 中绘制随机森林（护林员）树

我生成了如下所示的随机森林树并尝试绘制它但出现错误我在哪里犯了错误我怎样才能以正确的方式绘制它 Actmodel lt train Activity Section Author data CB1 method ranger trC
R中的字典数据结构

在 R 中我有例如 gt foo lt list a 1 b 2 c 3 如果我输入foo I get a 1 1 b 1 2 c 1 3 我怎样才能看透foo仅获取键列表在这种情况下 a b c R 列表可以具有命名元素因此可
为什么数据帧上的 is.vector 不返回 TRUE？

tl dr R 中的向量到底是什么长版 R 中很多东西都是向量例如数字是长度为 1 的数值向量 is vector 1 1 TRUE 列表也是一个向量 is vector list 1 1 TRUE 好的所以列表是一个向量显然数
使用 R 下载压缩数据文件、提取和导入数据

EZGraphs 在 Twitter 上写道很多在线 csv 都被压缩了有没有办法下载解压缩存档并使用 R 将数据加载到 data frame Rstats 我今天也尝试这样做但最终只是手动下载 zip 文件我尝试过类似的东西 f
Quantmod 的简单功能不再起作用

我明天要交论文我收到了一条关于 quantmod 的非常奇怪的错误消息这是我在过去几周使用这个包时从未遇到过的我无法导入特定于道琼斯指数 DJI 的数据我收到以下错误消息 getSymbols DJI src yahoo from
R 中两个时间戳之间的左连接

我的目标是执行左连接intervals哪里的bike id比赛和created at时间戳在records在之间start and end in the intervals table gt class records 1 data ta
访问或解析 R 中的 summary() 中的元素

我运行以下 R 命令来进行 Dunnett 测试并获取摘要如何访问下面线性假设的每一行这是摘要输出的一部分基本上我不知道摘要的结构我尝试使用名称但它似乎不起作用因为我没有看到任何命名属性来提供这一点 library multco
需要在R中按行绑定列表数据

我在 R 中按行绑定列表时遇到问题我的列表数据集是 id 1 data k 1 id k b c 1 1 1 3 data k 2 id k b c 1 2 1 4 id 2 data k 1 id k b c 2 1 1 6 data
行对名称中具有特定模式的列求和

我有一个像这样的数据表 DT lt ata table data table ref rep 3L 4L nb 12 15 i1 c 3 1e 05 0 044495 0 82244 0 322291 i2 c 0 000183 0 155
在网格中制作一个矩形图例，并标记行和列

我有一个 ggplot 我将因子映射到填充和 alpha 如下所示 set seed 47 the data lt data frame value rpois 6 lambda 20 cat1 rep c A B each 3 cat2
data.table 抛出“找不到对象”错误[重复]

这个问题在这里已经有答案了我有一个数据表 library data table mydt lt data table index 1 10 当我在全局环境中尝试它时我可以让它工作但当我在调试器中或在包测试中使用它时却无法工作问题是我
使用选定因子水平的值向 ggplot-barchart 添加水平线

在这个情节中 df lt data frame factor as factor c rep A 3 rep B 3 Treatment c rep c A B C 2 values runif 6 0 1 ggplot df aes Tr
为什么这个 R ggplot2 代码会显示一个空白的显示设备？

虽然 SO 通常不用于帮助解决错误但这个显示了特别简单且特别烦人的行为如果你是一个ggplot2用户您可以在 10 秒或更短的时间内重现它正如这个 GitHub 问题 ggplot gtable 创建空白显示 https githu
需要在R中跳过不同数量的行

我正在使用以下代码来处理我的数据但最近我意识到使用skip 27 在数据开始之前跳过存储在我的文件中的信息不是一个好的选择因为每个文件中要跳过的行数不同我的目标是读取存储在多个文件夹中的各种txt文件并非所有文件都有相同的列数列的

随机推荐

是否可以仅使用区域监控 + GSM 并获得不超过 5 公里的水平精度？

我想分享我执行的测试场景的信息并请您分享您在区域监控方面的经验因此我注册了两个相对的区域 A 和 B 半径为 5 公里所需精度为 1 公里它们之间的距离为 20 公里但是从 A 到 B 时我没有收到任何 didEnterRe
如何从 Android 中的 TTF 文件读取字距调整对表

我目前正在使用从 TTF 文件加载的外部非标准字体在 Canvas 上绘制文本我想为我正在显示的文本启用字距调整我想知道是否有可能使用 Android API 从字体中读取字距对我想知道是否有可能使用 Android API 从字
电子邮件通讯服务指南

我正在实施一个电子邮件通讯发送服务使用 NET 和 Windows Server 技术是否有全面的指南可以提供帮助避免电子邮件被垃圾邮件过滤器捕获以及其他机制它们应该涵盖合法批量邮件发送的所有方面 SMTP 配置 DNS HTML
在分支签出之间保留 git --assume-unchanged 文件

我一直在使用git assume unchanged yacs settings development py忽略我的开发分支中的本地数据库配置文件但是当我想切换分支用于部署时我收到一条错误指出我仍有待更改的更改 git chec
UIImagePickerController 裁剪？

我读过它是自动的但在我的情况下似乎没有发生使用 UIImagePickerController 并将 allowedEditing 设置为 YES 我得到了带有裁剪方形叠加层的编辑视图但是当我完成图像时它没有按照我的预期裁剪这个阶
Cols、col groups 和 css ":hover" 伪类

我正在尝试创建一个表格来显示个人的体重指数作为其中的一部分我想 hover 为了 tr and tr
使用 Ruby 和 Nokogiri 解析大型 XML 文件

我有一个大型 XML 文件大约 10K 行需要定期解析格式如下
我可以使用 std::async 而不等待未来的限制吗？

高水平我想在异步模式下调用一些没有返回值的函数而不等待它们完成如果我使用 std async 则未来对象在任务结束之前不会破坏这使得调用在我的情况下不同步 Example void sendMail const std string
Pandas：将数据帧转换为列表字典

我有一个像这样的数据框 col1 col2 A 0 A 1 B 2 C 3 我想得到这个 A 0 1 B 2 C 3 I tried df set index col1 col2 to dict 但这并不完全正确我遇到的第一个问题是 A
在 Ember.js 中所有视图完全渲染后执行一次代码

类似于文档准备就绪但毕竟 Ember 视图渲染我现在正在通过覆盖 ApplicationView didInsertElement 来执行此操作到目前为止似乎有效 App ApplicationView Em View extend
Java中如何获取新的Pointer？

如何从 JNA 调用 C 中具有此方法签名的方法 int open device context ctx device dev int index C 方法的最后两行如下所示 dev pdev return 0 这是唯一的用途dev在那个方
在没有显式 return 语句的情况下返回值

在 JavaScript 中从函数末尾掉落返回undefined 如果你想返回一个值你需要使用显式return陈述至少到目前为止是这样但看起来 ECMAScript 6 至少有时会允许return被省略什么情况下会出现这种情况呢
是否有可能使 WinForms 选项卡控件能够像 IE 或 Firefox 一样进行选项卡重新排序？

是否可以对 WinForms 中的选项卡重新排序TabControl像 IE 或 Firefox 那样在运行时像这样的链接不要给我太多希望当然这是可能的您很可能试图使解决方案变得过于复杂本质上您所要做的就是对标准进行子类化Tab
Java 解压缩使用 zlib deflate 压缩的字符串

正如标题所说如何解压缩使用 zlib deflate 压缩的压缩字符串有解释的可靠方法是什么试试这个这是一个最小的工作示例 package zlib example import java io ByteArrayInputStre
如何以编程方式在 PDF 文件中注入 JavaScript？

如何以编程方式在 PDF 文件中注入 JavaScript 没有 Adob e Professional 可以完成吗我的目标是我想在打开 PDF 时立即显示打印对话框我知道这可以通过嵌入文档中的 JavaScript 代码来完成如果
iOS UIScrollView 取消 UIButton 触摸滚动

我在 UIScrollView 中有一些 UIButtons 但我不想延迟按钮触摸但是一旦滚动视图检测到拖动滚动我想取消 UIButton 触摸并继续 UIScrollView 的滚动我已包括以下内容 scrollView del
new URL(...).openConnection() 是否一定意味着 POST？

如果我创建一个 HTTPjava net URL然后打电话openConnection 上面的内容是否一定意味着将要发生 HTTP post 我知道openStream 意味着 GET 如果是这样如何在不使用原始套接字层的情况下执行其他
如何向我的 C++ 应用程序添加一个简单的 API 以供 LabView 访问？

我有一个用 C Visual Studio 6 0 编写的数据采集程序一些客户希望通过自己的定制软件或 LabView 来控制软件我想提出一个简单的 API 和一个可以分发给他们的 dll 并且想要一些关于如何开始的提示这将是非常基本
Rails Devise current_user 在匹配中未定义？高级路径约束

我收到一个错误NameError undefined local variable or method current user for
是否有与 Stata“order”命令等效的 R 函数？

R 中的顺序类似于 Stata 中的排序例如这是一个数据集仅列出变量名称 v1 v2 v3 v4 v5 v6 v7 v8 v9 v10 v11 v12 v13 v14 v15 v16 v17 v18 这是我期望的输出 v1 v2

是否有与 Stata“order”命令等效的 R 函数？

是否有与 Stata“order”命令等效的 R 函数？ 的相关文章

随机推荐

热门标签

是否有与 Stata“order”命令等效的 R 函数？的相关文章