从两个向量创建新的 ID（双向）

2023-12-28

我在一个由因子组成的数据框中有两个向量（每个向量中有约 10000 个唯一因子）。

这是我的数据的简化示例：

tg<-data.frame(A=sample(letters[1:5],30,replace=TRUE),
               B=sample(letters[1:5],30,replace=TRUE))
   A B
1  b b
2  a b
3  e e
4  c b
5  e e
6  a b
7  d a
8  d a
9  d b
10 a e
11 a e
. . .

我想组合（按行）两列中的元素并创建一个新的 ID。

一种方法是将两列简单地粘贴在一起：

paste0(tg$A,tg$B)
[1] "bb" "ab" "ee" "cb" "ee" "ab" "da" "da" "db" "ae"
"ae" "bc" "ae" "bb" "ec" "ba" "dd" "de" "cd" "eb" "cd"
"db" "dc" "ab" "ae" "cc" "dc" "ce" "eb" "ea"

But我想创建将“ab”和“ba”视为相同的新ID，我该怎么做？

编辑：对于令人困惑的标题感到抱歉，我找不到任何更好的方法来解释该问题（因此无法找到任何解决方案 - 如果这里已经有一个解决方案）。

对您的 ID 中的字母进行排序将解决该问题（如下这个问题 https://stackoverflow.com/questions/5904797/how-to-sort-letters-in-a-string-in-r):

strSort <- function(x)
     sapply(lapply(strsplit(x, NULL), sort), paste, collapse="")
unique(sapply(new_ids, strSort))
 [1] "be" "bd" "bc" "ae" "aa" "ab" "ad" "cd" "ac" "dd" "ee" "ce" "cc" "de"

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

DataFrame

从两个向量创建新的 ID（双向）的相关文章

使用具有多个元素的字典过滤数据框

我已经尝试了几个小时来在这里找到答案但我无法在我的特定情况下找到任何答案我能找到的最接近的是使用字典将多个字符串包含过滤器应用于 pandas 数据框 https stackoverflow com questions 4338916
展平 ggplot2 中的 alpha 通道

ggplot2 的某些对象函数支持 alpha 通道 http docs ggplot2 org current geom point html http docs ggplot2 org current geom point html
ggplot2 的组合图（不在单个图中），使用 par() 或 layout() 函数？ [复制]

这个问题在这里已经有答案了我一直在考虑使用 par 或 layout 函数来组合 ggplots 可以使用这些功能吗假设我想绘制 ggplot 散点图和 ggplot 直方图我想将这两个地块合并起来而不是在一个地块中是否适用我在
Pandas DataFrame - 列 whos dtype=='category' 上的聚合导致性能下降

我使用内存使用量较高的大数据帧并且我读到如果更改重复值列上的数据类型我可以节省大量内存我尝试了一下确实内存使用量下降了 25 但随后我遇到了我无法理解的性能缓慢问题我对 dtype 类别列进行分组聚合在更改 dtype 之前
Python DataFrame：将一列转置为多列

我有一个如下所示的数据框 df pd DataFrame month 2017 09 27 2017 09 27 2017 09 28 2017 09 29 Cost 100 500 200 300 我怎样才能得到这样的 df 2017 0
data.frame 按列分组[重复]

这个问题在这里已经有答案了我有一个数据框 DF 说 DF 是 A B 1 1 2 2 1 3 3 2 3 4 3 5 5 3 6 现在我想将 A 列的行组合在一起并得到 B 列的总和例如 A B 1 1 5 2 2 3 3 3 11
使用梯度下降（最速下降）估计线性回归

示例数据 X lt matrix c rep 1 97 runif 97 nrow 97 ncol 2 y lt matrix runif 97 nrow 97 ncol 1 我已经成功创建了成本函数 COST lt function th
在 RStudio 控制台中显示西里尔字母

我在 Rstudio 控制台中显示俄语字符时遇到问题我使用 readxl 包加载带有俄语的 Excel 文件西里尔字母在数据框中正确显示但是如果我运行一个输出包含变量名称的函数 RStudio 控制台将显示符号而不是正确的西里尔字符
为闪亮的应用程序创建桌面图标

当我在基本 R 提示中提供以下代码时我会在浏览器中打开一个闪亮的应用程序 shiny runApp C Myapp 我使用 Windows 7 我试图创建一个桌面图标以避免我的客户每次想要使用该应用程序时都键入上述代码我创建了一个桌面
corr.test 与 cor.test p 值

我正在尝试使用 psych 包 psych 1 6 9 中的 corr test 但在使用 method spearman 时它似乎给出了与 cor test 不同的 p 值相关系数相同但 p 值不同我整理了一些示例代码和输出如下
没有垂直线的直方图

当我创建直方图时它看起来很像这样 set seed 1 x lt 1 100 y lt x rnorm 50 y round y hist y Is there a way to make a histogram look a bit l
Sweave 缓存包

我正在尝试编写一份报告我的问题是每次我编译 R 时都会加载我在报告中使用的包如 ggplot2 MASS cubature 这是非常耗时的有没有办法查包裹 I found 缓存编织但它不起作用这是我在 sweave 文件中添加的块
R：使用 as.formula 修复模型中的模型调用

我有一个gls模型其中我将公式来自另一个对象分配给模型 equation lt as formula aic obj row model gt equation temp avg I year 1950 mod1 lt gls equ
如何在shell脚本中运行R代码？

我有一个 R 文件 myfile R 我想使用 shell 脚本来运行它我怎样才能做到这一点我试过这个 bin bash Rscript myfile R 但它给了我这个错误 Rscript 找不到命令我也尝试过这个 bin bash
根据感兴趣的特定单词绘制高度相关的单词[关闭]

Closed 这个问题需要细节或清晰度 help closed questions 目前不接受答案我正在尝试绘制一个单词的最高相关性例如我想绘制鲸鱼一词的最高十个相关性的图表有人可以帮我执行类似的命令吗如果有帮助的话我已经安装
是否可以在 R 中创建自定义 pch 形状？

R 中的许多绘图函数都使用图形参数pch指定数据点的形状根据R 文档 https www rdocumentation org packages graphics versions 3 6 2 topics points 有 26 个矢量
根据第二个数据帧中的匹配创建新列

如果有两个数据框 top3df http dpaste com 1709875 and qw qw lt structure list id structure 1 25 Label c w01 w02 w03 w04 w05 w06 w0
R/ggplot2：如何匹配重叠区域图中的图例和绘图颜色？

我有两个面积图称为蓝色和绿色其中green大部分是在blue情节但在极少数点上它高于blue阴谋我想使用透明度说alpha 0 2对于两者并且还能够为每个指定颜色我现在的问题是自从green情节主要是在blue地块其
在ggplot2中添加水平线到绘图和图例

这段代码创建了一个漂亮的图但我想在 y 50 处添加一条水平黑线并让图例显示一条黑线并在图例中显示文本 cutoff 但在图例中保留源点我可以使用 geom line 添加该行但无法在图例中获取该行 library ggplot2
R 中的微秒时间戳

在 CSV 文件中我有几列其中一列有时间戳其中每个时间戳是今天午夜经过的微秒每个 csv 文件仅包含一天内的数据因此这并不含糊我的问题是如何将这些微秒时间戳解析为 R 多谢我的 CSV 文件的一部分 34201881666

随机推荐

如果它是锁中的最后一条语句，则覆盖锁对象是否不好？

我已经见过几次了但我不确定它是否真的不正确考虑以下示例类 class Foo List
aws lambda webpack 生成的文件

我正在尝试使用通过 webpack 生成的处理程序部署 aws lambda 函数这是最终的 webpack 文件为了便于理解我删除了大部分标准 webpack 代码 function modules webpackBootstrap
Firebase 云消息传递无法与 Samsung Internet 配合使用

我正在设置 Firebase Cloud Messaging 以在网络上推送通知它可以工作但到目前为止仅适用于 Chrome Windows 和 Android 和 Firefox Android 它无法在 Samsung Intern
从复选框列表中删除项目

这是主要形式
IOError: [Errno 2] 没有这样的文件或目录: 'README.md'

当我尝试使用 pip 安装omnature 时收到以下错误 IOError Errno 2 No such file or directory README md 我基本上是在尝试连接到 Adob e Analytics API 有人能帮
Ruby：是否可以设置通过字符串命名的实例变量的值？

不确定这种模式叫什么但场景如下 class Some this class has instance variables called thing 1 thing 2 etc end 有没有什么方法可以设置实例变量的值其中实例变量名称是
是否可以在 iOS 上发送 SILENT LOCAL 通知

My app wakes up从暂停模式开始静音遥控器来自服务器的通知正是我想要的该服务器发送带有的推送通知内容可用 1 它完成了这项工作现在我想在没有服务器帮助的情况下执行此操作所以我想发送本地无声通知来自应用程序将来的某
将值从 MSBuild 任务传递到 TFS 构建工作流程

有许多示例和方法可以将属性值从 TFS 2010 构建工作流传递到 MSBuild 但我需要执行相反的操作基本上在构建盒上编写了自定义目标文件以对盒上运行的所有构建进行一些处理这些目标文件中包含自定义任务其中一些任务公开返回值或
尝试在 rake 任务中启动 redis 和 resque 调度程序

我想从 rake 任务启动 redis 和 redis scheduler 所以我正在执行以下操作 namespace raketask do task start do system QUEUE rake resque work syst
在 Unix 中的邮件中附加 2 个以上文件

我有很多文件需要附加并通过电子邮件发送我正在运行脚本来执行此操作你能帮我写代码吗您可以使用选项 a of mailx多次例如 mailx s Few files attached a file1 txt a file2 txt em
IE 中的 window.location 问题

我有这个简单的代码可以在每个浏览器中正常工作但不能在 IE 每个版本中工作 window setTimeout window location http www domain modules yobilab copyright cla
在 iOS 应用程序中使用现有的系统声音 [swift|

是否可以在我自己的应用程序中使用现有的Apple系统声音我想用 Swift 编写一个示例应用程序执行以下步骤读取获取设备上所有可用系统声音的列表我认为它们位于 System Library Audio UISounds 在屏幕上显
宏定义冲突

我遇到了这个问题这与宏函数无关只是简单的字符串值宏替换我有两个头文件 test1 h define TEST 123 test2 h define TEST 456 现在我有一个程序包含这两个标头但我希望我的实际 TEST 为 12
将雪（和降雪）与 AWS 结合使用，在 R 中进行并行处理

相对于我之前的类似的问题 https stackoverflow com questions 7241244 using aws for parallel processing with r 我尝试在AWS上使用snow snowfall进
.NET 4.5 中的序列化中断

我们遇到了一个仅在 NET 4 5 中发生的序列化问题相同的代码在 NET 4 中工作正常我们正在尝试使用一些字段序列化继承类型基类和继承类都标记为可序列化属性我们在 Web 服务的客户端收到一个异常说有一个方法访问异常在服务器端
用于模糊字符串比较的好 Python 模块？ [关闭]

Closed 这个问题是基于意见的 help closed questions 目前不接受答案 Locked 这个问题及其答案是locked help locked posts因为这个问题是题外话但却具有历史意义目前不接受新的答案或互动
Wagtail：如何将模型实例传递给小部件并在模板中访问它

我有一个基于 Wagtails 的模型Page模型我正在将自定义小部件分配给模型字段之一渲染管理视图时是否可以在小部件 HTML 模板中访问模型实例我需要管理视图中的小部件来知道哪个 IDSimplePage该小部件所属即获取值 p
OSX Mavericks - 不再安装 BIND...如何使本地 DNS 服务器正常工作？

我一直在 OSX 上使用 BIND 为我的本地开发机器提供本地 DNS 解析器特别是为了方便虚拟机访问我的本地开发环境愚蠢的是我决定连夜升级到 OSX Mavericks 但似乎不再安装 BIND 即使添加了命令行开发人员工具有人建
clang 尝试捕获失败

这是我所说的代码部分 try std cerr lt lt first try lt lt std endl po store po parse config file ifs configFileOptions false vm catc
从两个向量创建新的 ID（双向）

我在一个由因子组成的数据框中有两个向量每个向量中有约 10000 个唯一因子这是我的数据的简化示例 tg lt data frame A sample letters 1 5 30 replace TRUE B sample lette

从两个向量创建新的 ID（双向）

从两个向量创建新的 ID（双向） 的相关文章

随机推荐

热门标签

从两个向量创建新的 ID（双向）的相关文章