删除R中的冗余列[重复]

2023-11-23

我有类似的东西：

date        pgm      in.x     logs       out.y
20130514    na       12       j1         12
20131204    z2       03       j1         03
20130516    a01      04       j0         04
20130628    z1       05       j2         05

我注意到 in 和 out 值始终相同，因此我想删除 out.y 列。我还有其他类似的列，我希望能够检测到与 .x 列匹配的任何 .y 列，并在合并后删除它们。

如果我们假设所有列冗余都应该被删除

no_duplicate <- data_set[!duplicated(as.list(data_set))]

会成功的。

as.list将 data.frame 转换为其所有列的列表，并且duplicated将返回那些所有值都与先前看到的列重复的列的索引。

这不会直接尝试比较 .x 和 .y 列，而是保留每个重复列的一个副本，我认为这是主要目标。另一方面，它还将删除与另一个 .x 列重复的任何 .x 列。

如果我们想保留所有 .x 列，即使是重复的列，一个好的解决方案可能是进行过滤before合并。假设你有data_x and data_y将由“标识符”列合并：

data_y_nonredundant <- data_y[!(as.list(data_y) %in% as.list(data_x) & names(data_y)!="identifier")]
data <- merge(data_x, data_y_nonredundant, by=c("identifier"))

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

MERGE

删除R中的冗余列[重复] 的相关文章

将两个单独的功能分支合并到同一个主分支中[重复]

这个问题已经存在了我们正在努力发布 2 个远程功能分支 F2 和 F3 我们如何处理F3来创建发布提案1 简单地合并F3进入开发提案2 第一次合并开发进入F3 包括F2的变化然后合并进入发展这两种方法之间有什么实际差异是否有客观
在构建分数多项式函数时避免 eval(parse())

我的目标是在 R 中编写一个函数它接受 a 的系数分数多项式 http www stata com manuals13 rfp pdf rfpRemarksandexamples FP 并返回一个向量化函数该函数针对给定的输入数字计算指
垂直合并2个数据帧[重复]

这个问题在这里已经有答案了我有 2 个数据框每个数据框有 2 列相同的列名称我想垂直合并它们以最终得到一个新的数据框做的时候 newdf df merge df1 how left on Col1 Col2 新的 df 仅包含以下
基于列名称的字符向量的子数据框[重复]

这个问题在这里已经有答案了菜鸟问题提前感谢您的耐心我有一个数据框 vals lt c 1 1 1 1 testdf lt data frame var1 vals var2 vals var3 vals 我有一个变量名称的字符向量 v
在 Rlattice xyplot 上分别控制轴刻度和轴线

我怎样才能去除周围的盒子xyplot 同时保留轴刻度刻度线本着爱德华塔夫特 Edward Tufte 极简主义数据图形美学的精神这些轴线是非数据墨水并且可以应该被擦除 library lattice my df lt dat
零膨胀泊松分布：无法估计参数，错误代码为 100

以下是我正在研究的一种数据集 data lt c 0 1 0 11 2 0 3 0 0 2 1 3 1 0 1 0 0 0 2 3 0 0 0 8 1 1 1 0 1 1 2 7 0 0 0 5 2 3 6 1 1 5 2 9 0 0 1
如何在 R 中解析堆叠多个 JSON 的文件？

我在 R 中有以下堆叠 JSON 对象 example1 json ID 12345 Timestamp 20140101 Usefulness Yes Code event1 A result 1 ID 1A35B Timestamp
dplyr +“meta”-columns：当列包含要使用的其他列的名称而不是数据时

我想知道以下问题在 dplyr 中是否有一个优雅的解决方案要提供一个简单的可重现示例请考虑以下 data frame df lt data frame a 1 5 b 2 6 c 3 7 ref c a a b b c stringsA
如何在 R 中“推断”面板数据的值？

我有一个带有 NA 值的面板数据如下所示 uid year month day value 1 1 2016 8 1 NA 2 1 2016 8 2 NA 3 1 2016 8 3 30 4 1 2016 8 4 NA 5 1 2016
R：中断 for 循环

你能确认下一个break是否取消了内部for循环吗 for out in 1 n old id velho lt old table df id out for in in 1 n id novo lt new table df ID in
为什么在 data.frame 中预先指定类型会比较慢？

我预先分配了一个大 data frame 以便稍后填写我通常这样做NA是这样的 n lt 1e6 a lt data frame c1 1 n c2 NA c3 NA 我想知道如果我预先指定数据类型是否会让事情变得更快所以我测试了 f1
如何从R中串扰的filter_select中删除（全部）？

我遵循图 16 7 的示例https plotly r com client side linking html https plotly r com client side linking html并且无法弄清楚为什么有一个名为全部的
无效的命令名称“tk_chooseDirectory”错误

我使用 bioconductor 进行 WES 管道并使用 tk choose dir 选择用户存储输入文件的目录并将其存储以供进一步使用这里是命令行 library tcltk dataDir lt dirname tk choos
r：按多列分组并计数

我有以下数据框 df LeftOrRight SpeedCategory NumThruLanes R 25to45 3 L 45to62 2 R Gt62 1 我想按速度类别对其进行分组并循环遍历其他列以获取每个速度类别中每个唯一代码的
如何更改 r 中的树状图标签

我在 R 中有一个树形图它基于使用 hclust 的分层聚类我正在对不同颜色的标签进行着色但是当我尝试使用以下命令更改树图的标签集群所基于的数据帧的行时dendrogram dendrogram gt set labels dat
使用 roxygen2 导入两个同名函数

我是 CRAN 包的维护者在加载时收到以下消息 checking whether package qdap can be installed 10s 10s WARNING Found the following significant
在防风草模型上使用 VIP 包计算重要性度量

我正在尝试使用 vi firm 在防风草中制作的逻辑回归模型上计算特征重要性对于正则表达式我将使用 iris 数据集并尝试预测观察结果是否为 setosa iris1 lt iris gt mutate class case when
R：（中缀）运算符的两个定义之间的冲突：如何指定包？

在 R 中每当两个包定义相同的函数时很容易指定要使用哪个包pkg foo 但是当冲突的功能是一个时你该怎么办 infix运算符即使用定义举个例子两者ggplot2 and crayon define 有没有一种方法可以让我默认
行方向变异的有效方法

我有两个数据框 dfUsers and purchases使用以下代码生成 set seed 1 library data table dfUsers lt data table user letters 1 5 startDate sam
XLConnect 无法确定 JAVA_HOME 错误

感谢您的帮助我正在尝试运行 XLconnect 但收到此错误消息 gt library XLConnect lib loc C Users 1144143929 Documents R win library 2 15 Error onL

随机推荐

有没有适用于 iOS 的 unrar 库？

我想在我的 iPhone 应用程序中包含 unrar 文件选项我已经尝试过了https github com ararog Unrar4iOS但这个库并不完整有些功能尚未实现例如 BOOL unrarFileTo NSString p
反向代理背后的 HTTP/2

到目前为止所有教程都告诉我我需要在服务器上启用 SSL 才能支持 HTTP 2 在给定的场景中我们在后端 Tomcat Jetty 服务器前面有 nginx 尽管从性能角度考虑值得在后端启用 HTTP 2 但在那里也拥有 HTTPS
HTTP GET 和 POST 参数建议

发出以下 POST 请求是否是不好的做法 test a 1 b 2 POST data c 3 d 4 请注意 2 个参数是 URL 的一部分 2 个参数是 POST 内容的一部分另一方面仍然建议遵循以下规则 GET 请求从中检索内容
Tensorflow：对小批量中的每个样本使用不同过滤器进行卷积

我想要一个带有过滤器的二维卷积该过滤器取决于张量流中小批量中的样本有什么想法可以做到这一点特别是在每个小批量的样本数量未知的情况下具体来说我有输入数据inp形式的MB x H x W x Channels 我有过滤器F形式的MB
是否可以从 C# 中调用用户定义（自定义）R 函数？

是否可以从 C 中调用用户定义自定义 R 函数例如用 R 编写的简单矩阵乘法函数 matrix mult function a b c a b return c 我怎样才能从c 调用这个R函数matrix mult a b 经过一番研
将浮雕添加到navigationItem.titleView中的UILabel（如navigationItem.title所示）

我试图模仿自动应用于 navigationItem title 以及许多其他 UIKit 控件的默认浮雕如该屏幕截图的标题表格单元格所示 source quicksnapper com 我本质上是想向 navigationItem t
HttpContext 和 SignalR HubCallerContext 之间的统一静态类

我有很多依赖于 HttpContext Current 的代码我注意到来自 SignalR 集线器的请求HttpContext Current null 所以我的代码中断了例如 HttpContext Current Request I
为远程托管的 SQL Server 定义连接字符串

目前我有以下内容
C# 将一个目录与另一个目录合并

我有一个自动更新程序 C 程序它将下载一个 rar 文件其中包含用于更新某些软件的更改或新文件 rar 文件的结构与软件的基本目录类似但仅包含已更改或新的文件文件夹有没有一种简单的方法可以将这些文件文件夹合并到目标目录这样
CruiseControl.NET 电子邮件发布者问题

我想将 ccnet 设置为每次构建后向提交者发送邮件无论状态如何当构建中断或修复时向所有其他开发人员发送邮件随着 CCNet 的每个新版本电子邮件发布者都会被重构并且据说有所改进但我仍然遇到同样的问题只有提交者会收到通知
投影 topojson 的方法？

给定一个形状文件自然地球 ne 10m admin 0 sovereignty zip 鉴于我们想要将其重新投影为 D3js 数据可视化我们可以在不同级别重新投影 1 获取重新投影的形状文件 1 使用ogr2ogr ogr2ogr f
dockerize 一个 wpf 应用程序并使用它

我正在尝试对 wpf 应用程序进行 dockerize 当时只是一个简单的应用程序现在我得到了这个 dockerfile FROM microsoft nanoserver WORKDIR C run PATH ENTRYPOINT C
如何在WinForms中制作ownerdraw Trackbar

我正在尝试制作一个带有滑块拇指自定义图形的轨迹栏我从以下代码开始 namespace testapp partial class MyTrackBar System Windows Forms TrackBar public MyTrac
PHP 确定多个（n）日期时间范围何时相互重叠

我正在努力解决以下问题这是一个日历程序给定多个人的一组可用日期时间集我需要找出每个人在 PHP 中可用的日期时间范围可用性集 p1 start 2016 04 30 12 00 end 2016 05 01 03 00 p2 sta
如何检测用户的区域设置以获得正确的 csv 分隔符？

我有一个简单的数据转换工具它可以生成的输出之一是 csv 文件这在英国非常有效但当我将其运送给德国客户时我遇到了一些问题具体来说他们使用表示浮点数中的小数点反之亦然这意味着当他们在 Excel 中打开数据文件时结果至少可
如何使用四开同时编织两种格式？

是否可以通过在 YAML 标头中指定来一次从 Quarto R Markdown 文档创建多种输出格式我的猜测没有成功 title Stacked Area chart with Annotations format html gfm 尝
jqGrid - rowObject 不一致？

带有 jqgrid rowObject 的第一页结果返回预期数据但随后返回后续结果页的不完整数据为什么结果第一页 rowObject 3 将等于 2 结果的后续页面 rowObject 3 将等于未定义并且返回结果的第一页现在也将
可选参数和继承

我了解可选参数并且非常喜欢它们但我想更多地了解如何将它们与继承的接口一起使用附件A interface IMyInterface string Get string Get string str class MyClass IMyIn
Amazon API Gateway：通过 Postman 调用 API 时，响应正文未转换？

通过 AWS API Gateway 控制台执行测试时我发现 Lambda 函数的输出响应已正确转换 type message request id 请参阅下面的日志 Tue Sep 06 14 46 06 UTC 2016 Endpoi
删除R中的冗余列[重复]

这个问题在这里已经有答案了我有类似的东西 date pgm in x logs out y 20130514 na 12 j1 12 20131204 z2 03 j1 03 20130516 a01 04 j0 04 20130628

删除R中的冗余列[重复]

删除R中的冗余列[重复] 的相关文章

随机推荐

热门标签