检查一个数据帧是否是另一个数据帧的重新排序[重复]

2024-03-12

我有两个在两个不同场合生成的数据帧，但我怀疑它们是相等的。两者具有相同的行数和列数，从视觉上看它们似乎是相同的，除了行的排序方式不同。

两者都没有可以重新排序的 ID 列，我能做的最好的事情就是通过process_number变量，这是我能得到的最接近唯一列的变量。然而，即使在重新排序之后identical yields FALSE and all.equal给了我这个（总结）：

 [1] "Component 2: 32 string mismatches"
[16] "Component 18: 'is.NA' value mismatch: 183357 in current 183357 in target"
[23] "Component 27: Mean relative difference: 0.4688722"
[24] "Component 28: Mean relative difference: 0.0004968944"
[26] "Component 30: Attributes: < Component 2: 365 string mismatches >"
[28] "Component 31: 'current' is not a factor"

对于这些情况，我发现的最佳选择是使用“compare”包：

library(compare)
compare(df1, df2, allowAll = TRUE)

The allowAllargument 尝试不同的转换（例如，对行重新排序、对列重新排序、将列类型从因子更改为字符等），然后给出不同转换后两个输入是否相同的摘要。如果应用转换后它们相同，它会告诉您需要进行哪些转换才能使它们相同。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

检查一个数据帧是否是另一个数据帧的重新排序[重复] 的相关文章

R testthat 单元测试数据和辅助函数约定

我正在编写一个 R 包并使用 testthat 进行单元测试我的许多单元测试都是为了测试适用于我的包特定对象的功能对于这些测试我创建了一个辅助函数来设置模拟对象我还有一些其他辅助函数来减少单元测试中的代码量目前这些辅助函数在我的
通过删除连续的重复项来减少字符串长度

我有一个包含 2 个字段的 R 数据框 ID WORD 1 AAAAABBBBB 2 ABCAAABBBDDD 3 我想通过仅保留字母而不是重复中的重复项来简化具有重复字母的单词 e g AAAAABBBBB应该给我AB and ABCAA
如何在environment.yml中安装CRAN包

我正在使用 miniconda 来管理数据科学包的安装这是我现在已经建立的工作流程所以我希望它也能在这种情况下工作我也认为它可以工作因为它应该在这样的情况下有所帮助比纯 python 需要更多的依赖项我想安装pythonCDT工
获取行名以 ABC111 开头的所有行

我们有以下数据框 col1 col2 col3 ABC111001 12 12 13 ABC111002 3 4 5 ABC000111 7 6 1 ABC000112 9 23 1 如何获取行名以开头的所有行ABC111 如下 ABC1
如何拆分 data.frame -> 将合并应用于子集 -> 合并到 data.frame 中

我真的不知道如何在不使用 for 循环的情况下实现这一目标 x lt c a b c d gt x 1 a b c d data lt data frame x c a b a b c a a b c d name c one one tw
R.scale() 和 sklearn.preprocessing.scale() 之间的区别

我目前正在将数据分析从 R 转移到 Python 当在 R 中缩放数据集时我将使用 R scale 根据我的理解它将执行以下操作 x mean x sd x 为了替换该函数我尝试使用 sklearn preprocessing sca
将具有多个时区的 pandas 列转换为单个时区

Problem 我在 pandas DataFrame 中有一个列其中包含带有时区的时间戳此列中有两个不同的时区我需要确保只有一个这是该列末尾的输出 260003 2019 05 21 12 00 00 06 00 260004 2
为“facet_wrap”中的每列创建边框和标题

我想在每个方面周围放置带有标签和标题的黑色边框facet wrap 与此类似的东西样本数据 library tidyverse mtcars gt mutate gear factor gear levels c 4 3 5 gt ggp
如何更改数据表中的少数列名称

我有一个包含 10 列的数据表 town tc one two three four five six seven total 需要生成我正在使用的列一到总计的平均值 DTmean lt DT lapply SD mean by t
替换向量中非 %in% 向量的值

简短的问题我可以像这样替换某些变量值 values lt c a b a b c a b df lt data frame values 将 df values 的所有值替换为 x 其中值是neither a 或 b 输出应该是 c a
在多线程环境中，Collections.sort 方法有时会抛出 ConcurrentModificationException。列表没有进行结构性修改

package CollectionsTS import java util ArrayList import java util Collections import java util HashSet import java util
将数值数据更改为分类数据 - Pandas [重复]

这个问题在这里已经有答案了我有一个 pandas 数据框其中有一个数字列金额金额从 0 到 20000 不等我想将其更改为定义范围的分类变量因此分类变量将是 0 1000 之间 1000 2000 美元之间依此类推直到 1
dmvnorm MVN 密度 - RcppArmadillo 实现比 R 包慢，包括一些 Fortran

The solution现已上线RCPP画廊 http gallery rcpp org articles dmvnorm arma 我从 RcppArmadillo 中的 mvtnorm 包重新实现了 dmvnorm 我有点喜欢犰狳但我
Java中如何对对象数组进行排序？

我的数组不包含任何字符串但它包含对象引用每个对象引用都通过 toString 方法返回名称 id 作者和发布者 public String toString return name n id n author n publisher n
R dplyr过滤多列上的字符串条件

我有一个 df 例如 df lt read table text v1 v2 v3 v4 v5 1 A B X C 2 A B C X 3 A C C C 4 B D V A 5 B Z Z D header T 如果变量 v2 到 v5
使用 RMySQL 会干扰 RPostgreSQL

我有一个 R 脚本我想从 MySQL 数据库中提取一些数据然后从 PostgreSQL 数据库中提取一些数据但是从 RMySQL 加载 MySQL 驱动程序会阻止我从以下位置加载 PostgreSQL 驱动程序 PostgreSQL
R：为什么 kable 不在 for 循环内打印？

我正在使用 rmarkdown 和 Latex 编写报告我需要使用打印一组表格knitr kable 但在 for 循环内时不会打印这是我的代码 title project title author Mr Author date 201
字边界正则表达式问题

我在使用单词边界时遇到问题 b在我的正则表达式中我正在使用 R 但当我尝试时问题也存在http regexr com http regexr com 我使用的模式是 bs l b 虽然我预计下面的第 1 行和第 3 行能够匹配此模式但只
列槽不足

当尝试为 data table 中的每个变量 108 个变量创建 12 个滞后时我收到一条错误指出列槽不足此操作应创建大约 1200 个变量或列 Data A as data table Datos A Varnames names
计算 R 中数据帧的每一行中特定值的连续出现次数

我有一个data frame许多位置这么多行的变量的每月值我想计算值为零的连续月份即连续单元格的数量如果只是从左到右阅读这很容易但增加的复杂性是年底与年初是连续的例如在下面的缩短示例数据集中用季节而不是月份位置 1

随机推荐

装饰器可以装饰递归函数吗？

我想看看两种计算斐波那契数列的方法之间的时间成本差异首先我创建了一个装饰器将输出时间成本函数添加到函数中 def time cost func def wed n start time time func n stop time
SQL依赖+服务代理

我正在使用 SqlDependency 在某些表中的数据发生更改时获取通知 private void subscribeBroker using var conn new SqlConnection connString conn Open
在Python中使用curses和raw_input

在我的Python Linux控制台应用程序中我使用curses来处理数据的显示同时我希望有一个输入行来输入命令几乎是良好的 ol irssi 风格使用默认的curses getch 我必须做大量的编码才能获得raw input函
如何使 clang-format 尊重“类似表格”的代码格式

我的代码具有按列对齐的数据或参数表如下所示人为的简单示例实际代码具有更大的表 Name Size Starting val S s Dubs abc 123 X n m YZ ij q kl Name Size Starting va
建议的解决方案：在分布式环境中生成唯一 ID

我一直在浏览网络试图找到一种解决方案使我们能够在区域分布式环境中生成唯一的 ID 我查看了以下选项除其他外雪花推特这似乎是一个很棒的解决方案但我只是不喜欢仅仅为了创建 ID 而必须管理另一个软件所带来的额外复杂性现阶段缺乏文
Microsoft Word 中的 docx“文件已损坏”错误

我写了一个程序它打开docx包并更改一些
使用 Java 与 MySQL 服务器的 SSL 连接

我正在尝试使用 Java over SSL 连接到 MySQL 服务器我收到以下异常 com mysql jdbc exceptions jdbc4 MySQLNonTransientConnectionException Cannot
Docker compose 和外部镜像多阶段构建

I use Docker 多阶段构建 https docs docker com develop develop images multistage build 具体来说使用外部图像作为舞台当使用多阶段构建时您不限于从您之前创建的
CLion C++ 无法读取/打开项目目录中的 .txt 文件

我的项目目录中有一个我创建并填充了数据的 txt 文件目录结构如下 Users asd ClionProjects ProjectWithTemplates main cpp cmake twoday txt 这是我的代码 include
强制 UIImageView 的 CABasicAnimation 顺时针/逆时针旋转

我正在制作一个钟摆的动画该钟摆从 0 度摆动到最大 200 度然后再返回问题是如果摆超过 180 度它会通过最短路线返回到 0 度即继续顺时针旋转我希望它逆时针旋转这是我的代码 right 是一个布尔值当钟摆从左向右摆动时
数据库查询生成器 toArray() laravel 4

我正在尝试使用该方法将查询转换为数组toArray 但它不适用于查询生成器有什么转换的想法吗 Example DB table user gt where name Jhon gt get gt toArray 如果您更喜欢使用查询生成器
使用 R/ggplot2 损坏的条形图[重复]

这个问题在这里已经有答案了当存在一些极端计数时我在缩放条形图时遇到困难当它上升得更高时很难看到较低的计数并在绘图上比较它们我想打破条形图以重新调整它的比例我知道重新调整比例是不好的绘图但我只想在需要时这样做我在附加链接中找到
当用户跳过其中一个edittext并在下一个edittext上输入数据时如何提示错误？

在此我有八个edittext 如果用户在edittext1处输入输入则会跳过edittext 2并在edittext 3中输入数据我需要向用户提示错误并且try块内的else部分不会被执行在哪里我错了我该如何纠正这个逻辑错误 pac
从 Uri 类型 android 创建文件

我正在尝试从图库中选择图像然后将此图像转换为文件并通过 HttpPost 发送但我总是FileNotFoundException 这是我的代码选择照片 public void onActivityResult int requestC
如何在 Flutter CustomPainter 中使用贝塞尔曲线绘制形状

我正在尝试使用 flutter customPainter 库绘制下面的图片我怎样才能画出这个形状我的代码和结果 import package flutter material dart class CurvePainter exten
Xamarin SOAP Web 服务

我在 Xamarin 中创建了一个便携式库项目我想添加 Web 服务但框架区域已关闭这是什么原因呢有没有人遇到过同样的问题过期网址 111 111 11 11 8013 Services Kurum IdentityMngmnt
scala - 激发 Dataframe 的结果集

我正在查询 mysql 表 val url jdbc mysql XXX XX XXX XX XX compute 1 amazonaws com 3306 pg partner val driver com mysql jdbc Driv
AWS DynamoDB 查询不过滤 BOOL 值

我有一个使用 GUI 创建的用户表并给出了电子邮件分区键它是一个字符串然后我使用 aws lambda 来做一个 putItem 它有 email string email protected cdn cgi l email prot
嵌入模板上的任何指令均未使用属性绑定 ngif

我正在 Angular Angular2 RC4 中创建一个简单的应用程序但我发现很难在 Nodejs 中使用实时服务器运行该应用程序我想帮助您了解如何解决 Chrome 控制台中出现的错误 Chrome 控制台出错 browser a
检查一个数据帧是否是另一个数据帧的重新排序[重复]

这个问题在这里已经有答案了我有两个在两个不同场合生成的数据帧但我怀疑它们是相等的两者具有相同的行数和列数从视觉上看它们似乎是相同的除了行的排序方式不同两者都没有可以重新排序的 ID 列我能做的最好的事情就是通过process

检查一个数据帧是否是另一个数据帧的重新排序[重复]

检查一个数据帧是否是另一个数据帧的重新排序[重复] 的相关文章

随机推荐

热门标签