显示在合并中丢失的观察结果

2023-12-26

假设我想通过两列的键合并两个不同的数据帧。

Dataframe One 有 70000 个 obs，共 10 个变量。 Dataframe Two 有 4500 个 obs，共 5 个变量。

现在，我使用此代码检查了新数据框中的观察结果是如何留下的。所以我意识到我的数据帧 Two 中的列现在只有 10 个变量的 4490 个 obs。没关系。我的问题是：有没有办法把我在这个过程中丢失的数据帧二中的 5 个观察结果还给我。名字就足够了。

谢谢：）

我想你可以使用dplyr::anti_join为了这。从它的文档来看：

返回 x 中 y 中没有匹配值的所有行，仅保留 x 中的列。

你可能必须传递你的数据框TWO as x.

编辑：正如评论中提到的，其语法by说法不同。

Example:

df1 <- data.frame(Name=c("a", "b", "c"),
                  Date1=c(1,2,3),
                  stringsAsFactors=FALSE)

df2 <- data.frame(Name=c("a", "d"),
                  Date2=c(1,2),
                  stringsAsFactors=FALSE)

> dplyr::anti_join(df2, df1, by=c("Name"="Name", "Date2"="Date1"))
  Name Date
1    d    2

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

DataFrame

dataTable

显示在合并中丢失的观察结果的相关文章

jquery datatable ajax 无数据可用 mvc

我有一张桌子是在 document ready功能我还使用 jQuery DataTables 插件由于某种原因当页面加载时 ajax 调用控制器并返回数据并将其设置为我的网格所有获取的数据但是尽管所有数据都加载到数据表中但仍获取
重新分配唯一值 - pandas DataFrame

我在尝试着assign unique值在pandas df给特定的个人 For the df below Area and Place 会一起弥补unique不同的价值观jobs 这些值将分配给个人总体目标是使用尽可能少的个人诀窍在于这
如何动态访问数据帧列表中的特定属性

我有一个数据它是数据框的列表我正在尝试访问列表中每个数据帧内的特定属性可以提取特定属性DP UniqueId使用下面的代码 gt attr new data A AA SpotfireColumnMetaData DP UniqueI
在Python中创建一个新表

我正在尝试从数控机床中提取数据事件每毫秒发生一次我需要过滤掉一些用管道分隔的变量分隔符 PuTTy exe 程序生成的日志文件我尝试阅读熊猫但列不在同一位置 df pd read table data log sep 日志文件的一
使用函数参数作为 R 中新数据框的名称

这很简单但我已经搜索并未能找到这个小问题的解决方案我想使用函数的参数作为新数据框的名称例如 assign dataset lt function dataname x lt c 1 2 3 y lt c 3 4 5 dataname
Scala：如何获取数据框中的行范围

我有一个DataFrame通过运行创建sqlContext readParquet 文件的一个 The DataFrame由 300 M 行组成我需要使用这些行作为另一个函数的输入但我想以较小的批次进行操作以防止 OOM 错误目前
当我使用日期时间索引时添加到数据框

我试图获取它以便当我循环遍历一系列事物时我可以将特定日期从每个仓库收到的数量添加到数据框中当我尝试以下操作时它不起作用 if inv prod not in self inventory columns add row in sel
将矩阵 csv 数据导入 R - 如何转换为数据框

我有一组以矩阵格式保存的 csv 数据附图是矩阵的示例 https i stack imgur com kTIN6 png我想将数据加载到 R 中并将其存储为包含 x Year x Death x ASMR 的数据框我怎样才能做到这一点
以最小的内存占用拆分大型 Pandas 数据帧

我有一个大的 DataFrame 我想将其分成一个测试集和一个用于模型构建的训练集但是我不想复制 DataFrame 因为我已达到内存限制是否有一个类似于 pop 的操作但对于一个大段它会同时删除 DataFrame 的一部分并允
使用滚动标准差检测 Pandas 数据框中的异常值

我有一个用于快速傅立叶变换信号的数据帧一列表示以 Hz 为单位的频率另一列表示相应的幅度我读过几年前发表的一篇文章您可以使用一个简单的布尔函数来排除或仅包含最终数据框中高于或低于几个标准差的异常值 df pd DataFrame D
DataTable - 延迟加载 Primefaces 显示错误

我将 JSF2 0 与 PrimeFaces 3 1 和 Spring 3 1 一起用于业务逻辑我试图使用 DataTable 延迟加载但它给了我以下错误请帮忙发生错误 by zero Stack Trace java lang A
从 `.` `data.table` 导入，以便 lintr 识别它

跑步时lintr https github com jimhester lintr在 R 函数上使用data table我收到以下警告 warning no visible global function definition for Di
在 pandas 数据框中搜索字符串列表并将每个搜索字符串添加到新列

我有一个带有文本列描述的数据框我有一个搜索字符串列表 search FR 001 FR 002 FR 003 FR 004 我想使用搜索列表中的字符串搜索数据框我用了 df loc df Description str contai
将函数应用于可返回多行的 pandas DataFrame

我正在尝试转换 DataFrame 以便某些行将被复制给定的次数例如 df pd DataFrame class A B C count 1 0 2 class count 0 A 1 1 B 0 2 C 2 应转换为 class 0 A
在较小的设备中更改 DataTables (jQuery+Bootstrap4) 的“pagingType”选项

我正在与数据表 https datatables net它启用了分页并显示带有页码 1 2 3 4 5 10 的下一个上一个按钮我正在尝试使用以下方法将其更改为仅在较小设备小于 768px 中的下一个上一个分页类型 http
从 Pandas 的 DatetimeIndex 中创建月份和年份的列表

我有一个信息数据框我将索引设置为接收的日期和时间现在我想要一个清单我设置 df 索引这样做 df index pd to datetime df index format m d Y H M 这给了我这个 print df index
使用具有多个元素的字典过滤数据框

我已经尝试了几个小时来在这里找到答案但我无法在我的特定情况下找到任何答案我能找到的最接近的是使用字典将多个字符串包含过滤器应用于 pandas 数据框 https stackoverflow com questions 4338916
Pandas DataFrame - 列 whos dtype=='category' 上的聚合导致性能下降

我使用内存使用量较高的大数据帧并且我读到如果更改重复值列上的数据类型我可以节省大量内存我尝试了一下确实内存使用量下降了 25 但随后我遇到了我无法理解的性能缓慢问题我对 dtype 类别列进行分组聚合在更改 dtype 之前
如何删除 pandas 数据框中的唯一行？

我遇到了一个看似简单的问题在 pandas 数据框中删除唯一的行基本上相反drop duplicates https pandas pydata org pandas docs stable generated pandas Data
Qcut Pandas：ValueError：Bin 边缘必须是唯一的

我使用 Pandas 中的 Qcut 将数据离散化为大小相等的存储桶我想要有价格桶这是我的数据框 productId sell prix categ popularity 11997 16758760 0 28 75 50 524137

随机推荐

PHP/CodeIgniter - 在 __construct() 中设置变量，但无法从其他函数访问它们

我很高兴遇到了一些变量范围问题也许我只是需要更多咖啡这是我的简化的代码这是在 CodeIgniter 2 中 class Agent extends CI Controller public function construct
如何识别扫描的PDF文件中的图像？

我正在尝试识别扫描的 PDF 文件中的图像而不是文本最好使用 python 有什么办法可以做到这一点吗举一个简单的例子假设您扫描了一本书的一章页面有三种可能的选项仅包含文字仅包含一张或多张图像包含文本和图像我想输出属于
每天给定间隔的最大坡度

我有一组时间序列数据其中包含从三个不同位置在多天内每 10 分钟测量一次的地表温度实际上是 2 年的数据我感兴趣的是计算每个站点每天任意 60 分钟间隔的最大斜率温度升高速率因此本质上我希望每天工作 10 分钟有 60 分钟的
如何使用 ReactJS 在前端使用 Axios、在后端使用 FastAPI 下载文件？

我正在尝试创建一个docx文件并将其发送到前端客户端应用程序以便可以将其下载到用户的本地计算机我使用 FastAPI 作为后端我在用python docx图书馆还创建Document 下面的代码用于创建一个docx文件并保存到服务器
为什么 Raphaël 中的拖动会因在气泡阶段的封闭元素中停止 mousemove 的传播而被破坏？

我正在尝试调试复杂的 Web 应用程序中的事件处理错误但我已将问题简化为一个简单的示例该示例演示了我感到困惑的行为我的示例页面基于拉斐尔的示例之一如下所示
在索引到数组的同时求解向量二阶微分方程

我正在尝试求解微分方程 m t M x x C x x B x where x and x 是具有 2 个条目的向量表示动态系统中的角度和角速度中号 x 是一个 2x2 矩阵它是 theta 分量的函数 C 是一个 2x1 向量它是
android：以编程方式更改选项菜单项

是否可以通过编程方式更改选项菜单项有人能给我举个例子吗另外我想禁用某些项目以便它们不听点击这可能吗对于任何需要动态更改菜单选项的人 private Menu menu Override public boolean onCrea
jquery 对话框：拖动带有 iframe 的对话框

拖动内部有 iframe 的 jquery 对话框时如果鼠标在拖动时移至框架内容上方则拖动会停止看起来 iframe 会自动获取焦点有什么办法可以防止这种情况并使阻力正常吗 var iframe document createEle
tasks.ToList() 是否创建一个包含新复制任务的列表，或者该列表引用相同的任务？

假设我们有一个任务数组称为 tasks 然后将其转换为一个列表称为 temp var temp tasks ToList 数组元素指向的那些正在运行的任务会发生什么情况我们是否有两组单独运行的任务一组在任务中另一组在临时中
如何获取 Play 2.0.x 中请求的大小？

在 Play Framework 2 0 3 scala 中如何确定任何 Request 的大小以字节为单位我们正尝试获取此信息用于记录目的我们期望从 request body asRaw 中获得一些值但我们总是获得 None d
Kubernetes 中的 Pod 可以查看/访问同一 Pod 中运行的其他容器的进程吗？

在 Kubernetes 文档的此页面上Pods https github com GoogleCloudPlatform kubernetes blob master docs user guide pods md 它指出 Pod 的上下
如何使用Java在接口中只实现所需的方法

我有一个包含三个方法的接口并且我已经在我的子类中实现了这两个方法在此期间我遇到了编译时错误我该如何处理这种情况片段一 package com college problems public interface MethodDefi
Python超类反射

如果我有Python代码 class A pass class B pass class C A B pass 我有课C 有没有办法迭代它的超级类 A and B 像伪代码一样 gt gt gt magicGetSuperClasses C
如何从子窗口关闭 fancybox？

父链接 a href feedback php Provide your feedback here a 启动 fancybox 的 jQuery 代码是 feed fancybox Feedback php 中的代码
如何将 String 对象（包含 XML）“转换”为现有 JSP 页面上的元素

目前我有一个包含 XML 元素的 String 对象 String carsInGarage garage getCars 我现在想将此字符串作为输入流源或某种源传递但不确定选择哪个以及如何实现它我看过的大多数解决方案都导入包
SQL Server 多行计算

如果我有以下格式的数据 Account Period Values Revenue 2013 01 01 5432 Revenue 2013 02 01 6471 Revenue 2013 03 01 7231 Costs 2013 01
Android ListFragment更新/刷新和onItemClick

我的 Android 项目遇到问题它是一个音乐曲目播放器显示 ListFragment 中的每个曲目每个项目都有一个位图其中示波器绘制在位图画布上 Listfragment 中的项目会定期刷新这是通过以下方式完成的通知数据集更改
git浅克隆到特定标签

我想克隆 Linux 内核存储库但只能从 3 0 版本开始因为内核存储库太大了如果我可以进行浅克隆它会使我的版本控制工具运行得更快我的问题的核心是我如何告诉 git depth 参数的 n 值是什么我希望这会起作用克隆htt
如何使用Python从最高到最低设置k-Means聚类标签？

我有一个包含 38 个公寓的数据集以及它们早上下午和晚上的用电量我尝试使用 scikit learn 的 k Means 实现对该数据集进行聚类并得到了一些有趣的结果 First clustering results 这一切都很好对
显示在合并中丢失的观察结果

假设我想通过两列的键合并两个不同的数据帧 Dataframe One 有 70000 个 obs 共 10 个变量 Dataframe Two 有 4500 个 obs 共 5 个变量现在我使用此代码检查了新数据框中的观察结果是如何留下

显示在合并中丢失的观察结果

显示在合并中丢失的观察结果 的相关文章

随机推荐

热门标签

显示在合并中丢失的观察结果的相关文章