在r中合并数据框和查找表，保留数据框中的所有记录

2024-02-29

我有一个 59720 obs 的数据框。如下所示。我想为查找表中的每个观察值分配一个 MARKETNAME。

> data (a)

     DAY  HOUR LEAD Row.Count     DATE    ITIME  HOMEPHONE            CITY  STATE ZIPCODE     ZONENAME
1 Monday 13:00    1      9430 7/1/2013 13:42:51            FORT LAUDERDALE     FL  33315       68
2 Monday 13:00    1      9432 7/1/2013 13:43:50 xxxxx9802x  PLEASANT GROVE     AL  35127       82
3 Monday 13:00    1      9434 7/1/2013 13:46:18 5xxxx85x10      ORO VALLEY     AZ  85737       54
4 Monday  0:00    1      9435 7/1/2013  0:04:34 50xxxx1x364          SPOKANE    WA  99204      211
5 Monday 11:00    1      9436 7/1/2013 11:45:43 951xxxxx20        RIVERSIDE    CA  92507       31
6 Monday 11:00    1      9437 7/1/2013 11:46:26 760xxxxx679            VISTA    CA  92081      539

我有一个邮政编码查找表，其中包含 43126 个唯一邮政编码，如下所示：

> data (b)

MARKETNAME            ZIPCODE
NEW YORK              00501
NEW YORK              00544
SPRINGFIELD-HOLYOKE   01001
SPRINGFIELD-HOLYOKE   01002
SPRINGFIELD-HOLYOKE   01003
SPRINGFIELD-HOLYOKE   01004

我想简单地将 MARKETNAME 分配给我的数据集"a"比较ZIPCODE in "b"。所以我用了

> c <- merge(a, b, by="ZIPCODE") .

它返回了 58,972 个 obs。这意味着我失去了 748 个 obs。我不想丢失任何记录a所以我改变了我的代码如下：

> c <- merge (a, b, by = "ZIPCODE" , all.x=TRUE) .

奇怪的是，这返回了 61,652 obs。而不是我的预期返回 59,720 obs。按照原来的a带有一些 NA 的数据帧。

根据文档，

“如果为 TRUE，则额外的行将添加到输出中，x 中的每一行在 y 中没有匹配的行。这些行在通常填充 y 中的值的列中将具有 NA。默认值为 FALSE，以便输出中仅包含包含 x 和 y 数据的行。”

我对此的解释绝对是错误的。有人可以解释我做错了什么以及如何完成这个简单的任务吗？

我提到：如何根据特定条件合并数据框并更改元素值？ https://stackoverflow.com/questions/24644026/how-to-merge-data-frames-and-change-element-values-based-on-certain-conditions, r 中 2 个相关数据帧的子集和合并 https://stackoverflow.com/questions/19468378/subsetting-and-merging-from-2-related-data-frames-in-r, 如何在R中合并两个大小不等的数据框 https://stackoverflow.com/questions/22859624/how-to-merge-two-unequal-size-data-frame-in-r但它们都与我的问题无关。

我更喜欢join from plyr默认情况下，左连接返回第一个数据框中记录的所有匹配项。

c <- join(a, b, by="ZIPCODE")

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

在r中合并数据框和查找表，保留数据框中的所有记录的相关文章

kmeans 对分组数据进行聚类

目前我尝试在分组数据中找到簇的中心通过使用示例数据集和问题定义我能够创建kmeans每个组内的集群然而当涉及到给定组的集群的每个中心时我不知道如何获取它们 https rdrr io cran broom man kmeans
在 mutate 和 across 之后使用 ~separate

目的是将所有物种 setosa 行转换为一行 setosa 这是一个最小的示例实际上有更多列和更多组我有这个数据框 head iris 2 gt select 1 2 5 gt group by Species Sepal Length
如何在 R 中只为直方图的一个标签着色？

我有一个像这样的数据框 CellLines ZEB1 600MPE 2 8186 AU565 2 783 BT20 2 7817 BT474 2 6433 BT483 2 4994 BT549 3 035 CAMA1 2 718 DU447
jupyter 中的 r 图形 - 无法启动 png() 设备

我在 Jupyter 中使用 R 但无法在笔记本本身中绘制图表这是一个可重现的示例 set seed 123 mat as matrix x rnorm 100 y rnorm 100 plot mat 在朱皮特中 Error in pn
如何使用 sprintf 函数在字符中添加前导“0”而不是空格？

我正在尝试使用sprintf函数为字符添加前导 0 并使所有字符长度相同然而我得到的是领先空间 My code a lt c 12 123 1234 sprintf 04s a 1 12 123 1234 我试图得到什么 1 0012 0
R：如何找到向量的模式[重复]

这个问题在这里已经有答案了下面是我的data frame我想知道每个内存类别 1 到 8 的模式是什么 gt dput d structure list MEMORY1 c 5 5 7 1 5 6 4 5 4 5 5 4 1 5 5 2
matplotlib 中的 R 风格数据轴缓冲区

R 绘图自动设置 x 和 y 限制以在数据和轴之间留出一些空间我想知道 matplotlib 是否有办法自动执行相同的操作如果没有是否有一个好的公式或经验法则来说明 R 如何设置其轴限制在 matplotlib 中您可以通过
ggplot 图例标签内的希腊字母、符号和换行符

我在尝试着有换行符自动或强制对齐文本左对齐或左右对齐有希腊字母和百分号在 gglot 图例标签内我尝试了几种方法但我似乎无法将我读到的所有技巧结合起来我可以通过插入来换行 n进入标签但这似乎不适用于希腊字母不适用于图例
从 data.frame 中提取时用 NA 填充缺失的列

我有一个函数它将具有某些列的数据框作为输入 columns a b z 现在我有一个数据框DF只有很少的这些列DF columns f u z 如果列不在其中如何创建一个包含所有值为 NA 的列的数据框DF这与DF在柱子上 f u z
将 pandas 数据帧拆分为子数据帧列表的最快方法

我有一个大数据框df我有完整的清单indices中的独特元素df index 我现在想创建一个由元素索引的所有子数据帧的列表indices 具体来说 list df df loc x for x in indices 运行这个命令需要很长时
在 R 中导入 csv 文件时如何保留前导零？

当我写一个 csv来自 R 的文件其中我的组名称以前导零值开头前导零被保留但是当我导入 csv前导零被删除组名称被转换为整数当我导入一个组时如何保留组名称中的前导零 csvR 中的文件 Example df lt data fr
删除缺失的数据值

我删除了原始帖子以便能够发布更大版本的数据集实际上总共有 418 行这是我正在进行的生存分析的数据第一列是 ID 号其他列标记为 V2 V20 有很多缺失的数据用表示我用coxph 函数来获取以下内容 Saves survi
如何在基数 R 中进行分组

我想使用以下 SQL 查询来表达base R 没有任何特定的包 select month day count as count avg dep delay as avg delay from flights group by month d
R：ifelse 中的字符串列表

我正在寻找与 MySQL 中的 where var in 语句类似的东西我的代码如下 data lt data frame id 10001 10030 cc1 rep c a b c 10 attach data data new lt
根据 R 数据框中的名称对列进行平均

我想知道是否有一种有效的方法来获取每组的平均值类似命名的列谁的名字结尾为 1S and 2S ex ex1S ex2S at time 1并取每组的平均值类似命名的列谁的名字结尾为 1C or 2C ex ex1C ex2C at time
dplyr 中的标准评估：全局环境中的函数出现“无法找到函数”错误

我试图在 dplyr 中对全局环境中的函数使用标准评估但出现无法找到函数错误这是一些代码 create data frame df lt data frame x rnorm 10 y rnorm 10 define arbitra
R参考类问题

我正在尝试在 R 中创建一个简单的参考类这是我的代码 R 初学者 MyClass lt setRefClass MyClass fields list a numeric b numeric methods list initialize
在 R 中使用逻辑 grep 抓取文本

下午好谢谢你帮我解答这个问题我有兴趣抓取一组超过 5000 个 URL 的列表我使用 lapply 和 readLines 使用下面的示例代码提取这些网页的文本 multipleURL lt c http dailymed nlm n
按组计算连续行中的值之间的差异

这是我的一个df 数据框 group value 1 10 1 20 1 25 2 5 2 10 2 15 我需要按组计算连续行中的值之间的差异所以我需要一个结果 group value diff 1 10 NA because the
R data.table fwrite 到 fread 空间分隔符并清空

我在使用 fread 以作为分隔符和散布的空白值时遇到问题例如这个 dt lt data table 1 5 1 5 1 5 make a simple table dt 3 V2 NA add a blank in the midd

随机推荐

在 flutter dart 中将 Future 转换为 int

我在用sqflite https pub dev packages sqflite我通过以下代码获取特定记录的行数 Future
将字符串日期转换为 dd/MM/yyyy 格式的 java.util.Date [重复]

这个问题在这里已经有答案了我在网上阅读了更多问题但尚未找到解决方案我有一个String就像 14 05 1994 正是这种格式我需要将其转换为java util Date in the 相同格式 I tried DateFormat
grails 中的刷新模式从自动更改为手动

将我的 Grails 项目从 1 3 7 升级到 2 4 0 并修复与新 Grails 版本相关的各种问题后我意识到对任何对象所做的任何更改都不会再根本保留除非如果save flush true 叫做在 Grails 1 3 7
适用于 Windows VHD API 的 Java 库

我需要从 Java 安装和导航 Windows VHD 任何人都知道封装了 Java 库Windows 虚拟硬盘 API http msdn microsoft com en us library dd323700 28v VS 85 29
TortoiseSVN：好的“补丁文件”查看器？

默认的补丁文件查看器很混乱即没有并排差异视图等我尝试在设置 gt 统一差异查看器 gt 自定义中设置 BeyondCompare exe 的路径但 Beyond Compare 的行为也与默认差异工具相同有没有办法至少允许补丁文
可以从 LLVM-IR 自动生成 llvm c++ api 代码吗？

clang 3 0 在线演示页面http llvm org demo index cgi http llvm org demo index cgi提供输出 LLVM C API 代码的选项表示输入程序的 LLVM IR 生成 LLVM C
jQuery select2 AJAX 不工作

我正在使用 jQuery select2 插件并尝试让 AJAX 处理我的 ext 数据这显然不起作用我只是想知道是否有人可以指出我做错了什么或遗漏了什么 NOTE这仅适用于选择 v3 5 2 my js cliselect selec
使用图层列表显示一些可绘制图像

Android Studio 2 0 预览版 3b Hello 我创建了以下布局我想将其用作我的应用程序的背景我正在使用layer list我想在两个位置展示一碗豌豆预览中一切看起来都不错但是当我在 genymotion 或一些廉价
MATLAB 中是否有函数可以将 .raw 文件转换为矩阵？

我想将 raw 文件作为矩阵帧 x 空间 x 光谱导入 MATLAB 有内置函数可以做到这一点吗如果您指的是来自相机的原始图像文件 http en wikipedia org wiki Raw image format 我会检查提交的
material-component-datetime-picker-您在需要流的地方提供了“未定义”。您可以提供 Observable、Promise、Array 或 Iterable

我尝试根据文档和以下包含有关环境的信息使用材料组件日期时间选择器 Angular 角度版本 10 1 0 材质版本 10 1 0 角度材料组件力矩适配器 4 0 1 角度材料组件日期时间选择器 4 0 2 以下是查看日期时间选择器的代码
ASP.NET MVC 5 Azure App ZAP 扫描指示代理泄露漏洞 - 我们如何防止这种情况？

ZAP 扫描报告表明检测到 2 个代理服务器或对其进行了指纹识别它说它对我们的 url 执行了 GET 和 POST 方法并使用 TRACE 攻击带有 Max Forwards 标头的 OPTIONS 和 TRACK 方法我们已经通
在 Sitecore 页面编辑器中保存返回错误

在页面编辑器中保存页面时出现错误不知何故当我从演示 gt 详细信息编辑页面并将其显示在页面编辑器中时它工作正常错误日志位于下面 ERROR After parsing a value an unexpected character
类型或命名空间名称“Mvc”不存在

我最近安装了 Visual Studio 2013 从网上下载了一个示例项目后当我运行它时它给了我以下错误 The type or namespace name Mvc does not exist in the namespace S
了解崩溃报告[关闭]

Closed 这个问题是无关 help closed questions 目前不接受答案当我使用 S3 getObjectRequest 将 iPhone 5 连接到电缆时应用程序崩溃它工作正常但是当我断开电缆以通过 wifi 使用
使用last_insert_id()插入重复的密钥更新

我正在尝试创建一个函数 CREATE FUNCTION func param1 INT param2 INT param3 TEXT RETURNS int 11 BEGIN INSERT INTO table1 column1 colum
如何在 Sitecore 中将字段设置为“只读”？

在我的用户模板中我有一个 userid 字段它是一个单行文本控件我想将此字段设置为使用此模板创建的所有用户项目的只读我怎样才能做到这一点打开安全编辑器选择您想要授予只读访问权限的角色确保您在安全编辑器中可以看到字段
为什么 Mac 上的 clang 会自动包含一些缺失的标头？

我注意到clang 包括缺少的标头
比较 thymeleaf 中的 int 和 string

我使用 thymeleaf 3 和 spring boot 2 有一个整数和一个字符串进行比较 i tried car id generic value 但它总是假的这应该可以帮助您 strings equals generic valu
两个具有相同id的元素，想要选择一个包含在特定div中的元素

我有这样的东西 div div
在r中合并数据框和查找表，保留数据框中的所有记录

我有一个 59720 ob s 的数据框如下所示我想为查找表中的每个观察值分配一个 MARKETNAME gt data a DAY HOUR LEAD Row Count DATE ITIME HOMEPHONE CITY STATE

在r中合并数据框和查找表，保留数据框中的所有记录

在r中合并数据框和查找表，保留数据框中的所有记录 的相关文章

随机推荐

热门标签

在r中合并数据框和查找表，保留数据框中的所有记录的相关文章