使用R中merge()函数合并数据

2023-05-16

使用R中merge()函数合并数据

在R中可以使用merge()函数去合并数据框，其强大之处在于在两个不同的数据框中标识共同的列或行。

如何使用merge()获取数据集中交叉部分

merge()最简单的形式为获取两个不同数据框中交叉部分。举例，获取cold.states和large.states完全匹配的数据。代码如下：

> merge(cold.states, large.states)
   Name Frost  Area
1  Alaska  152 566432
2 Colorado  166 103766
3 Montana  155 145587
4  Nevada  188 109889

如果你属性数据库语法SQL,你可能想merge()和数据库中JOIN功能很相似。确实如此，merge()函数的不同参数可以实现内join，left join,right join以及完整join。

merge()函数有很多参数，看起来非常吓人。但他们都几中类型参数有关：

x: 第一个数据框.
y: 第二个数据框.
by, by.x, by.y: 指定两个数据框中匹配列名称。缺省使用两个数据框中相同列名称。
all, all.x, all.y: 指定合并类型的逻辑值。缺省为false，all=FALSE (仅返回匹配的行).

最后一组参数all, all.x, all.y需要进一步解释，决定合并类型。

这里写图片描述

如何理解不同类型的合并

merge() 函数支持4种类型数据合并:

Natural join: 仅返回两数据框中匹配的数据框行，参数为：all=FALSE.

Full outer join: 返回两数据框中所有行，参数为： all=TRUE.

Left outer join: 返回x数据框中所有行以及和y数据框中匹配的行，参数为： all.x=TRUE.

Right outer join: 返回y数据框中所有行以及和x数据框匹配的行，参数为： all.y=TRUE.

如何实现完整合并(full outer join)

返回示例数据中美国的州，执行完整合并cold和large state，使用参数all=TRUE.

> merge(cold.states, large.states, all=TRUE)
      Name Frost  Area
1     Alaska  152 566432
2    Arizona  NA 113417
3   California  NA 156361
....
13     Texas  NA 262134
14    Vermont  168   NA
15    Wyoming  173   NA

两个数据框有不同的名称，所以R基于两者state的name进行匹配。Frost来自cold.states数据框，Area来自large.states.

上面代码执行了完整合并，填充未匹配列值为NA。

总结

本文详细介绍R中merge()函数参数及合并数据类型。利用sql的表连接概念进行类比，简单易懂。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

使用R中merge()函数合并数据的相关文章

Python读取文件的多种方式

在Python编程中 xff0c 读取文件是非常常见的操作 Python提供了多种读取文件的方式 xff0c 本文将介绍其中的几种方式 1 使用open函数读取文件使用Python内置函数open 可以打开一个文件 xff0c 并返回一个
阿里Java面试题剖析：关于系统拆分，为什么要进行系统拆分？

外链图片转存失败源站可能有防盗链机制建议将图片保存下来直接上传 img Xz97Uqx1 1663815474530 https upload images jianshu io upload images 16535373 f09e8
关于完全二叉树高度h与结点个数n的推导

推导1 xff1a 具有n个 n gt 0 结点的完全二叉树的高度h为 xff1a log2 n 43 1 由于高度h的满二叉树共有2h 1个结点高度为h 1的满二叉树有2h 1 1个结点可得2h 1 1 lt n lt 61 2h 1
Android 采用fastboot刷system.img boot.img recovery.img

手机正常启动后 xff0c 命令行模式下输入 adb reboot bootloader 该命令会自动进入fastboot模式接着 xff1a fastboot devices 查看是否有设备 erase 擦除的意思 xff0c 你懂得
ButterKnife与BindView使用详解

ButterKnife与BindView使用详解 ButterKnife的优势具有强大的view绑定和click事件处理能力方便处理Adapter里的viewHolder绑定问题运行时不会影响app效率 xff0c 配置方便代码清晰
libpcap的安装

最近参加了一个实训项目 xff0c 是把一个WireShark抓到的pcapng文件用libpcap库还原成原始的TS流 xff0c 需求分析弄了一天 xff0c 安装环境用了一天 xff0c 接下来再开始写代码 xff0c 让我们一起完成
【手把手教你】使用Python玩转金融时间序列模型

01 引言上一篇推文 Python量化基础时间序列的自相关性与平稳性着重介绍了时间序列的一些基础概念 xff0c 包括自相关性偏自相关性白噪声和平稳性 xff0c 以及Python的简单实现本文在此基础上 xff0c 以沪深300
Java 解决 java.lang.IllegalStateException 异常错误

今天运行项目时出现的这个问题 xff0c 有错误提示可以看出 xff0c 大概意思是这个项目已经停止 xff0c 不能重新加载也就是说只需重新部署基本就可以啦网上有人说可以将项目从tomcat中先移除再部署上去 xff0c 实在不行就把
学习笔记3 hive数据分析（实例）

目的 xff1a 分析企业新闻舆情的正负面性与该公司是否有非法集资风险的关系思路 xff1a 将两张表连接成一张新表 xff1b 根据 id 企业唯一标识 positive negtive 新闻正负面性 public date 发布日期
Gradle sync failed: Could not find com.android.tools.build:gradle:4.1.3解决方法

Gradle sync failed Could not find com android tools build gradle 4 1 3解决方法升级安卓4 1 3后导入其他项目显示如下错误原因是软件无法更新Gradle sync x
AlertDialog对话框弹出后，旋转屏幕，对话框消失，造成leak window

看log信息按字面了解 xff0c Window Leaked大概就是说一个窗体泄漏了 xff0c 也就是我们常说的内存泄漏 xff0c 为什么窗体会泄漏呢 xff1f 我们知道Android的每一个Activity都有个WindowMa
如何高效地阅读技术类书籍与博客

原文地址 xff1a http www nowamagic net librarys veda detail 2050 如何高效地阅读技术类书籍与博客影像阅读法阅读是自我提升的一个有效方法 xff0c 阅读书籍阅读博客都是我们技术提升
Java进阶面试题：如何设计一个高并发系统？

面试原题如何设计一个高并发系统 xff1f 面试官心理分析说实话 xff0c 如果面试官问你这个题目 xff0c 那么你必须要使出全身吃奶劲了为啥 xff1f 因为你没看到现在很多公司招聘的 JD 里都是说啥 xff0c 有高并发就经
微擎按照UID获取用户绑定手机号

按照UID获取用户信息 users 61 pdo fetch 34 select from 34 tablename 39 users 39 34 where uid 61 W 39 uid 39 34 按照UID获取用户绑定手机号 thi
AD-----间距、线宽、阻焊、铺铜规则设置

1 间距规则快捷键 D 43 R xff0c 出现如下界面 xff0c 在Clearance 中即可设置对应的规则 Track 走线 SMD Pad 贴片式焊盘 TH Pad 通孔焊盘 Via xff1a 过孔 Copper xff1a
【Python】程序员情人节搞事情的程序

程序员情人节搞事情的程序效果展示源码备注1 这段代码用 python 实现2 用 pyinstaller 打包成exe3 没有 pyinstaller 的话 xff0c 可以直接用 pip 安装效果展示源码 import pygame
Maven项目在编译及导入Eclipse时出现的错误汇总处理

Maven项目在编译及导入Eclipse时出现的错误处理汇总 Maven在构建项目时确实是比较强大 xff0c 而且也越来越流行 xff0c 目前不但越来越多的开源项目 xff0c 甚至越来越多的商业项目都在使用Maven 但是不得不说Ma
AS导入项目报错：Plugin with id ‘com.android.application‘ not found

转自 xff1a https www cnblogs com cuichen16 p 10785951 html 从github或第三方Demo中获取的项目导入到AndroidStudio中报错Plugin with id com andr
C#向Excel报表中插入图片的2种方法

这几天做向Excel插入数据 xff0c 其中有插入图片的需求 xff0c 经试验 xff0c 下面2种方法都可以插入图片 xff0c 但各有不同的用处现将这2种方法共享出来 xff0c 希望需要的朋友进行参考 xff0c 代码中已经有详
Response.Redirect 打开新窗口的两种方法

一般情况下 xff0c Response Redirect 方法是在服务器端进行转向 xff0c 因此 xff0c 除非使用 Response Write 34 lt script gt window location 61 39 http

随机推荐

C# 实现向浏览器的兼容性视图列表中添加、删除网站和检查网站是否在兼容性网站列表中

今天回答论坛上的一个问题 xff0c 搜索了一下网上 xff0c 并没有找到一个完整的例子 xff0c 下面根据网上的一些资料 xff0c 经过转换完善成一个完整的例子下面的例子可以实现添加删除检测网站是否在兼容性网站列表中的功能
Excel中 ColorIndex 属性值和颜色对照表

Excel中 ColorIndex 属性值和颜色对照表资料参考 http msdn microsoft com en us library cc296089 aspx http www mvps org dmcritchie excel
AJAX（XMLHttpRequest）进行跨域请求方法详解（一）

注意 xff1a 以下代码请在Firefox 3 5 Chrome 3 0 Safari 4之后的版本中进行测试 IE8的实现方法与其他浏览不同跨域请求 xff0c 顾名思义 xff0c 就是一个站点中的资源去访问另外一个不同域名站点上的
分享30道Redis面试题，面试官能问到的我都找到了

1 什么是Redis xff1f 简述它的优缺点 xff1f Redis本质上是一个Key Value类型的内存数据库 xff0c 很像memcached xff0c 整个数据库统统加载在内存当中进行操作 xff0c 定期通过异步操作把数据
AJAX（XMLHttpRequest）进行跨域请求方法详解（二）

注意 xff1a 以下代码请在Firefox 3 5 Chrome 3 0 Safari 4之后的版本中进行测试 IE8的实现方法与其他浏览不同 2 xff0c 预检请求预检请求首先需要向另外一个域名的资源发送一个 HTTP OPTION
将文本文件的内容或者文字保存成图片

调用方法 xff1a ConvertTextFileToImage Server MapPath 34 Log txt 34 Server MapPath 34 Log png 34 实现代码 xff1a void ConvertTextF
Windows 文件资源管理器中搜索带特殊字符文件名的方法

今天处理一些文件 xff0c 文件夹这包含有类似 16年普通高等学校招生全国统一考试英语的文件名 xff0c 想全部找出来删除掉 xff0c 直接在文件资源管理器里面输入是搜索不到想要的文件的 xff0c 这些是特殊字符 xff0c
脑成像坐标系： MNI + Talairach

一脑成像坐标系 xff1a MNI Talairach MNI 脑 Montreal Neurological Institute 是基于大量的正常被试MRI扫描结果得到的标准脑 xff08 当然是欧罗巴人群的 xff09 Talaira
windows10隐藏分区（隐藏efi系统分区）

我们需要使用diskpart来移除这个误显示的盘符可能使用的命令 xff1a 1 以管理员身份运行CMD xff1b 2 运行diskpart命令 xff1b 3 list disk 显示所有安装的磁盘 xff1b 4 select di
干支纪年和纪日算法

怎样从已知年份和日期得到对应的干支纪年和纪日文 xff0f 葛民勤摘要 xff1a 从已知年份计算干支纪年很简单 xff1a 年份数减3 xff0c 除以10的余数是天干 xff0c 除以12的余数是地支从已知日期计算干支纪日的公式
Shell 脚本监控磁盘空间

df 命令可以展示文件系统的磁盘有效空间信息如果不指定文件名 xff0c 则当前所有挂载的文件系统有效空间信息实现步骤使用 df 查看磁盘信息使用 grep命令过滤文件系统 xff0c 获取空间使用百分比通过Shell 脚本进行监控
R 实现熵权法计算权重

按照信息论基本原理的解释 xff0c 信息是系统有序程度的一个度量 xff0c 熵是系统无序程度的一个度量 xff1b 根据信息熵的定义 xff0c 对于某项指标 xff0c 可以用熵值来判断某个指标的离散程度 xff0c 其信息熵值越小
R实现KMeans聚类算法教程

本文和你一起学习无监督机器学习算法 kmeans算法 xff0c 并在R中给详细的实现示例和步骤什么是k means聚类算法聚类是从数据集中对观测值进行聚类的机器学习方法它的目标是聚类相似观测值 xff0c 不同类别之间差异较大聚类
使用gopsutil获取OS信息

生产环境通常需要掌握主机硬盘 CPU 内存进程等资源使用情况 xff0c 可以执行系统命令获得 xff0c 通过os exec执行命令 xff0c 如 xff1a ps cd top xff0c 然后解析命令执行结果对于linux操作系
gcc工具小结

关于 l和 Wall选项的解析 xff1a Wall 打开gcc的所有警告 l参数就是用来指定程序要链接的库 xff0c l参数紧接着就是库名 xff0c 那么库名跟真正的库文件名有什么关系呢 xff1f 就拿数学库来说 xff0c 他的库
如何在Java中调用Python

Python语言有丰富的系统管理数据处理统计类软件包 xff0c 因此从java应用中调用Python代码的需求很常见实用 DataX 是阿里开源的一个异构数据源离线同步工具 xff0c 致力于实现包括关系型数据库 MySQL Ora
ClickHouse 基于角色访问控制(RBAC)最佳实践

本文介绍ClickHouse RBAC访问控制模型包括如何启用SQL管理 xff0c 创建管理员用户 xff0c 创建角色 xff0c 授权 xff0c 细粒度列和行级授权并通过示例进行验证实现过程启用RBAC 在users xml中
R语言中mean函数

mean函数是求算术平均值用法 xff1a mean x trim 61 0 na rm 61 FALSE x是数值型逻辑向量 trim表示截尾平均数 xff0c 0 0 5之间的数值 xff0c 如 xff1a 0 10表示丢弃最大1
使用Spring @DependsOn控制bean加载顺序

使用Spring 64 DependsOn控制bean加载顺序 spring容器载入bean顺序是不确定的 xff0c spring框架没有约定特定顺序逻辑规范但spring保证如果A依赖B 如beanA中有 64 Autowired B
使用R中merge()函数合并数据

使用R中merge 函数合并数据在R中可以使用merge 函数去合并数据框 xff0c 其强大之处在于在两个不同的数据框中标识共同的列或行如何使用merge 获取数据集中交叉部分 merge 最简单的形式为获取两个不同数据框中交叉部分

热门标签