根据查找表替换数据框中的值

2024-02-01

我在替换数据框中的值时遇到一些问题。我想根据单独的表替换值。下面是我正在尝试做的事情的一个例子。

我有一张表，其中每一行都是客户，每一列都是他们购买的动物。我们称这个数据框为table.

> table
#       P1     P2     P3
# 1    cat lizard parrot
# 2 lizard parrot    cat
# 3 parrot    cat lizard

我还有一个我将参考的表，称为lookUp.

> lookUp
#      pet   class
# 1    cat  mammal
# 2 lizard reptile
# 3 parrot    bird

我想做的是创建一个名为的新表new用函数替换所有值table与class列于lookUp。我自己尝试过使用lapply功能，但我收到以下警告。

new <- as.data.frame(lapply(table, function(x) {
  gsub('.*', lookUp[match(x, lookUp$pet) ,2], x)}), stringsAsFactors = FALSE)

Warning messages:
1: In gsub(".*", lookUp[match(x, lookUp$pet), 2], x) :
  argument 'replacement' has length > 1 and only the first element will be used
2: In gsub(".*", lookUp[match(x, lookUp$pet), 2], x) :
  argument 'replacement' has length > 1 and only the first element will be used
3: In gsub(".*", lookUp[match(x, lookUp$pet), 2], x) :
  argument 'replacement' has length > 1 and only the first element will be used

关于如何实现这项工作有什么想法吗？

您在问题中发布了一种不错的方法。这是一个类似的方法：

new <- df  # create a copy of df
# using lapply, loop over columns and match values to the look up table. store in "new".
new[] <- lapply(df, function(x) look$class[match(x, look$pet)])

另一种更快的方法是：

new <- df
new[] <- look$class[match(unlist(df), look$pet)]

请注意，我使用空括号（[]）在这两种情况下都保持结构new因为它是（一个数据框）。

（我在用着df代替table and look代替lookup在我的回答中）

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

DataFrame

lookup

根据查找表替换数据框中的值的相关文章

使用 R 中的 tidyverse 重新调整因子和重新排序因子

我想使用这些功能重新调平 and 重新排序在我的数据框中我了解重新调整级别的工作原理但我不明白为什么我在 data frame 中看不到级别的变化例如假设我有鸢尾花数据集 library tidyverse head iris g
如何优化 R 中的 sapply 来计算数据帧上的运行总计

我在 R 中编写了一个函数来按月份计算累积总数但随着数据集变大我的方法的执行时间呈指数增长我是一名 R 程序员新手你能帮我提高效率吗该函数以及我调用该函数的方式 accumulate lt function recordnum d
创建序列组合

我正在尝试解决以下问题考虑 5 个简单序列 0 100 100 0 rep 0 101 rep 50 101 rep 100 101 我需要 3 个数字变量的集合它们的所有组合都具有上述序列由于有 5 个序列和 3 个变量因此可以有
Python Pandas 根据另一列的总计从另一个数据帧中选择值

我下面有一个 DataFrame 但我需要根据取消和订单列从每个代码中选择行假设代码 xxx 的阶数为 6 1 5 1 阶数为 11 我需要一种算法可以选择满足总共 11 行的行阶数为 6 5 如果没有行匹配则选择最接近的 id 并
通过 r 中的组变量进行汇总

我有一个数据框如下 head newStormObject FATALITIES INJURIES PROPVALDMG CROPVALDMG EVTYPE total 1 0 15 2 5e 05 0 TORNADO 15 2 0 0 2
R 在安装包依赖项时不考虑最大版本

假设我正在开发一个名为magicr做一些统计魔术我希望它使用另一个名为的包中的函数fairydust 假设存在于 CRAN 上很遗憾fairydust刚刚向 CRAN 发布了 2 0 0 版本完全破坏了我计划使用的功能所以我更新了
DT数据表中的列对齐

In my shiny我正在使用的应用程序datatable函数来自DT库构建一个表格并希望将列居中对齐我可以用formatStyle column textAlign center 但它只影响列体而不影响标题我们必须设置columnD
R - 如何为数据范围内的缺失值绘制条形图零点？

假设我对 1 到 10 之间的整数的 200 个点有 10 个观察值 mysample sample rep seq 1 10 20 10 我想用条形图绘制它 barplot table mysample barplot https i s
R -> kdb：将 R 数据作为二进制对象传递给 kdb+

最有效的插入方式是什么R对象更具体地说时间序列表示为xts or data table对象即基于时间和数字的列到kdb 数据库我能够通过以下方式找到唯一涉及字符串序列化的解决方案q所描述的表达式here https stackov
将数据框分成相等的部分

我有一个示例数据框 df lt data frame x 1 112 y runif 112 有没有办法打印数据框列表其中列表的第一部分包含行1 10 第二11 20等等直到最后 111 112 你可以使用split with rep
在构建分数多项式函数时避免 eval(parse())

我的目标是在 R 中编写一个函数它接受 a 的系数分数多项式 http www stata com manuals13 rfp pdf rfpRemarksandexamples FP 并返回一个向量化函数该函数针对给定的输入数字计算指
删除 Pandas 数据框中的 NaN/NULL 列？

我有一个dataFrame在 pandas 中有些列的值全部为空是否有内置函数可以让我删除这些列 Yes dropna See http pandas pydata org pandas docs stable missing data
为什么“str_extract”只捕获其中一些值？

我有一个表其中有一个会员类型列其中包括我们多年来使用的无数不同的会员级别 example lt data frame membership c Legacy Payment ID 3564 Payment Record 0 Peri
在 R 中，如何将 SpatialPolygons* 转换为地图对象

我正在尝试利用ProportionalSymbolMap在此定义的地图JSS论文 http www jstatsoft org v15 i05 为了绘制比例符号我首先需要一个地图类的对象 The methods http www ncea
使用列的长度过滤 DataFrame

我想过滤一个DataFrame使用与列长度相关的条件这个问题可能很简单但我在SO中没有找到任何相关问题更具体地说我有一个DataFrame只有一个Column哪一个ArrayType StringType 我想过滤DataFrame
基于列名称的字符向量的子数据框[重复]

这个问题在这里已经有答案了菜鸟问题提前感谢您的耐心我有一个数据框 vals lt c 1 1 1 1 testdf lt data frame var1 vals var2 vals var3 vals 我有一个变量名称的字符向量 v
超过阈值的时间序列值的聚合计数（按年月）

我现在正在学习 R 并使用 SEAS 包来帮助我在 R 中进行一些计算并且数据与 SEAS 包喜欢的格式相同这是一个时间序列 require seas data mscdata dat int lt mksub mscdata id 1
R：行数不相等的列绑定

我有两个数据集它们每个都有变量 ID Block 和 RT 反应时间我想合并列绑定这两个集合以便我拥有一个包含变量的数据集 ID 块 RT1 RT2 问题是两个集合中的行数不相等此外 ID 和块号匹配也很重要缺失值应替换为 NA
ggplot2 - 在绘图顶部添加辅助 y 轴

对于出版物我需要向现有绘图添加第二个 y 轴我遇到了一种方法来做到这一点 https rpubs com kohske dual axis in ggplot2 https rpubs com kohske dual axis in g
按元素聚合数组

Spark scala 相当新我想知道是否有一种简单的方法以按列方式聚合 Array Double 这是一个例子 c1 c2 c3 1 1 1 0 1 0 3 4 1 2 1 0 0 0 4 3 2 1 0 0 0 0 0 0 2 3 1

随机推荐

如何在 UserControl 组件上查找 WPF 中的所有控件

我可以获得所有 UI 控件Form但如何找到某个特定的控件UserControl 您可以使用Linq operator OfType and Controls property var controls YourForm YourUserC
FrameLayout 中的片段未显示在 CoordinatorLayout 中

我使用 NavigationDrawer 打开了默认的 Android Studio 应用程序默认的内容视图不是很有用因此我尝试将其替换为FrameLayout所以我可以添加片段如果我只是更换content main与FrameLay
Azure DevOps Build Pipeline 适用于具有多种项目类型的解决方案

我有一个包含以下内容的解决方案几个 Asp net 项目微服务和网关 Net Core Angular 8 前端当我点击 Visual Studio 中的构建按钮时每个项目都会构建我已经创建了一个存储库并上传了解决方案现在我试
Spring Boot Thymeleaf 布局方言不起作用

我刚刚创建了一个新的 Spring Boot v1 5 项目并面临 Thymeleaf 布局方言无法工作的问题我的 build gradle 及其类路径中有依赖项 compile group nz net ultraq thymelea
svn 无法打开 ra_local 会话

我已经在 Linux 服务器上设置了 svn 我使用以下命令创建了一个存储库 svnadmin create var svn REPOSITORY NAME 然后我在此文件中设置用户访问权限 vi var svn REPOSITORY NA
使用 jQuery 将鼠标悬停在一个元素上并将效果应用于另一个元素

div class views row div h5 class product name a href Dots a h5 div div class views field div class field content a href
mysql (5.1) 插入语法 > col_name=value?

mysql 有没有办法插入一个newrow 的方式更直接地将值与其列关联起来而不是table col name values value 当一次插入大量值时将它们内联列出会变得相当混乱并导致错误错误我正在寻找更像的东西UPDATE的
构建阶段创建 Plist 并将其复制到资源包中

我制作了一个 ruby 脚本可以从其他格式的数据生成 Plist 该脚本位于 xcode 的项目文件夹内我已经创建了一个调用我的脚本的自定义运行脚本构建阶段 echo Running xls Plister cd PROJECT DIR
google.appengine.ext Python 模块导入错误没有名为 google.appengine.ext 的模块

Python 2 7 6 用于 Google App Engine 的 Python 的 Google API 客户端库谷歌开发者指南 https developers google com api client library pyth
dart lang 中的自定义注释/元数据

谁能给我解释一下 Dart 中注释的使用吗在文档中我找到了这个例子 library todo class todo final String who final String what const todo this who this
在 android API29+ 中检测来电和去电

关于在 android 中检测传入和传出呼叫有很多问题但它们都很旧而且 android 不推荐使用有用的功能并且 google play 拒绝我的应用程序因为我正在使用它们为了检测拨出电话我使用了
在聚合管道、MapReduce 或 runCommand 中使用存储的 JavaScript 函数

有没有办法使用保存为的用户定义函数db system js save 在管道或mapreduce中您保存到的任何函数system js可供 JavaScript 处理语句使用例如 where http docs mongodb org
在android自动完成文本视图中覆盖过滤器结果？

这几天我一直在纠结这个问题我试图在android中设置一个自动完成文本视图其中用户输入一个键自动完成建议是值但是我现在已经尝试了大约10种不同的方法扩展BaseAdapter SimpleAdapter 和现在的 ArrayAda
仅从工作副本中删除文件，但不从存储库中删除文件

由于我在网上找不到上述问题的答案所以我自己提出了解决方案这是一个手动过程但我找不到任何其他标准解决方案所以这里是假设你想删除该文件test txt从目录work 现在如果您通过以下方式强制删除 test txt rm rf 测试
并非所有代码路径都返回“值”

您好我正在尝试制作一个主脑游戏让用户猜测 4 10 之间的数字序列而不是颜色但由于某种原因我的 GetRandomNumberCount 和生成随机数给我错误并非所有代码路径都返回值任何指导将不胜感激 public static
构建器模式和大量强制参数

迄今为止我使用的是下列的 http rwhansen blogspot com 2007 07 theres builder pattern that joshua html构建器模式的实现与描述的实现相反 here http en wi
如何知道哪个应用程序正在读取或写入文件

Android 或 Android NDK 中是否有任何方法可以知道哪个应用程序正在磁盘或设备内存上读取或写入数据您可以在输出中查找您的文件 ls l proc fd 为此您不需要任何特殊工具或根解释每个正在运行的进程都有一个条目
Lotus Notes 使用 Java api 按日期搜索

我试图从 Lotus Notes 数据库中按日期选择记录但在正确设置日期格式方面遇到了麻烦这是相关代码 public void runNotes Session s try s NotesFactory createSession St
为什么我会得到负值位移的奇怪结果？

这个问题不是重复的这个问题 https stackoverflow com questions 1857928 right shifting negative numbers in c 我遇到过一种情况我可能必须将正数字左移负值即
根据查找表替换数据框中的值

我在替换数据框中的值时遇到一些问题我想根据单独的表替换值下面是我正在尝试做的事情的一个例子我有一张表其中每一行都是客户每一列都是他们购买的动物我们称这个数据框为table gt table P1 P2 P3 1 cat liza

根据查找表替换数据框中的值

根据查找表替换数据框中的值 的相关文章

随机推荐

热门标签

根据查找表替换数据框中的值的相关文章