查找数据帧列表中同一列中的所有重复值并将其转换为 NULL

2024-06-19

我有一个清单BELGIAN_COAST_list包含数百个数据帧（df1, df2, ...) 15 列 X 1000 行。每个数据帧的最后一列称为Chemicals并包含一些字符，例如Sulfate or Ammonia。但是这一列有很多行Chemicals每个数据帧中都有重复（由于测量设备的技术问题）。

我希望将重复的字符转换为NULL这样它们只会在我列表中每个 df 的整列中出现一次。

我尝试过了unlist my BELGIAN_COAST_list进而

BELGIAN_COAST$Chemicals[duplicated(BELGIAN_COAST$chemicals)] <- ""

在这种情况下，字符在合并的整个数据框中只会出现一次。我希望它们在每个数据框中出现一次（df1$Chemicals, df2$Chemicals, ...) 我的BELGIAN_COAST_list。因此我需要将数据保存在 df 列表中。

有人有什么想法吗？

In base R:

lapply(BELGIAN_COAST_list, function(x) {
  dups <- duplicated(x[, ncol(x)]) 
  x[dups, ncol(x)] <- NA_character_ 
  x})

这是通过最后一列按位置完成的。如果您想按名称调用该列，则可以更改ncol(x) to "Chemicals".

Using tidyverse:

library(tidyverse)

purrr::map(BELGIAN_COAST_list, ~ dplyr::mutate(., across(last_col(), ~ ifelse(duplicated(.), NA_character_, .))))

再次通过列名更改来调用last_col() to Chemicals: 请注意这里缺少引号。

无论哪种情况，如果Chemicals是数字然后使用NA代替NA_character_.

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

查找数据帧列表中同一列中的所有重复值并将其转换为 NULL 的相关文章

如何在ggplot2中正确使用facet_grid？

我试图使用以下代码为每个配置文件生成一个图表但我不断收到至少一层必须包含用于分面的所有变量错误我花了最后几个小时试图让它发挥作用但我做不到我相信答案一定很简单有人可以帮忙吗 d structure list category
R data.table roll="nearest" 实际上并不是最近的

鉴于以下 data tables 我很惊讶地看到 5 9 索引与 5 而不是 6 匹配我不太明白发生了什么事 dat lt data table index c 4 3 5 9 1 2 datval runif 3 10 datstuff
Pandas：根据除一行之外的其他多级列对最里面的列进行分组排序

这是我的扩展previous question https stackoverflow com questions 65021214 pandas sort innermost column group wise based on othe
使用 R 以双对数刻度（以 10 为底）绘制分布的密度线

我知道参数log xy 但我不知道你是否可以控制对数刻度的底数我的猜测是 10 可能是默认值而且我在下面的具体问题上并不幸运我怎样才能重现以下情节从这个来源 http www uvm edu pdodds teaching cour
R 线图上的两个数据集，但使用相同的 X 和 Y 轴？

我正在尝试在 R 中的图表上绘制两条线数据与死囚区相关 CSV 有三列第一列是年份第二列是死囚区人口第三列是当年的处决数量我已经到了可以画两条 X 轴相同的线的地步但由于值的范围相互重叠 Y 轴变得混乱举个例子每个给定的年份
为什么 ggplot2 图例不结合手动填充和缩放值？

预期行为如果我用 ggplot2 创建一个绘图并使用单独的形状和填充比例来描绘数据我希望图例会在白色填充点看起来是空心的和黑色填充点看起来不空洞的在下面的示例代码中 Windows 的图例项应为白色空心点 Linux 的
保存/加载 data.table 的最快方法

我想做的实际上是使用最快的可用方法来存储data table以便进一步处理大致如下从 CSV RDS 读取原始数据将其转换为data table 将其保存为针对重新读取而优化的格式 RDS 似乎不适用于data table 是对的吗
循环遍历列并将字符串长度添加为新列

我有一个包含多列的数据框并且希望为每个列输出一个单独的列其中包含每行的长度我试图迭代列名称并为每列输出一个附加有 length 的相应列例如 col1 col2 将转到 col1 列2 col1 长度列2 长度我正在使用的代码
Python：按组计算数据框中的特定出现次数

假设我有一个 df df pd DataFrame id 12 35 37 67 99 78 product banana apple banana pear banana apple reordered 1 0 0 1 1 1 id pr
将值添加到 R 中 for 循环内的向量

我刚刚开始学习 R 我编写了这段代码来学习函数和循环 squared lt function x m lt c for i in 1 x y lt i i c m y return m squared 5 NULL 为什么这个返回NULL
从 Pandas 的 DatetimeIndex 中创建月份和年份的列表

我有一个信息数据框我将索引设置为接收的日期和时间现在我想要一个清单我设置 df 索引这样做 df index pd to datetime df index format m d Y H M 这给了我这个 print df index
不同大小组的高效递归随机抽样

这个问题是我之前关于递归随机抽样问题的后续问题高效的递归随机采样 https stackoverflow com questions 69824065 efficient recursive random sampling 当组大小相同或每
ggplot2 的组合图（不在单个图中），使用 par() 或 layout() 函数？ [复制]

这个问题在这里已经有答案了我一直在考虑使用 par 或 layout 函数来组合 ggplots 可以使用这些功能吗假设我想绘制 ggplot 散点图和 ggplot 直方图我想将这两个地块合并起来而不是在一个地块中是否适用我在
数据框应用不接受轴参数

我有两个数据框 data and rules gt gt gt data gt gt gt rules vendor rule 0 googel 0 google 1 google 1 dell 2 googly 2 macbook 我正在
在 R/ggplot2 中将字符串转换为函数参数的最佳方法？ [复制]

这个问题在这里已经有答案了我正在开发一个闪亮的应用程序用户可以选择可以使用 ggplot2 绘制哪些变量但是我完全不确定将字符串即要绘制的变量的名称转换为合适的函数参数的最佳方法考虑以下非常人为的有效的示例 df lt dat
匹配向量内的向量

I have vec1 lt c 0 0 0 1 1 0 1 1 1 0 0 1 vec2 lt c 1 1 我预计 magicFUN x vec1 y vec2 1 4 7 8 这意味着我想要一个完整向量在另一个向量内的位置 match
抑制 r markdown 中的控制台输出，但保留绘图

嗨我有以下降价块 r echo FALSE warning FALSE message FALSE error FALSE lapply obj function x plot x main some plot box axis 1 at
Spark中DataFrame、Dataset、RDD的区别

我只是想知道有什么区别RDD and DataFrame Spark 2 0 0 DataFrame 只是一个类型别名Dataset Row 在阿帕奇火花你能将其中一种转换为另一种吗首先是DataFrame是从SchemaRDD 是的
为闪亮的应用程序创建桌面图标

当我在基本 R 提示中提供以下代码时我会在浏览器中打开一个闪亮的应用程序 shiny runApp C Myapp 我使用 Windows 7 我试图创建一个桌面图标以避免我的客户每次想要使用该应用程序时都键入上述代码我创建了一个桌面
哪种 LaTeX 包与 knit 一起使用以获得更多的表格控制？禁忌？

我正在用 knitr 写一张更长的桌子xtable和tabular environment longtable 在 longtable 包中时print将它们纳入我的 Rnw file 问题是我对longtable环境控制不够我有一些文本

随机推荐

将 spring-security 与 spring-webflux 结合使用时禁用 WebSession 创建

我正在使用 Rest api 运行无状态 spring boot 应用程序并希望按照所述禁用 WebSessions 的创建https www baeldung com spring security session https www
Rails 3 best_in_place 编辑在不刷新页面的情况下无法工作

我从Bernat的博客rails迷你教程中获取了评论代码我尝试使用他的 best in place gem 添加就地编辑功能在大多数情况下它工作正常我的代码部署在http falling spring 3964 herokuapp c
您有什么方法可以从相机胶卷转到新的视图控制器吗？

我正在尝试从相机胶卷转到新的视图控制器所以基本上我希望能够选择一张图片并且在选择图片后它将显示在新视图控制器上的 imageView 上那个很难做吗 void imagePickerController UIImagePickerC
如何在 UIAlertView (iOS) 中的其他两个按钮（堆叠）之间添加取消按钮

我正在尝试创建一个带有三个按钮将堆叠的 UIAlertView 我希望取消按钮位于其他两个按钮之间的中间我尝试将 cancelButtonIndex 设置为 1 但如果还有其他两个按钮它只会将它们放置在索引 0 和 1 处我知
获取 Facebook 事件中不支持获取请求

我对 Facebook Graph 结束获取数据事件有疑问如果我这样做从这里 https developers facebook com tools explorer https developers facebook com tool
ruby中如何将binary32转换为float

我有一个以 IEEE 32 编码的 binary32 如何将 0x0040EDC2 转换为 118 625 我尝试了几种打包和解包选项但没有成功 IEEE http en wikipedia org wiki Single precisi
dplyr，do()，从模型中提取参数而不丢失分组变量

R 帮助中关于 do 的示例略有不同 by cyl lt group by mtcars cyl models lt by cyl gt do mod lm mpg disp data coefficients lt models gt d
如何填充依赖于全局 jQuery 和 lodash 的非 CommonJS、非 AMD 包？

我是第一次使用 jspm 并且已经遇到了障碍我需要弄清楚如何填充位于我们公司私人 npm 注册表中的专有脚本包裹 widget 驻留在私有 npm 注册表中 Is notCommonJS UMD AMD 模块依赖于取决于lodas
在 IntelliJ 上进行 Google App Engine Java 开发？

令人烦恼的是 Google App Engine 已成为其中的另一个项目他们只发布 Eclipse 插件如 Spring Webflow 而我更喜欢 IntelliJ 你能用IntelliJ成功运行本地测试环境吗并调试部署本地或实时
Javadoc 1.5 和 1.6 中缺少 enum.valueOf(String name)

这可能是一个愚蠢的问题但我正在使用该方法enum valueOf String name 那里没问题只是当我检查 javadoc 以了解有关此方法的更多信息时我找不到它有javadoc用于valueOf Class
这有什么意义：*(void **)(&fptr) = dlsym(handle, "my_function");`

代码来自这个页面 http pubs opengroup org onlinepubs 009695399 functions dlsym html http pubs opengroup org onlinepubs 009695399
Android 通知 - 显示完整消息

我的 Android 应用程序必须能够向一大群人发送简短的警报执行此操作的明显位置是在通知中心完整的通知毫无问题地显示在股票代码中但在通知中心用户只能看到前几个单词然后是省略号通知并不长最多也就10 15个字如何使文本自动换
对 Java 中 *any* 类的所有实例进行全排序

我不确定以下代码是否能确保 Comparator 的 Javadoc 中给出的所有条件 class TotalOrder
从所有数据帧列中删除子字符串

我有一个单词列表大约 1000 个单词我称之为负面单词 CAST ARTICLES SANITARY JAN CLAUSES SPECIAL ENDORSEMENT 我很快就会用这个单词列表制作一个数据框我还有一个数据框看起来像 F
Gtk/GtkD 在窗口调整大小时检测鼠标按钮的释放？

我正在尝试改进我用 GtkD Gtk 的 D 绑定编写的绘图库具有很多点的散点图需要很长时间才能调整大小我想重新缩放图像允许像素化同时用户拖动窗口边缘来调整大小并且仅在释放鼠标按钮时重新渲染它是否有 API 可以检测在调整窗口
使用 Android WebViewClient 启用特定 SSL 协议

我的应用程序使用WebViewClient与服务器建立 SSL 连接服务器配置为仅接受 TLSv1 1 及以上协议使用 Android 时如何检查哪些 SSL 协议是 a 支持的和 b 默认启用的WebViewClient在设备上如
如何使用 PHP 从图像文件中读取 Lightroom 关键字？

我有一个照片社区 www jungledragon com http www jungledragon com 允许用户上传照片我的平台是 PHP CodeIgniter 作为上传过程的一部分我已经使用 PHP 读取 EXIF 信息ex
为什么使用 SQL Server 2008 地理数据类型？

我正在重新设计客户数据库我想要与标准地址字段街道城市等一起存储的新信息之一是地址的地理位置我想到的唯一用例是当无法找到地址时允许用户在 Google 地图上绘制坐标这种情况通常发生在该地区是新开发的或位于偏远农村地区时我
iOS 相互认证

我正在尝试在 IOS 5 中实现相互身份验证但遇到了麻烦 NSUnderlyingError Error Domain kCFErrorDomainCFNetwork Code 1200 An SSL error has occurred
查找数据帧列表中同一列中的所有重复值并将其转换为 NULL

我有一个清单BELGIAN COAST list包含数百个数据帧 df1 df2 15 列 X 1000 行每个数据帧的最后一列称为Chemicals并包含一些字符例如Sulfate or Ammonia 但是这一列有很多行Chemic

查找数据帧列表中同一列中的所有重复值并将其转换为 NULL

查找数据帧列表中同一列中的所有重复值并将其转换为 NULL 的相关文章

随机推荐

热门标签