如何从列的每一行中删除重复的字符？

2024-01-03

如何使用 R 从列的字符串中删除重复字符？例如，这是我的专栏：

df<- data.frame(name = c(A="a,a,b,c,d,d,d",
                            B="a,b,b,b,f",
                            C="d,d,d,d",
                            D="a,a"))

还有我期待的专栏：

df<- data.frame(name = c(A="a,b,c,d",
                            B="a,b,f",
                            C="d",
                            D="a"))

一个选项map and strsplit

library(tidyverse)
df %>%
   mutate(name = strsplit(as.character(name), ",") %>% 
   map(~toString(unique(.x))))
#        name
#1 a, b, c, d
#2    a, b, f
#3          d
#4          a

Or in base R使用正则表达式

sub(",$", "", gsub("([a-z],)\\1+", "\\1", paste0(df$name, ",")))
#[1] "a,b,c,d" "a,b,f"   "d"       "a"

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

DataFrame

duplicates

如何从列的每一行中删除重复的字符？的相关文章

在 Linux 下更改 RStudio 用户界面（不是图形等）中的字体大小

This is not关于更改使用 RStudio 生成的图表中的字体大小的问题我已经知道该怎么做了我在配备视网膜显示屏的 MacBook Pro 上的 Linux 下使用 RStudio 我使用 KDE 作为我的窗口管理器我可以
根据共同值对两个数据帧求和

我有一个看起来像的数据框 day of week count 1 0 3 2 3 1 3 4 1 4 5 1 5 6 3 另一个喜欢 day of week count 1 0 17 2 1 6 3 2 1 4 3 1 5 4 5 6 5
通过 RCpp 返回 NA

新手 RCpp 问题在这里 How can I make a NumericVector returnNA到R 例如假设我有一个 RCpp 代码它分配NA到向量的第一个元素 RCpp export NumericVector myFun
如何根据查找表匹配多列

我有以下两个数据框 lookup lt data frame id c A B C price c 1 2 3 results lt data frame price 1 c 2 2 1 price 2 c 3 1 1 我现在想要浏览所有列
在 R 中收集多组列[重复]

这个问题在这里已经有答案了我有一个宽数据框需要将其收集或融化成一个高数据框我遇到的问题是我有几组列需要保持关联分组我每个表单提交有 2 个用户每个用户有 3 列数据我想将这 6 列基本上以 3 组的形式堆叠起来以便每个用户都
如何处理包内部的 R 数据？

我正在开发的 R 包需要多个 R 数据对象例如预先计算的模型和参数目前我将包的数据目录中的每个对象放在单独的 RData 文件中使用该包时用户可以使用数据功能将这些对象附加到他们的环境中我想要的行为是在加载包时数据对
通过 r 中的组变量进行汇总

我有一个数据框如下 head newStormObject FATALITIES INJURIES PROPVALDMG CROPVALDMG EVTYPE total 1 0 15 2 5e 05 0 TORNADO 15 2 0 0 2
R Shiny - 使用 DataTable 移动列名称

我有一个非常复杂的闪亮代码其中有几个面板和这些面板内的几个表格启动应用程序时列名称与列值正确对齐但是一旦我更改应用程序表格下的页码列名称就会移动到左侧而值仍保留在中间如何强制应用程序使列名称与列值对齐一个可重现的例子 li
Pandas - 合并数据框以将所有值保留在左侧，如果“左侧没有键”，则从右侧“插入”值，否则“更新”左侧现有的“键”

我有两个数据框 df1 和 df2 np random seed 0 df1 pd DataFrame key A B C D id 2 23 234 2345 2021 np random randn 4 df2 pd DataFrame
R - 如何为数据范围内的缺失值绘制条形图零点？

假设我对 1 到 10 之间的整数的 200 个点有 10 个观察值 mysample sample rep seq 1 10 20 10 我想用条形图绘制它 barplot table mysample barplot https i s
dplyr：同一公式中全年每日值的总和以及特定每日值的总和

Using df数据框 date lt rep as Date seq as Date 2003 01 01 as Date 2005 12 31 by 1 format Y m d 9 site lt c rep Site 1 3 109
在 ggplot2 上绘制世界地图

我一直在尝试在 ggplot2 上绘制世界地图我跟踪了电子邮件的线索带 l 的 ggplot 地图 https stackoverflow com questions 9558040 ggplot map with l但我确实遇到了同样
rollapply用于累积窗口[关闭]

Closed 这个问题需要调试细节 help minimal reproducible example 目前不接受答案我试图弄清楚如何在数据窗口上使用 R rollapply 该窗口从数据的开头累积扩展在时间 t 滚动应用应使用 1 t
ggarrange：合并多个图

附图来自以下文章正在使用 ggarrange 合并这些图 http www sthda com english articles 24 ggpubr publication ready plots 81 ggplot2 easy way
在 r 中的字符串内循环以输出具有向量化值的表达式

示例数据 gt DF A B C 1 11 22 88 2 11 22 47 3 2 30 21 4 3 30 21 gt r 1 A A i B B i A A i C C i 3 B B i C C i A A i B B i C C
R 的 read.csv 在第一列名称前面加上垃圾文本[重复]

这个问题在这里已经有答案了我已将数据从 SQL Server Management Studio 中的结果网格导出到 csv 文件 csv 文件看起来正确但是当我使用 read csv 将数据读入 R 数据帧时第一个列名称前面带有如
零膨胀泊松分布：无法估计参数，错误代码为 100

以下是我正在研究的一种数据集 data lt c 0 1 0 11 2 0 3 0 0 2 1 3 1 0 1 0 0 0 2 3 0 0 0 8 1 1 1 0 1 1 2 7 0 0 0 5 2 3 6 1 1 5 2 9 0 0 1
如何在 R 中解析堆叠多个 JSON 的文件？

我在 R 中有以下堆叠 JSON 对象 example1 json ID 12345 Timestamp 20140101 Usefulness Yes Code event1 A result 1 ID 1A35B Timestamp
dplyr +“meta”-columns：当列包含要使用的其他列的名称而不是数据时

我想知道以下问题在 dplyr 中是否有一个优雅的解决方案要提供一个简单的可重现示例请考虑以下 data frame df lt data frame a 1 5 b 2 6 c 3 7 ref c a a b b c stringsA
如何从 Pandas 数据框函数调用中回顾之前的行？

我正在研究回测交易系统我有一个包含 OHLC 数据的 Pandas 数据框并添加了几个计算列 https stackoverflow com questions 12376863 adding calculated columns t

随机推荐

函数声明后的 __asm__("__isoc99_scanf")

我在预处理的 C 代码中看到了以下代码什么是asm函数声明后做什么 extern int scanf const char restrict format asm isoc99 scanf 显然它使函数调用编译为 call isoc99
Android 谷歌分析 xml 文件

我正在读一本新书谷歌 Android 分析教程 https developers google com analytics devguides collection android v4 很奇怪首先当我在我的 gradle 中添加这个字符
使用 OpenCV 扫描文档

我正在开发一款适用于 Android 的文档扫描仪类似于this https play google com store apps details id com intsig camscanner 我对此进行了搜索发现可以使用 Open
BuildContext 在 Flutter 中做什么？

什么是BuildContext我们可以从中得到什么信息 https docs flutter dev flutter widgets BuildContext class html https docs flutter dev flutte
禁用特定语言功能的自动完成功能

我导入vector from std using include
将远程对象反序列化为最窄的可访问类

In 共享 jar I have abstract class MyParent abstract class MyClass MyParent getFoo 服务器 jar包含 abstract class MyChild extends
android:textAllCaps="false" 不适用于 TabLayout 设计支持

我已经设定android textAllCaps false in my android support design widget TabLayout认为它只显示全部大写的选项卡标题如何删除所有大写字母设计库更新 23 2 0 原始答
算法 - 字符串相似度分数/散列

有没有一种方法可以计算字符串的一般相似度分数在某种程度上我不是将两个字符串比较在一起而是为每个字符串获取一些数字分数哈希这些数字分数可以稍后告诉我两个字符串是否相似两个相似的字符串应该具有相似接近的分数哈希值让我们
将数据从 Excel 导出到 Access - 错误：参数不可选

当我按下按钮时我尝试使用 Excel 文件上的 VBA 代码将数据从 Excel 2010 导出到 Access 2010 我只想将水质表中的数据导出到数据库中的水质表 Excel 文件和访问文件中还有其他表和表格我的实际代码是
PHP正则表达式非捕获非匹配组

我正在制作一个日期匹配正则表达式一切进展顺利到目前为止我已经得到了 0 3 0 9 0 1 0 9 20 0 1 0 9 它希望能够匹配 21 世纪的一位数或两位数的日期和月份以及两位数或四位数的年份一些尝试和错误让我走到了这一
flutter：如何实现ListView中的文字逐渐淡出？

I want to achieve the style like the picture A ListView containing a few Container and each container has some text When
2.2.2 eBean的@Transactional在抛出Exception时不回滚事务

似乎在将 Play Framework 2 2 2 与 eBean ORM 一起使用时 play db ebean Transactional 抛出异常时不回滚事务你们有人知道这个问题以及如何解决它吗我看到 eBean 在他们的 ava
如何从 Pandas DataFrame 制作分组条形图[重复]

这个问题在这里已经有答案了如何使用 pyplot 绘制此数据框 Team Boys Girls 0 Sharks 5 5 1 Lions 3 7 data Team Sharks Lions Boys 5 5 Girls 5 6 df p
python中存储时间长度的类型是什么？

我正在使用 total time datetime time int total time text replace h replace m split 0 int total time text replace h replace m s
无法在 Terminal.app OSX 上使用 Ctrl+A 和 Ctrl+E（bash 键绑定）

因此由于某些奇怪的原因我无法在 Terminal app 中的 bash 上使用 A 和 E 但是我可以使用 C R Y L 和所有其他键绑定绑定 p显示 C a 行首 C e 行尾所以我认为还有其他东西阻碍了这些键绑定知道我该如
为什么UTF-8使用多个字节来表示某些字符？

我最近经历了一个article http www sitepoint com do you know your character encodings 关于字符编码我对那里提到的某一点感到担忧在第一张图中作者展示了字符它们在各种字符
如何将下一个最大数字插入数据库

我编写了一段 mysqli 代码它将把值插入数据库 insertsql INSERT INTO Teacher TeacherId TeacherForename TeacherSurname TeacherEmail TeacherAl
在 Objective-C 中打印多页

我有一个像这样的打印功能 void sendToPrinter int code NSPrintInfo printInfo NSPrintInfo sharedInfo NSPrintOperation printOp NSMutable
在 Windows 应用商店应用程序中获取 CoreDispatcher 的正确方法

我正在构建一个 Windows 应用商店应用程序并且有一些代码需要发布到 UI 线程为此我想检索 CoreDispatcher 并使用它来发布代码似乎有几种方法可以做到这一点 First way Windows Applicatio
如何从列的每一行中删除重复的字符？

如何使用 R 从列的字符串中删除重复字符例如这是我的专栏 df lt data frame name c A a a b c d d d B a b b b f C d d d d D a a 还有我期待的专栏 df lt data f

如何从列的每一行中删除重复的字符？

如何从列的每一行中删除重复的字符？ 的相关文章

随机推荐

热门标签

如何从列的每一行中删除重复的字符？的相关文章