R：根据列中的类别从数据框中删除重复项

2023-11-25

这是我的示例数据集：

      Name Course Cateory
 1: Jason     ML      PT
 2: Jason     ML      DI
 3: Jason     ML      GT
 4: Jason     ML      SY
 5: Jason     DS      SY
 6: Jason     DS      DI
 7: Nancy     ML      PT
 8: Nancy     ML      SY
 9: Nancy     DS      DI
10: Nancy     DS      GT
11: James     ML      SY
12:  John     DS      GT

我想删除重复的行，以便在数据框中具有唯一的行。删除重复行是基于列中的值category。对值的偏好category列按以下顺序给出：{'PT','DI','GT','SY'}。

我的输出数据框如下所示：

  Name Course Cateory
1: Jason     ML      PT
2: Jason     DS      DI
3: Nancy     ML      PT
4: Nancy     DS      DI
5: James     ML      SY
6:  John     DS      GT

目前，我正在使用以下组合for循环和if健康）状况。由于输入数据帧很大（一千万行），因此需要很长时间。有没有更好、更有效的方法来执行相同的操作？

这是一个满足您要求的代码片段：

df$Category <- factor(df$Category, levels = c("PT", "DI", "GT", "SY"))

df <- df[order(df$Category),]

df[!duplicated(df[,c('Name', 'Course')]),]

输出：

Name Course Category
Jason     ML       PT
Nancy     ML       PT
Jason     DS       DI
Nancy     DS       DI
John      DS       GT
James     ML       SY

想法是我们根据优先级结构进行排序。然后我们应用独特的操作，这将返回第一个匹配项。回报将是我们想要的。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

R：根据列中的类别从数据框中删除重复项的相关文章

如何在 R 中解析堆叠多个 JSON 的文件？

我在 R 中有以下堆叠 JSON 对象 example1 json ID 12345 Timestamp 20140101 Usefulness Yes Code event1 A result 1 ID 1A35B Timestamp
dplyr +“meta”-columns：当列包含要使用的其他列的名称而不是数据时

我想知道以下问题在 dplyr 中是否有一个优雅的解决方案要提供一个简单的可重现示例请考虑以下 data frame df lt data frame a 1 5 b 2 6 c 3 7 ref c a a b b c stringsA
如何从R中串扰的filter_select中删除（全部）？

我遵循图 16 7 的示例https plotly r com client side linking html https plotly r com client side linking html并且无法弄清楚为什么有一个名为全部的
R中无法连接odbc数据库

我一直在尝试使用以下命令将我公司的 DMS 连接到 RodbcConnect命令但收到以下消息 myConn lt odbcConnect NZSQL uid cejacobson pwd password Warning message
如何更改 r 中的树状图标签

我在 R 中有一个树形图它基于使用 hclust 的分层聚类我正在对不同颜色的标签进行着色但是当我尝试使用以下命令更改树图的标签集群所基于的数据帧的行时dendrogram dendrogram gt set labels dat
更新两组单选按钮 - 闪亮

我问了这个问题反应式更新两组单选按钮闪亮 https stackoverflow com questions 35040579 update two sets of radiobuttons reactively shiny 昨天但也
R：（中缀）运算符的两个定义之间的冲突：如何指定包？

在 R 中每当两个包定义相同的函数时很容易指定要使用哪个包pkg foo 但是当冲突的功能是一个时你该怎么办 infix运算符即使用定义举个例子两者ggplot2 and crayon define 有没有一种方法可以让我默认
R 中的点图每行有多个值

我有以下 R 输入文件 car 1 car 2 car 3 car2 1 car2 2 car2 3 然后我使用以下命令来绘制图表 autos data 点图 autos data V2 autos data V1 但这将每个汽车和 ca
在 Windows / Linux 中创建 Mac 包

我自己努力制作一个 r 包我按照 stackoverflow 中上一个问题的说明进行操作如何为外行开发软件包 http cran r project org bin windows Rtools 以下是我根据上一个问题采取的步骤在新的
在ggplot2中，箱线图线的末尾代表什么？

我找不到箱线图线条端点代表什么的描述 For example here are point values above and below where the lines end 我意识到盒子的顶部和底部是第 25 个和第 75 个百分位数
使用 R 下载压缩数据文件、提取并导入 .csv

我正在尝试使用以下方法从网页下载并提取 csv 文件R 这个问题是重复的使用 R 下载压缩数据文件提取和导入数据 https stackoverflow com questions 3053833 using r to download
R 中具有 p 值的相关矩阵

假设我想要传导相关矩阵 library dplyr data iris iris gt select if is numeric gt cor y iris Petal Width method spearman gt round 2 现在
R 无法回忆起内存中的对象

我正在构建一个包含多个步骤的函数其中每个步骤都会创建一个对象某个步骤失败 temp3 并且无法找到前面的步骤对象错误未找到对象 temp2 我不知道为什么我有类似的函数遵循完全相同的结构每个步骤都遵循先前创建的对象在函数内
R 获取子字符串和正则表达式？

我有一组文件名字符串我想提取符号之后但文件扩展名之前的所有字符例如文件名之一是 HelloWorld you txt 我想返回字符串you 这是我的代码 hashPos grep name fixed TRUE dotPos len
R中具有特定条件的多列变异

我有这个数据 M1 M2 M3 UCL 1 2 3 1 5 我想在这种情况下创建新列如果M1大于UCL MM1将为 UP 否则为 NULL 如果M2大于UCL MM2将为 UP 否则为 NULL 如果M3大于UCL MM3将为 UP 否则
在列标题和配对变量中嵌入数据的数据透视表

假设我有这样的数据不幸的是变量值嵌入在列名称中 library tidyr library dplyr dat lt tribble group var1 var meta1 var2 var meta2 group1 5 2 cat
如何使用 Facet R 添加线条[重复]

这个问题在这里已经有答案了所以我有一个多面图我希望能够向其中添加随每个面而变化的线这是代码 p lt ggplot mtcars aes x wt geom histogram bins 20 aes fill factor cyl
按名称包含在单个对象中的多个列对 data.frame 进行排序？

我想排序一个data frame由多列组成理想情况下使用基础 R 无需任何外部包尽管如果有必要就这样吧读过如何按列对数据框进行排序 https stackoverflow com questions 1296646 how to s
R中data.frame（列表）的列平均值

Data https i stack imgur com ZYsmv jpg 请我需要计算此 data frame 中维吉尼亚币 Sepal Length 列的平均值 Sepal Length Sepal Width Petal Leng
从 leafletProxy() 返回渲染的传单地图

是否可以在渲染后在 Shiny 中检索传单地图下面是一个代码示例展示了如何生成地图leaflet 与返回的不同leafletProxy 即使它们在渲染时看起来完全相同是否有一个功能可能不同于leafletProxy 获取实际的 htm

随机推荐

WiFi 状态未启用

我正在尝试创建一个用于启用和禁用 wifi 的小部件 if myWifiManager isWifiEnabled System out println Toggle Wifi Enabled going to disable myWifi
_mm_shuffle_ps() 相当于整数向量 (__m128i)？

The mm shuffle ps 内在允许将浮点输入交错为输出的低 2 个浮点和高 2 个浮点例如 R mm shuffle ps L1 H1 MM SHUFFLE 3 2 3 2 将导致 R 0 L1 2 R 1 L1 3 R 2 H
为什么 jQuery 或 getElementById 等 DOM 方法找不到该元素？

可能的原因有哪些document getElementById id 或者任何其他 DOM 方法 jQuery 选择器找不到元素示例问题包括 jQuery 默默地无法绑定事件处理程序 jQuery getter 方法 val html t
Android - R 无法解析为变量[重复]

这个问题在这里已经有答案了可能的重复 R 无法解析 Android 错误我遇到了一个以前遇到过的问题但我不明白原因我的项目和代码很好因为它昨天正在运行我今天打开 Eclipse 整个项目看起来都包含错误我相信这是某种构建路径问
数据框多个变量之间的相关性

我有一个data frame共 10 个变量R 让我们称呼他们吧var1 var2 var10 我想找到其中之一的相关性var1关于var2 var3 var10 我们怎样才能做到这一点 cor函数可以一次找到两个变量之间的相关性通过使用
json erb模板找不到其他html部分

我试图有一个 json 响应其中某些值是由部分呈现的 html projects Controller rb def index respond to do f f json end end index json erb html 但我收
SignInManager.PasswordSignInAsync() 成功，但 User.Identity.IsAuthenticated 为 false

我是 ASP Net Core 的新手正在尝试创建用户身份验证系统我正在使用 ASP Net Core Identity 用户管理我有以下用于登录用户的代码 Areas Identity Pages Account Login csh
如何从qml访问ListView的当前项目

我有一个存储和编辑笔记的应用程序笔记列表显示在列表视图中如下所示 Page id noteList title i18n tr QNote visible false Column anchors fill parent ListVie
如何在 Windows 7 64 位上安装 libcurl

我在安装时遇到以下错误 C RailsInstaller Ruby2 2 0 lib ruby gems 2 2 0 gems json web token 0 3 2 lib json web token rb 36 warning al
我在尝试访问 Amazon Elastic Bean Stalk 上的 Spring Boot 应用程序时收到错误 404

我开发了一个spring boot应用程序我已将以下条目放入src main resources application properties spring mvc view prefix spring mvc view suffix j
如何在 Django 中设置 JavaScript 文件的内容类型

我有一个 Django 应用程序它需要多个 JavaScript 文件在 Chrome 中我收到错误资源解释为脚本但使用 MIME 类型 text html 进行传输据我所知参见2 为了解决这个问题我需要配置 Django
在列表框中设置选定的项目而不循环

我有一个多选列表框我将其绑定到数据表 DataTable 包含 2 列描述和值这是列表框填充代码 DataTable copytable null copytable GlobalTable Copy GlobalTable is a
尽管显然存在可行的答案，但 scipy.optimize.linprog 无法找到可行的起点

向量 k 似乎满足所有约束我在这里缺少什么吗谢谢 import numpy as np from scipy optimize import linprog A ub 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
使用 JsonServiceClient 获取 HttpResult

我使用 servicestack 的新 API 从其余服务方法之一返回 HttpResult 有没有办法使用 JsonServiceClient 获取 HttpResult For ex JSonServiceClient Send
PHP XMLReader 读取、编辑 Node、写入 XMLWriter

我有一个非常非常大的 XML 文件数百万条记录由于速度和内存限制我计划使用XMLReader XMLWriter 我需要读取该文件获取一条记录更改其属性最后再次保存 XML 为了进行测试我创建了一个 XML 文件并使用以下几行
[OptionalField] 属性怎么了？

据我了解当我反序列化缺少此新成员的类的旧版本时我必须使用 OptionalField 属性来装饰类的新版本中的新成员但是当序列化类后添加 InnerTranslator 属性时下面的代码不会引发异常我在 onDeserializ
在flutter中使用path_provider包时出错

我正在尝试使用 flutter 中的 path provider 包获取应用程序文档目录我正在使用配置单元数据库所以我需要路径这是我的代码 void main async final appDocsDir await getAppli
当焦点位于 WindowsFormsHost 内时，为什么 Keyboard.FocusedElement 为 null？它破坏了 WPF 命令路由

我有一个习惯路由UI命令 MyCommand通过执行ICommand 执行顶部窗口有一个绑定来处理它
Android：凌空无连接错误

我正在尝试连接到 REST 服务器我使用 Spark 创建的通过安卓我可以使用 POSTMAN Chrome 插件发送 POST 请求并得到什么我想要但是当我尝试从 Android 发送 POST 请求时设备我收到以下错误
R：根据列中的类别从数据框中删除重复项

这是我的示例数据集 Name Course Cateory 1 Jason ML PT 2 Jason ML DI 3 Jason ML GT 4 Jason ML SY 5 Jason DS SY 6 Jason DS DI 7 Nanc

R：根据列中的类别从数据框中删除重复项

R：根据列中的类别从数据框中删除重复项 的相关文章

随机推荐

热门标签

R：根据列中的类别从数据框中删除重复项的相关文章