如何检查可以找到多少列字符[重复]

2024-03-21

我有一个包含 4 列的数据集,其中包含名称,其中名称的数量和名称的顺序在列之间有所不同。某些列还可以包含相同的名称两次或更多次。看起来如下:

df<- data.frame(x1=c("Ben","Alex","Tim", "Lisa", "MJ","NA", "NA","NA","NA"), 
x2=c("Ben","Paul","Tim", "Linda", "Alex", "MJ", "Lisa", "Ken","NA"), 
x3=c("Tomas","Alex","Ben", "Paul", "MJ", "Tim", "Ben", "Alex", "Linda"), 
x4=c("Ben","Alex","Tim", "Lisa", "MJ", "Ben", "Barbara","NA", "NA"))

现在我必须首先提取数据集中的唯一名称。我使用以下代码做到了这一点:

u<- as.vector(unique(unlist(df)))

其次,我需要找到可以在所有 4 列(A 类名称)、4 列中的 3 列(B 类名称)和 4 列中的 2 列(C 类名称)中找到的名称。

这就是我被困住的地方。我只能使用以下方法提取所有 4 列中包含的名称:

n<- ifelse(u%in%df$x1 & u%in%df$x2 & u%in%df$x3 & 
               u%in%df$x4", A, B)

因此,例如,Ben 将是 A 类名称,因为它可以在所有 4 列中找到,而 Lisa 将是 B 类名称,因为它只能在 4 列中的 3 列中找到。

Name Class
Ben    A
Lisa   B

是否有更好的方法根据可以找到的列数对唯一名称进行分类,以及如何对 B 类和 C 类名称进行分类?

提前致谢!


这是基于 R 的一个想法。我们循环遍历独特的元素并取rowSums当数据框与每个名称相等时。最大的结果就是你期望的输出

sapply(unique(c(t(df))), function(i) max(rowSums(df == i)))

#  Ben Tomas  Alex  Paul   Tim  Lisa Linda    MJ 
#    3     1     3     1     3     2     1     3 
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

如何检查可以找到多少列字符[重复] 的相关文章

  • 基于 True/False 值的 Python 优雅赋值

    我想根据三个布尔值中的值设置一个变量 最直接的方法是 if 语句后跟一系列 elif if a and b and c name first elif a and b and not c name second elif a and not
  • 在 Sublime Text 2 状态栏中显示有关当前字符的信息

    我缺少其他文本编辑器经常提供的一项有用功能 在底部状态栏中 它们显示当前字符的 ASCII 和 UTF 代码 当前位置之前或之后的字符 现在不确定 我找不到执行此操作的包或执行此操作的本机功能 感谢您的帮助 我为此制作了一个插件 创建一个a
  • R Leaflet:添加多边形时传递 popupOptions。

    Within addPolygons 有一个popup参数就像addPopups 功能 区别 我认为 是当弹出窗口创建时addPolygons 可以单击多边形内的任意位置来触发弹出窗口 但是如果addPopups 被使用 单个lng and
  • SQL Server RODBC 连接

    有没有人有使用 RODBC 并连接到 MS SQL Server 2005 或 2008 的连接字符串示例 谢谢 library RODBC dbhandle lt odbcDriverConnect driver SQL Server s
  • R 未获取用户库

    我有一个带 R 3 6 0 的 Fedora 30 系统 用户库设置在Renviron就像这个 R LIBS USER R LIBS USER R x86 64 redhat linux gnu library 3 6 事实上 它出现在交互
  • 使用 fread 导入数据后所有列均作为字符

    我导入了一个 CSV 文件 包含文本列和数字列 x lt fread myfile csv header TRUE verbose T na strings c null null 但导入后 当我运行summary x 时 所有列都被视为字
  • 如何在R中的2行之间交换多个值

    我有一个大小为 10x100 的矩阵 如何交换前 30 列中第 1 行和第 2 行之间的值 我们可以反转前两行的行索引以及通过采取序列创建的列索引rounded 30 总列数用于交换行中的值 colS lt seq round ncol m
  • 如何在 R 中创建循环来生成随机样本列表?

    我正在尝试创建一个循环来创建一系列包含随机样本的对象 如下所示 sample lt ceiling runif 9 min 0 max 20 这是圆形制服的示例 但它可以替换为普通 泊松或任何您想要的 因此 我构建了一个循环来自动生成各种生
  • RPostgreSQL 无法关闭连接

    我有一个闪亮的应用程序 使用它连接到数据库RPostgreSQL 在应用程序结束时 连接关闭 驱动程序应该被卸载 但我收到错误 警告我连接未关闭 代码看起来像这样 in the app R file but not in the serve
  • 通过 rpy 将 SPSS 文件(.sav)导入 pandas 时如何保留标签?

    我正在寻找使用 SPSS 文件 sav pandas 在没有 SPSS 程序的情况下 典型文件转换为 csv 后的样子如下 在调查前两行的含义时 我不知道 SPSS 似乎第一行包含Labels 而第二行包含VarNames 当我将文件带入
  • 不理解..密度的行为

    在下面的数据框中 我预计密度的 y 轴值为 0 6 和 0 4 但它们是 1 0 我觉得我使用的方式显然缺少一些非常基本的东西 密度 但是我的大脑冻结了 我将如何使用 密度 获得所需的行为 任何帮助将不胜感激 df lt data fram
  • 指定生存图的自定义时间点

    我正在努力使用以下方法创建生存 累积事件图ggsurvplot函数从survminer包裹 我想为我的绘图指定自定义时间点 但我不知道该怎么做 这xlim and break x by参数有点帮助 但它们创建了均匀间隔的时间点和比我想要的更
  • R CMD 检查警告:在文档对象中使用的函数/方法...但不在代码中

    我正在写一个包 但一个持久的R CMD check警告阻止我完成包裹并将其发布到 CRAN 我用roxygen2对于内联文档 尽管这可能不是错误的根本原因 如果您知道如何删除此警告 我很可能可以找到一种方法来使用roxygen2 如何删除警
  • R 中 x 轴曲线的阴影面积

    所以我有一个位于 x 轴下方和上方的图表 并且想要对线和 0 之间的区域进行着色 在这里 我尝试使用多边形函数 但它只给出曲线下的面积 plot year difference1 type l polygon year difference
  • 通过删除连续的重复项来减少字符串长度

    我有一个包含 2 个字段的 R 数据框 ID WORD 1 AAAAABBBBB 2 ABCAAABBBDDD 3 我想通过仅保留字母而不是重复中的重复项来简化具有重复字母的单词 e g AAAAABBBBB应该给我AB and ABCAA
  • 如何拆分 data.frame -> 将合并应用于子集 -> 合并到 data.frame 中

    我真的不知道如何在不使用 for 循环的情况下实现这一目标 x lt c a b c d gt x 1 a b c d data lt data frame x c a b a b c a a b c d name c one one tw
  • R.scale() 和 sklearn.preprocessing.scale() 之间的区别

    我目前正在将数据分析从 R 转移到 Python 当在 R 中缩放数据集时 我将使用 R scale 根据我的理解 它将执行以下操作 x mean x sd x 为了替换该函数 我尝试使用 sklearn preprocessing sca
  • rowSums 全部 NA [重复]

    这个问题在这里已经有答案了 df lt data frame a c 1 1 NA 0 1 0 b c 0 1 NA NA 0 1 c c NA 0 NA 0 1 NA d c 1 NA NA 1 1 0 rowSums df 1 NA N
  • 如何更改数据表中的少数列名称

    我有一个包含 10 列的数据表 town tc one two three four five six seven total 需要生成我正在使用的列 一 到 总计 的平均值 DTmean lt DT lapply SD mean by t
  • 无法使用 cairo 安装 R

    我正在从源代码安装 R cd R 3 2 2 configure prefix pwd with cairo yes with readline no with libpng yes with x no 我已经从源代码安装了 cairo v

随机推荐

  • iOS 8 beta 5 今天查看扩展(小部件)卡在等待附加

    我想在 iOS 8 中调试今日视图扩展 小部件 因此我在 Xcode 中的 方案 下选择该小部件 然后选择我的 iPhone 作为设备并点击运行 它显示 在 iPhone 上运行今日视图 左侧边栏显示 正在等待附加 它永远停留在 等待连接
  • Inno Setup 仅卸载部分组件

    我有一个通用的应用程序 例如媒体播放器 用于安装在同一文件夹中的每个不同的零售产品 即 C 程序文件 myapp 并且不同的内容 例如电影 都安装在同一个文件夹中 C 程序文件 myapp 电影 对于每个单独的安装 单独的零售产品 我只是创
  • NHibernate 验证器:使用属性与使用 ValidationDefs

    我使用 NH Validator 一段时间了 主要是通过ValidationDefs 但我仍然不确定两件事 使用有什么特别的好处吗ValidationDef用于简单 标准验证 例如NotNull MaxLength etc I m worr
  • Xcode - ld:找不到架构 arm64 的符号

    我正在尝试通过 Xcode 编译我的应用程序 一切都一直有效 但今天突然返回此错误 导致构建失败 我附上完整的错误日志 感谢您的帮助 Undefined symbols for architecture arm64 chkstk darwi
  • 如何使用函数动态分配 d3.forceRadial 的中心?

    我有一个包含父节点和子节点的数据集 父节点可以与其他父节点链接 子节点可以与其父节点链接 我想要做的是将子节点径向放置在父节点周围 节点看起来像这样 parent id 1 type parent x y vx vy id 2 x y vx
  • 如何将 Subversion 存储库(而不是我的工作副本)恢复为特定修订版?

    我对 Subversion 比较陌生 来自 Source Safe 这让我抓狂 使用 Tortoise 界面 Commit 不断向我显示 bin 目录中的 java 文件 它说这些文件 丢失 好吧 这是一个单独的问题 基本上 当我尝试了几种
  • 如何仅获取 yum 更新列表

    好吧 我一直有这个问题 我只想使用 yum 从 Linux 系统 RHEL 或 Fedora 通过 bash 脚本在文件中列出可用的更新 但我总是必须处理创建的标头信息 如下所示 Loaded plugins XXXX repo XXXX
  • .vimrc 导致错误(E10: \ 后面应该跟 /、? 或 &)

    我已经复制粘贴了这个 vimrc http amix dk vim vimrc html进入 Fedora 15 中的 etc vimrc 中 每次我使用 vim 执行任何操作时 我都会收到许多行号错误 这些错误似乎不是我的 vimrc 文
  • 如何在react-google-maps中调用函数getCenter()和其他函数

    I tried
  • 自定义 WordPress 主题:布局图像不显示

    我正在构建一个自定义 WordPress 主题 所以我的主题文件夹包含以下文件 文件夹 header php index php footer php style css images picture 1 jpg 我的问题是我无法使用正确显
  • 检查特定输入文件是否为空

    在我的表单中 我有 3 个用于文件上传的输入字段
  • iPhone iOS 如何在适当的位置翻转/反射任何 UIView?

    我知道如何通过在其边界内重新绘制 UIImage 来翻转 反射 旋转它 IBAction reflectImageView UIImageView imageView UIGraphicsBeginImageContextWithOptio
  • 配置的 iPhone 未显示在 Xcode Organizer(或 iTunes)中

    我最近设置了应用程序 ID 和配置文件 并且能够在设备上成功测试我的应用程序 然后 我下载了一些示例 iOS XCode 项目 在部署其中一个项目并从手机中删除示例应用程序后 我无法将手机与 iTunes 同步 也无法在 Xcode 管理器
  • iOS 自动续订在当前订阅期结束时过期

    我订购了自动续订产品 5分钟后 它就过期了 我认为在Sandbox中5分钟等于1个月 当前订阅期结束时 5分钟后 不应该自动续订吗 但它已经过期了 在沙盒环境中 自动续订订阅的时间比实际时间要短得多 从这个答案 https stackove
  • 在两个单独的脚本之间共享变量[重复]

    这个问题在这里已经有答案了 我正在尝试在两个单独的选项卡中运行的两个不同的 Tampermonkey 脚本之间共享变量 我尝试在一个脚本中使用 GM setValue 然后在另一个脚本中使用 GM getValue 检索它 但没有成功 所以
  • XML:跨越其他元素的里程碑或元素

    我正在与OSIS http bibletechnologies net 开放圣经信息标准 用于描述圣经和相关文本的 XML 模式 当我第一次查看 XML 示例时 我注意到一些以前在 XML 中从未见过的奇怪之处 主要是关闭的标签 然后是逻辑
  • ANDROID_HOME 和 ANDROID_SDK_ROOT 环境变量均未导出 - Windows 10

    我是一个初学者 正在学习appium工具 尝试启动 appium 会话并收到错误 An unknown server side error occurred while processing the command Original err
  • 如何使用 mysqli 插入 MySQL

    我刚刚学习数据库 我希望能够存储用户输入 关于如何使用 PHP 获取表单数据并将其保存到数据库的基本示例是什么 还确保表单安全SQL攻击 http en wikipedia org wiki SQL injection File 示例 ht
  • Scala脚本等待mongo完成任务

    我正在编写一个简单的基于 scala 的脚本 该脚本应该将一些数据插入 Mongo 集合中 问题是 该脚本在 mongo 完成其任务之前退出 考虑以下脚本 处理该问题的惯用 最佳方法是什么 usr bin env scalas scalaV
  • 如何检查可以找到多少列字符[重复]

    这个问题在这里已经有答案了 我有一个包含 4 列的数据集 其中包含名称 其中名称的数量和名称的顺序在列之间有所不同 某些列还可以包含相同的名称两次或更多次 看起来如下 df lt data frame x1 c Ben Alex Tim L