向数据框中添加显示变量频率的列

2023-11-25

假设我有一个像这样的数据框:

  location   species
1  seattle   A
2  buffalo   C
3  seattle   D
4  newark    J
5  boston    Q

我想在此框架中附加一列,显示某个位置在数据集中出现的次数,结果如下:

  location   species    freq-loc
1  seattle   A          2           #there are 2 entries with location=seattle
2  buffalo   C          1           #there is 1 entry with location=buffalo
3  seattle   D          2
4  newark    J          1
5  boston    Q          1

我知道使用table(data$location)可以给我一个列联表。但我不知道如何将表中的每个值映射到数据框中的相应条目。有人可以帮忙吗?


Update

非常感谢您的所有帮助!出于兴趣,我进行了基准测试,看看 merge、plyr 和 ave 解决方案的运行情况如何比较。测试集是我原始 10 x 约 700 万数据集的 10,000 行子集。:

Unit: milliseconds
expr         min         lq     median        uq       max neval
MERGE 110.877337 111.989406 112.585420 113.51679 120.23588   100
PLYR   26.305645  27.080403  27.576580  27.87157  68.40763   100
AVE     2.994528   3.117255   3.179898   3.35834  10.02955   100

这是一个基本的 R 方式ave.

transform(d, freq.loc = ave(seq(nrow(d)), location, FUN=length))
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

向数据框中添加显示变量频率的列 的相关文章

  • 如何计算两个邮政编码之间的距离?

    我有一个美国邮政编码列表 我必须计算所有邮政编码点之间的距离 它是一个 6k 邮政编码长列表 每个实体都有邮政编码 城市 州 纬度 经度 面积和人口 所以 我必须计算所有点之间的距离 即 6000C2 组合 这是我的数据示例 我已经在 SA
  • 我想将两个变量合并为一个具有日期格式的变量

    我有一个包含几个月的字符列的数据集 MONTH 和指示年份的数字列 YEAR 为了将其用作面板数据 我需要将这些结合起来YEAR and MONTH转换为日期格式的变量 我尝试过改变变量MONTH转换为数字格式 然后合并MONTH与柱YEA
  • 在子目录中构建共享库

    我正在尝试构建一个使用一些 C 代码的 R 包 我有一个编译为可执行文件的 C 库 可以从命令行调用 有一个与之关联的 Makefile 我正在尝试获取信息here http cran r project org doc manuals R
  • 如何使 quarto html 文档使用全屏宽度?

    我正在使用 R 创建一个四开 html 文档并将其发布到 rpubs com 上的网络上 该文档仅使用窗口的中间三分之一 而将左侧和右侧的三分之一留为空白 我怎样才能告诉四开使用整个窗口 这是一个非常简单的可重现示例 由于某种原因 它确实使
  • R data.table如何创建重复项[重复]

    这个问题在这里已经有答案了 I have dataDT lt data table A 1 3 B 1 3 dataDT A B 1 1 1 2 2 2 3 3 3 I want dataDT lt data table A c 1 3 1
  • 每行和每列都有条件的随机值(0 和 1)[关闭]

    Closed 这个问题需要多问focused help closed questions 目前不接受答案 您好 我正在尝试在 R 中创建一个 600 行和 18 列的数据框 但是 每行 18 列中只能随机有 3 个 1 例如 A E F 列
  • 如何矢量化 pandas 数据框前向列值搜索

    我想仅在前向搜索 pandas 数据帧列中的目标值 如果找到更大的值 那么我想将索引差异记录为结果列 我已经设法用两个内部 for 循环来做到这一点 但速度慢得令人痛苦 这就是我想在一个简化的示例中实现的目标 import pandas a
  • 照片与 r 中的图形对齐

    首先我想我需要在powerpoint中手动完成它 然后我想如果有解决方案的话可以尝试使用R 这是我的示例数据 set seed 123 myd lt expand grid cat LETTERS 1 5 cond c F T phase
  • 如何从 R 中的列表列表中提取元素?

    我有一堆列表 其中包含列表 广义线性模型输出 我想编写一个函数 该函数将从每个列表中提取多个元素 然后将结果组合到数据框中 我想提取modelset 1 likelihood modelset 1 fixef modelset 2 like
  • 将嵌套 for 循环转换为 R 中的并行循环

    下面您可以在 R 中找到一段代码 我想将其转换为使用多个 CPU 作为并行进程运行 我尝试使用foreach包 但并没有走得太远 考虑到我有 3 级嵌套循环 我找不到一个很好的例子如何让它工作 我们将非常感谢您的帮助 下面的代码示例 我做了
  • R:根据排名重新排列数据框的列

    我有以下数据框 df1 Type CA AR OR alpha 2 3 5 beta 1 5 6 gamma 6 2 8 delta 8 1 9 Total 17 11 28 我想根据 总计 行重新排序该数据框 使其按降序排列 生成的数据框
  • 使用清单修改 Latex 文档中 R 代码的字体颜色

    我试图在 Latex 文档中突出显示 R 代码 但我似乎无法更改代码框中的字体颜色 举个例子 我认为commentstyle color red 应该给我红色字体的评论 但评论显示为蓝色或黑色 不太清楚 另外 我认为backgroundco
  • 尝试将行附加到按对象分组中的每个组时出现奇怪的行为

    这个问题是关于一个函数在应用于两个不同的数据帧时以意想不到的方式表现的 更准确地说 是 groupby 对象 要么是我遗漏了一些明显错误的东西 要么是 pandas 中存在错误 我编写了以下函数 将一行附加到 groupby 对象中的每个组
  • R 中的因素:不仅仅是烦恼?

    R 中的基本数据类型之一是因子 根据我的经验 因素基本上是一种痛苦 我从不使用它们 我总是转换为字符 我感觉很奇怪 好像我错过了什么 是否有一些使用因子作为分组变量的函数的重要示例 其中因子数据类型变得必要 当我should使用因素 你应该
  • n 个素数之和 java,困惑

    我读过几篇关于这方面的文章 我什至在一次考试中这样做过 但是是在 vb net 中 它工作得很好 但是当我尝试执行我的程序时 Eclipse 只是不停地运行 否则它会给我错误的答案 这是我的第四次尝试 我需要将前 n 个素数相加 因此我检查
  • 使用自定义指标的标准差选择带插入符号的调整参数

    我将插入符号与自定义拟合指标一起使用 但我不仅需要最大化该指标 还需要最大化其置信区间的下限 所以我想最大化类似的东西mean metric k stddev metric 我知道如何手动执行此操作 但是有没有办法告诉插入符使用此函数自动选
  • 如何在Python中按天对时间序列数据求和? resample.sum() 没有效果

    我是Python新手 如何根据日期求和数据并绘制结果 我有一个 Series 对象 其数据如下 2017 11 03 07 30 00 NaN 2017 11 03 09 18 00 NaN 2017 11 03 10 00 00 NaN
  • 如何将 unicode 符号转换为 ggplot 的因子水平?

    我想在 ggplot 图例中获取一个符号 而不在比例中指定 我要这个 df lt data frame a 1 5 b factor 1 5 labels c 1 4 u2265 5 c 10 14 ggplot df aes a c co
  • GGplot为点添加数据标签

    如何使用 ggplot 将数据标签添加到点 我有一个名为 stacked 的堆叠数据框 gt head stacked time value variable 1 100 152 2211 gg 2 110 146 3304 gg 3 11
  • 依靠条件连接大表的速度很慢

    当表很小时 这个查询有合理的时间 我试图找出瓶颈是什么 但我不知道如何分析EXPLAIN结果 SELECT COUNT FROM performance analyses INNER JOIN total sales ON total sa

随机推荐

  • C# 模拟鼠标在非活动窗口的某个位置单击

    这是原来的问题 但被认为是java的 在Java中模拟鼠标在非活动窗口的某个位置单击 不管怎样 我正在构建一个在后台运行的机器人 这个机器人需要我点击 当然 我希望能够在机器人运行时做其他事情 所以我想知道是否可以在非活动窗口的某个位置模拟
  • 多点运算符(C++ 类)

    我必须实施一个课程Vector 它设置多维向量的坐标 并且在使用此特定代码调用时将起作用 我无法更改这部分 const int NumOfDimensions 5 Vector x NumOfDimensions x Set 0 1 1 S
  • 在 C++ 中何时调用模板类静态成员的构造函数?

    有大量关于何时调用普通类的静态成员的构造函数的信息 但是 我发现模板类有一些奇怪的行为 以下程序的输出应该是什么 请注意 我使用 printf 来避免 std cout 的任何静态初始化顺序失败并发症 include
  • 运行 Go 程序时与垃圾收集器相关的恐慌

    我从 GitHub 安装了一个 Go 程序 当我运行它时 出现错误 panic Something in this program imports go4 org unsafe assume no moving gc to declare
  • 什么是 LLVM 中间表示?

    我已经尝试过LLVM演示来自在浏览器中尝试 LLVM 和 Clang 什么样的IR这是 HIR MIR or LIR The SSA我认为 MIR 中通常使用表示法 那么 它是 MIR 吗 但它可以存储用于依赖性分析的信息 那么它可以是 H
  • SolrException:内部服务器错误

    我正在我的应用程序中使用 Solr 我在用阿帕奇 solr solrj 1 4 0 jar 当我尝试打电话时add SolrInputDocument doc from CommonsHttpSolrServer 我收到以下异常 org a
  • 如何安全地将文件名附加到 Windows 文件夹路径参数?

    假设我有一个批处理脚本 需要参数中的文件夹路径 1 我想将文件名附加到路径并在命令中使用它 有没有一种简单的方法可以在所有情况下都可靠地做到这一点 我不想PUSHD 1然后忽略后面的路径 假设我的逻辑要求当前目录保持不变 问题是 1参数可能
  • Node JS 环境变量和 Heroku 部署

    我有一个使用 dotenv 包在 NodeJS 应用程序中加载环境变量的项目 我使用以下行 var dotenv require dotenv load silent true Example of use username process
  • Python 将 numpy 数组写入 CSV 文件 [重复]

    这个问题在这里已经有答案了 我正在尝试将 2D numpy 数组写入 CSV 文件 我试过这个 import csv import numpy as np w csv writer open main csv w Nlayers 23 N
  • 在行尾切换分号(或其他字符)

    在行尾添加 或删除 分号是常见操作 然而像这样的命令A 修改当前光标位置 这并不总是理想的 有没有一种简单的方法来映射命令 例如 切换分号是否出现在行尾 我目前在 vimrc 中使用此命令来附加 map A
  • 如何删除反应路由器 URL 中的尾部斜杠

    我开始在我的应用程序中使用react router 我注意到当它的URL末尾有一个尾部斜杠时 url 这是行不通的 我搜索了更多相关信息 阅读了所有文档和反应路由器问题并尝试使用
  • 查找 Button/UIElement 在屏幕上相对于网格 Windows Phone 的位置

    我找不到一种方法来获取屏幕控件的 x y 坐标位置 例如按钮相对于其内部网格的位置 有没有办法做到这一点 我忽略了 var transform button TransformToVisual grid Point absolutePosi
  • 从 javascript 获取 IE 11 内部版本号

    TL DR 如何在 JavaScript 中获取 IE 11 的内部版本号 我有一个错误 该错误已在版本 11 0 1 和 11 0 7 之间的某个时刻得到修复 我想知道遇到此问题的用户百分比 基本上我想得到这个数字 我认为仅使用 Java
  • Android 深层链接:对应用程序和 Play 商店使用相同的链接

    我有一个网站 用户可以进行搜索查询 该查询可能需要一些时间才能完成 几分钟到几天 我希望用户能够下载 Android 应用程序并通过向用户发送带有链接的电子邮件来接收答案 我希望无论用户是否安装了该应用程序 这种机制都能发挥作用 换句话说
  • 如何用符号表示复制/粘贴的崩溃报告?

    我有一位用户在使用 iPhone 应用程序的应用程序商店版本时遇到崩溃 崩溃不是通过 iTunes 连接报告的 用户无法与 iTunes 同步并获取 crash 文件 他们没有计算机 不过 用户可以在 设置 gt 常规 gt 关于 gt 诊
  • codeigniter 就像核心 php 中的 flashdata

    有没有办法像在codeigniter中一样创建flash会话数据 我想在核心 php 中创建它 我不想使用 GET 方法 用 url 传递变量会在我的应用程序中产生问题 那么 我该怎么做呢 使用 PHP 会话创建 Flash 消息类非常容易
  • iOS 路由 viewDidAppear 到子视图控制器?

    我将子视图控制器添加到父视图控制器 一切都按预期工作 除了子视图控制器没有触发其通常的回调 例如 像 viewWillAppear animated 这样的东西永远不会被调用 我研究了一下 认为这可能是因为在将子视图控制器添加到父视图之前和
  • 如何使用 Windows API 删除应用程序的菜单栏?

    我正在使用下面的代码来删除应用程序的标题栏 该代码对于记事本来说非常有效 现在我也想删除菜单栏 如何实现呢 Finds a window by class name DllImport USER32 DLL public static ex
  • 使用 wkhtmltopdf 创建 pdf 并渲染 javascript

    我正在尝试创建模型窗口中的 javascript 图表的 PDF 我的图表是 aspx 视图中 javascript 和 css 的组合 渲染的 PDF 文件中唯一的内容是窗口中的静态内容 实际的 javascript 图表不在那里 我创建
  • 向数据框中添加显示变量频率的列

    假设我有一个像这样的数据框 location species 1 seattle A 2 buffalo C 3 seattle D 4 newark J 5 boston Q 我想在此框架中附加一列 显示某个位置在数据集中出现的次数 结果