如何从基于年份的大数据集中获取多个矩阵

2023-12-15

在我开始之前，这里是我正在处理的数据的一小部分，我提前为它太大而道歉（注意这只是一个非常大的数据集的前 30 行：

mydata<-structure(list(ParkName = c("SEP", "CSSP", 
                        "SEP", "ONF", "SEP", 
                        "ONF", "SEP", 
                        "CSSP", "ONF", 
                        "SEP", "CSSP", 
                        "PPRSP", "PPRSP", 
                        "SEP", "ONF", 
                        "PPRSP", "ONF", 
                        "SEP", "SEP", 
                        "ONF"), 
           Year = c(2001, 2005, 1998,2011, 1991, 1991, 1991, 1991, 1991, 1992, 1992, 1992, 1992, 1992,
                                          1992, 1992, 1992, 1993, 1994, 1994), 
           LatinName = c("Mola mola", "Clarias batrachus", "Lithobates catesbeianus", "Rana catesbeiana", "Rana catesbeiana", 
                         "Rana yellowis", "Rana catesbeiana", "Solenopsis sp1","Rana catesbeiana", "Rana catesbeiana",
                         "Pratensis", "Rana catesbeiana",  "Rana catesbeiana", "sp2", "Orchidaceae",
                         "Rana catesbeiana","Formica", "Rana catesbeiana", "Rana catesbeiana", "sp2"), 
           NumTotal = c(1, 1, 1, 1, 2, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,1, 100, 2, 1, 2)), Names = c("ParkName", "Year", "LatinName", 
                                                                                                                      "NumTotal"),
      row.names = c(NA, -20L), class = c("tbl_df", "tbl",  "data.frame"))

该数据集代表了多年来不同公园中不同物种的丰富度。我本质上想要用这些数据做的是获取记录数据的每年的物种 X 公园矩阵，然后使用“vegan”包来计算每年每个公园的多样性指数。显然，这不是一个平衡的数据集，因为并非每个公园每年都会记录物种丰度等。现在我意识到要做到这一点，我需要运行循环。我需要获取每年的公园列表以及每年每个公园的物种及其丰度列表，以便创建这些矩阵。在运行循环方面我并不是最擅长的，这个任务让我感到困惑。例如，我在数据集中创建了一个单独的年份向量。然后，我创建了一个名为“parkbyyear”的空列表，以从主数据框中按年份填充公园列表

year<-as.vector(unique(data[,3]))
parkbyyear<-NULL

for (i in 1:year) {
  parkbyyear[i]<- mydata[mydata$ParkName[year == "i"]
}

循环无法运行。任何帮助，将不胜感激。

只需使用by按所需因子对数据帧进行切片并运行向量返回等操作：

parkbyyear_list <- by(mydata, mydata$Year, FUN=function(df) df$ParkName)

parkbyyear_list
# mydata$Year: 1991
# [1] "SEP"  "ONF"  "SEP"  "CSSP" "ONF" 
# ---------------------------------------------------------------------------
# mydata$Year: 1992
# [1] "SEP"   "CSSP"  "PPRSP" "PPRSP" "SEP"   "ONF"   "PPRSP" "ONF"  
# --------------------------------------------------------------------------- 
# mydata$Year: 1993
# [1] "SEP"
# ---------------------------------------------------------------------------
# mydata$Year: 1994
# [1] "SEP" "ONF"
# ---------------------------------------------------------------------------
# mydata$Year: 1998
# [1] "SEP"
# ---------------------------------------------------------------------------
# mydata$Year: 2001
# [1] "SEP"
# ---------------------------------------------------------------------------
# mydata$Year: 2005
# [1] "CSSP"
# ---------------------------------------------------------------------------
# mydata$Year: 2011
# [1] "ONF"

对于子集数据帧的列表Year，只需使用split (or by again):

dfList <- split(mydata, mydata$Year)
# dfList <- by(mydata, mydata$Year, FUN=function(df) df)   # SIMILAR CALL

dfList

# $`1991`
#   ParkName Year        LatinName NumTotal
# 5      SEP 1991 Rana catesbeiana        2
# 6      ONF 1991    Rana yellowis        1
# 7      SEP 1991 Rana catesbeiana        1
# 8     CSSP 1991   Solenopsis sp1        1
# 9      ONF 1991 Rana catesbeiana        1

# $`1992`
#    ParkName Year        LatinName NumTotal
# 10      SEP 1992 Rana catesbeiana        1
# 11     CSSP 1992        Pratensis        1
# 12    PPRSP 1992 Rana catesbeiana        1
# 13    PPRSP 1992 Rana catesbeiana        1
# 14      SEP 1992              sp2        1
# 15      ONF 1992      Orchidaceae        1
# 16    PPRSP 1992 Rana catesbeiana        1
# 17      ONF 1992          Formica      100
# 
# $`1993`
#    ParkName Year        LatinName NumTotal
# 18      SEP 1993 Rana catesbeiana        2
# 
# $`1994`
#    ParkName Year        LatinName NumTotal
# 19      SEP 1994 Rana catesbeiana        1
# 20      ONF 1994              sp2        2
# 
# $`1998`
#   ParkName Year               LatinName NumTotal
# 3      SEP 1998 Lithobates catesbeianus        1
# 
# $`2001`
#   ParkName Year LatinName NumTotal
# 1      SEP 2001 Mola mola        1
# 
# $`2005`
#   ParkName Year         LatinName NumTotal
# 2     CSSP 2005 Clarias batrachus        1
# 
# $`2011`
#   ParkName Year        LatinName NumTotal
# 4      ONF 2011 Rana catesbeiana        1

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

如何从基于年份的大数据集中获取多个矩阵的相关文章

将 R 与 Rsruby 集成

我想知道是否有人有将 R 集成到 Rails 中的经验特别是在 heroku 上我熟悉 rsruby gem 它是 ruby 与 R 事实上的也许是唯一的绑定但是有关将 R 与 Rails 集成的文档即使不是不存在也是很少的比
ggarrange：合并多个图

附图来自以下文章正在使用 ggarrange 合并这些图 http www sthda com english articles 24 ggpubr publication ready plots 81 ggplot2 easy way
在 Rlattice xyplot 上分别控制轴刻度和轴线

我怎样才能去除周围的盒子xyplot 同时保留轴刻度刻度线本着爱德华塔夫特 Edward Tufte 极简主义数据图形美学的精神这些轴线是非数据墨水并且可以应该被擦除 library lattice my df lt dat
在闪亮应用程序的 DT::datatable 中添加、删除和编辑行

我有下面闪亮的应用程序我可以通过按添加新行Add基于闪亮的小部件选择我可以通过按选择并删除一行Delete我想将它们与单击一行的功能结合起来然后在按Edit 例如如果我单击第二行然后更改Security Type小部件来自Stoc
计算不包括当前值的平均值

我有下表 a b avg 1 1 7 3 2 1 0 3 3 1 2 3 4 2 1 2 5 2 3 2 其中 a 和 b 是数据 avg 计算按 a 分组的 b 的平均值现在我想计算按 a 分组的 b 的平均值 avg2 不包括当前值
如何在 R 中“推断”面板数据的值？

我有一个带有 NA 值的面板数据如下所示 uid year month day value 1 1 2016 8 1 NA 2 1 2016 8 2 NA 3 1 2016 8 3 30 4 1 2016 8 4 NA 5 1 2016
R：中断 for 循环

你能确认下一个break是否取消了内部for循环吗 for out in 1 n old id velho lt old table df id out for in in 1 n id novo lt new table df ID in
ess-rdired：我收到此错误“现在没有 ESS 进程与此缓冲区关联”

To use ess rdired为了浏览对象我按照 ESS 手册并将以下内容添加到我的 emacs autoload ess rdired ess rdired View R objects in a dired like buffer
从每小时中提取/子集分钟值

我的数据框包含以下格式的日期值YYYY MM DD HH MM SS跨越 125000 多行按分钟细分每行代表一分钟 1 2018 01 01 00 04 00 2 2018 01 01 00 05 00 3 2018 01 01 00
无效的命令名称“tk_chooseDirectory”错误

我使用 bioconductor 进行 WES 管道并使用 tk choose dir 选择用户存储输入文件的目录并将其存储以供进一步使用这里是命令行 library tcltk dataDir lt dirname tk choos
R中无法连接odbc数据库

我一直在尝试使用以下命令将我公司的 DMS 连接到 RodbcConnect命令但收到以下消息 myConn lt odbcConnect NZSQL uid cejacobson pwd password Warning message
如何使用 ggplot2 对曲线下的区域进行着色

我一直在尝试使用 ggplot2 生成类似于此 R 图形的绘图 xv lt seq 0 4 0 01 yv lt dnorm xv 2 0 5 plot xv yv type l polygon c xv xv lt 1 5 1 5 c y
data.table 的包装函数

我有一个已经使用 data frame 上下文编写的项目为了缩短计算时间我尝试利用 data table 的速度我的方法是构造包装函数读取帧将它们转换为表进行计算然后转换回帧这是一个简单的例子 FastAgg lt func
使用 roxygen2 导入两个同名函数

我是 CRAN 包的维护者在加载时收到以下消息 checking whether package qdap can be installed 10s 10s WARNING Found the following significant
R - 通过合并和超过 2 个后缀进行减少（或者：如何合并多个数据帧并跟踪列）

我正在尝试基于 2 列合并 4 个数据帧但要跟踪列源自哪个数据帧我在跟踪列时遇到问题参见 dput dfs 帖子末尾 df example df1 Name Color Freq banana yellow 3 apple red 1
正则表达式提取美国邮政编码，但不提取假代码

使用 XML 包和 XPath 从网站上抓取地址有时我只能得到一个嵌入了我想要的邮政编码的字符串提取邮政编码很简单但有时会显示其他五位数字的字符串以下是 df 中问题的一些变体 zips lt data frame id seq 1
使用神经网络包进行多项分类

这个问题应该很简单但文档没有帮助我正在使用 R 我必须使用neuralnet多项式分类问题的包所有示例均针对二项式或线性输出我可以使用二项式输出进行一些一对一的实现但我相信我应该能够通过使用 3 个单元作为输出层来做到这一点其中
使用“const cv::Mat &”、“cv::Mat &”、“cv::Mat”或“const cv::Mat”作为函数参数的区别？

我已经彻底搜索过但没有找到一个简单的答案传递 opencv 矩阵 cv Mat 作为函数的参数我们传递一个智能指针我们对函数内部的输入矩阵所做的任何更改也会改变函数范围之外的矩阵我读到通过将矩阵作为 const 引用传递它不会
R 中的点图每行有多个值

我有以下 R 输入文件 car 1 car 2 car 3 car2 1 car2 2 car2 3 然后我使用以下命令来绘制图表 autos data 点图 autos data V2 autos data V1 但这将每个汽车和 ca
如何通过组度量的平均值在 df 内排列 dplyr:: 组？

借鉴吴卡拉的设计https stackoverflow com a 26555424 9350837 https stackoverflow com a 26555424 9350837答案我希望根据各个组汇总测量的平均值对分组 df 进

随机推荐

SceneKit：内存过多

我已经没有想法了 SceneKit 正在堆积内存而我才刚刚开始我正在显示SNCNodes它们存储在数组中这样我就可以分离分子的组成部分以进行动画这些树模型分子我最终可能会展示 50 个比如说每章一个问题是当我转到另一章时
与“PropTypes.element”相对应的“defaultProp”的正确值是什么？

我有一个组件我希望接受另一个组件作为道具并渲染它我希望传递的组件是可选的并且在这种情况下不渲染任何内容下面的代码可以完美运行 const Component Inner gt div div
有没有办法生成单元测试来测试我的语法

我使用 antlr4 创建了语法但我想测试稳健性有没有自动工具或快速完成此操作的好方法谢谢由于很难找到 ANTLR 的真正单元测试我写了两篇关于它的文章 Lexer 的单元测试解析器的单元测试 A 词法分析测试检查给定文本是否被读
如何使 ImageButtons 边界环绕图像？

我正在为 Android 应用程序制作 GUI 该 GUI 包含四个方向ImageButtons 看下图但是当试图做到这一点时总是失败因为为每个图像保留了一个正方形这就是我所达到的那是我的XML code
我现在可以将使用 WatchKit 的应用程序上传到 App Store 吗？

我制作了一个应用程序包括一个iOS应用程序和一个WatchKit应用程序每个部分都可以独立运行我现在可以将此应用程序上传到 App Store 以便在发布时可以在 Apple Watch 上使用吗还是必须等待如果答案是肯定的我是
如何将 CreateObject("Wscript.shell") 转换为 C# [重复]

这个问题在这里已经有答案了我怎样才能用 C 翻译这个 Set WshShell WScript CreateObject WScript Shell 谢谢这个用在什么场合呢还有我必须在 C 中包含什么库才能工作使用用于脚本编写的 S
如何在 iPhone 的图像上添加文字？

我需要在 iPhone 中将文本放在图像上它就像 Eurosport iPhone 应用程序 source mzstatic com 以同样的方式我需要在我的应用程序中添加文本我怎样才能做到这一点 Thanks 我找到了两种方法 1
我可以使用 WinApi Deploy Cmd 在电脑上安装、更新吗

我的 appx 文件安装在文件夹中我可以通过双击该文件来安装它但我正在寻找一种使用 WinAppDeployCmd 进行安装和更新过程来安装它的方法 WinAppDeployCmd install file C release file
Hadoop：JPS 找不到已安装的 Java

我的配置是 hduser worker1 usr local hadoop conf jps The program jps can be found in the following packages openjdk 6 jdk open
如何使用外部 JSON...？

花了几个小时试图解决这个问题但我无法弄清楚出了什么问题我想做的就是加载这个 https recruit zoho com ats EmbedResult hr jodigest 2cV Sr2As6VxhLMxQGuTNij g Fb3
通过 cron 执行的 Google Cloud SDK 代码

我正在尝试实现一个自动代码来通过 Crontab 关闭和启动我的 Google Cloud 帐户中的 VM 实例操作系统是 Ubuntu 12 lts 并安装了 Google 服务帐户因此它可以处理我的 Google 云帐户上的读写
如何使用tensorflow进行文本分类？

我是张量流和机器学习的新手我在编写张量流代码时遇到问题该代码的文本分类类似于我尝试使用 sklearn 库进行的文本分类我在对数据集进行矢量化并向张量流层提供输入方面面临着重大问题我确实记得对标签进行了一次热编码但前面的张量流层不
Twitter 模块 python 'module' 对象没有属性 Oauth

我正在尝试遵循这个基本示例here Code import twitter XXX Go to http dev twitter com apps new to create an app and get values for these
随机化神经网络输入顺序的影响

在我的高级算法和数据结构课程中我的教授要求我们选择任何我们感兴趣的主题他还告诉我们要研究它并尝试实施解决方案我选择神经网络是因为它是我长期以来想学习的东西我已经能够使用神经网络实现 AND OR 和 XOR 该神经网络的神经元使用阶
共享变量的过时值

在阅读实践中的并发性时我读到 NoVisibility展示了一种不充分的方法同步程序可能会导致令人惊讶的结果陈旧的数据当的时候读者线程检查ready 它可能会看到一个过时的值除非每次访问变量时都会使用同步这是可能会看到该
分离数据框列中的值并融化

我有一个数据框我想在其中分隔 Client ID 列中的值并融化因此每一行都包含一个 Client ID 以及相应的 Account Name 和所有者 gt head df Account Owner Account Name Cli
C++ 将带有分隔符的文本文件读取到结构数组中

我正在尝试从格式类似于此的文本文件中读取数据 knife object 0 bag object 15 kitchen room 400 放入由结构体组成的数组中这是我到目前为止所拥有的但它只读取第一个元素然后返回垃圾 include
提供 SOAP/XML + REST/JSON 的最佳方式是什么？

我正在创建一个通用 Web 服务该服务可能有许多不同的客户端其中一些我目前无法预料我已经有了一个很好的 Java 服务 API 并且希望在此基础上提供一个 Web 服务外观 SOAP 与 REST 争论的双方都有很大的争论这让我想知
数组中的随机数而不连续两次重复相同的数字？

我正在使用 Swift 和 SpriteKit 制作一个游戏其中我根据数组将对象移动到随机位置由 CGPoints 组成的数组 let easyArray CGPointMake 0 0 CGPointMake 126 6 0 CGPo
如何从基于年份的大数据集中获取多个矩阵

在我开始之前这里是我正在处理的数据的一小部分我提前为它太大而道歉注意这只是一个非常大的数据集的前 30 行 mydata lt structure list ParkName c SEP CSSP SEP ONF SEP ONF SE

如何从基于年份的大数据集中获取多个矩阵

如何从基于年份的大数据集中获取多个矩阵 的相关文章

随机推荐

热门标签

如何从基于年份的大数据集中获取多个矩阵的相关文章