将选择标准添加到 read.table

2024-05-07

让我们采用以下我导入的数据集的简化版本read.table:

a<-as.data.frame(c("M","M","F","F","F"))
b<-as.data.frame(c(25,22,33,17,18))
df<-cbind(a,b)
colnames(df)<-c("Sex","Age")

实际上，我的数据集非常大，我只对一小部分数据感兴趣，即有关 18 岁或以下女性的数据。在上面的示例中，这只是最后 2 个观察结果。

我的问题是，我可以立即导入这些观察结果，而不导入其余数据，然后使用subset完善我的数据库。我的电脑容量有限，所以我一直在使用scan分块导入我的数据，但这是极其耗时。

有更好的解决方案吗？

一些可能有效的方法：

1 - 使用类似的包ff可以帮助您解决 RAM 问题。

2 - 在将数据加载到 R 之前，使用其他工具/语言清理数据。

3 - 如果您的文件不太大（即，您可以加载它而不会崩溃），那么您可以将其保存到 .RData 文件并从此文件中读取（而不是调用 read.table）：

 # save each txt file once...
 save.rdata = function(filepath, filebin) {
     dataset = read.table(filepath)
     save(dataset, paste(filebin, ".RData", sep = ""))
 }

 # then read from the .Rdata
 get.dataset = function(filebin) {
     load(filebin)
     return(dataset)
 }

这比从 txt 文件读取要快得多，但我不确定它是否适用于您的情况。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

import

readtable

将选择标准添加到 read.table 的相关文章

多个变量的分组描述性统计

给定数据框 df Hup Hop testA testB Y Hi 1 1 N Lo 2 2 Y Mi 3 3 N No 4 4 Y Hi 5 5 N Lo 6 6 Y Mi 7 7 N No 8 8 Y Hi 9 9 N Lo 10 10
Rstudio 更有意义的窗口标题

我在 Ubuntu 16 04 下使用 R studio 版本 1 0 143 窗口标题仅显示一个非常无信息的 RStudio 我希望至少有当前选项卡的名称或者最好是与此选项卡对应的文件的完整路径在 Windows 下完整路径似乎出现
将自己编写的 TypeScript 模块导入 Svelte 组件时出现错误

我正在尝试将自己编写的 TypeScript 模块导入到 Svelte 组件中但是当我尝试使用以下行导入模块时我收到以下错误 import TelegramBotForSafetyMania from telegram bot 我们收
修改 GGplot2 对象

然而我很好奇是否可以添加任何特定的图例或将哪个物种对应于观察到的预期绘图中以分别知道它是哪个圆圈我目前使用的是一个名为 finches 的假数据集该包称为 cooccurr 它创建一个 ggplot 对象我很好奇如何实际编辑它以
在 Ubuntu 上安装软件包需要很长时间

我之前使用 Windows 作为操作系统 RStudio 用于 Windows 今天切换到 Ubuntu 并再次安装了 R 和 RStudio 当我尝试从 CRAN 安装一些软件包时仅tidyverse 使用install package
重用 R 中内置的模型

在 R 中构建模型时如何保存模型规范以便可以在新数据上重用它假设我根据历史数据建立逻辑回归但直到下个月才会有新的观察结果最好的方法是什么我考虑过的事情保存模型对象并在新会话中加载我知道某些模型可以使用 PMML 导出但还没有
sapply 函数从命名向量中的值填充数据帧的列，需要很长时间。有更快的方法吗？

这是我正在做的一个例子 x lt c a 2 b 4 c 2 d 9 df lt data frame names c d c a b x是一个命名向量其值的顺序与它们在中出现的顺序不同df names 我需要在数据框中形成一个新列该列
在ggplot2中添加边框或背景以缩放图例guide_colorbar

我在 ggplot 图中有一个从白色到红色的颜色条并且白色边框在白色背景上不太明显有没有办法对图例中的刻度线进行不同的着色或在渐变比例周围添加边框这是一个最小的例子 df lt data frame x lt rnorm 10 y l
Foreach循环无法找到对象

我正在尝试将 foreach 与并行后端结合使用来加速计算用于特征选择的 AUCRF 随机森林的交叉验证如果这确实重要的话在这样做的过程中我需要获取向量的子集向量的名称可以更改但可以作为字符向量进行访问我使用 eval par
rvest - 在 1 个标签中抓取 2 个类

我是新来的如何提取标签中具有 2 个类名或仅 1 个类名的元素这是我的代码和问题 doc lt paste span class a1 b1 text1 span span class b1 text2 span library rve
如何在 sqlSave() 命令中跳过主键？

我正在尝试使用 RODBC 在 MySQL 数据库中插入 data frame 我正在使用的命令如下 sqlSave channel dbData tablename table name append TRUE safer TRUE fa
计算级别内的值

我在 R 中生成了一组级别cut 例如假设 0 到 1 之间的小数值分为 0 1 个区间 gt frac lt cut c 0 1 breaks 10 gt levels frac 1 0 001 0 1 0 1 0 2 0 2 0 3
单击并按住 R 中的按钮闪亮？

我希望能够通过单击 R 闪亮按钮来更改参数的值所以我需要按钮一个用于增加值一个用于减少值我想在按住按钮的同时保持值以一定的速度减少增加通过释放按钮的点击动作应该停止到目前为止我还没有找到这个选项actionButtons在
脚本超时已过，如果要完成导入，请重新提交相同的文件，导入将恢复

我有一个数据库拉开拉链后的尺寸50mb拉链尺寸7mb所以当我尝试导入数据库时zipped 7mb 几分钟后它抛出此错误脚本超时已过如果您想完成导入请resubmit相同的文件和导入将恢复我已经重新提交了但仍然没有导入全部数据
profvis() 何时以及为何显示“源不可用”？

我经常分析 R 代码并大量使用 profvis 对于某些函数浏览器窗口的上半部分会显示源代码有时则不会我不知道什么时候会出现这种情况对我来说这似乎是随机的有谁知道 profvis 何时以及为什么无法在顶部窗口中显示代码发生这种
Quarto/Rmarkdown 中的美人鱼图：狭窄且模糊

我正在尝试生成 pdf 格式的四开文档稍后会生成 word 格式我遇到了美人鱼图的问题请在下面找到一个示例 qmd 文件来说明该问题所以首先它应该支持 mermaid 标签但当我这样做时我无法在 rstudio 中运行单元
R比例置信区间因子

我正在尝试总结家庭调查的数据因此我的大部分数据都是分类因子数据我想用对某些问题的回答频率图来总结它例如回答某些问题的家庭百分比的条形图误差线显示置信区间我发现了这个很棒的教程我认为它是我祈祷的答案 http www coo
使用 ggplotly（ggplot2 withplotly）时可以去掉注释中的跟踪标签吗？

使用ggplotly时是否可以删除注释中的跟踪标签例如 library ggplot2 library plotly g lt ggplot iris aes Sepal Width Sepal Length geom point ann
按绝对值排序

有谁知道如何按绝对值对 R 中的向量进行排序所以 2 3 1 gt 1 2 3 etc 如果我在 python 中这样做我会创建一对每个值及其符号按绝对值对对列表进行排序然后重新应用符号但我对 R 很陌生所以不知道如何执行此操作
如何在 R 地图库中绘制正确的颜色

我正在尝试使用 R 地图库为特定国家绘制特定颜色我可以填写颜色但它们与各自的国家地区没有正确关联我想知道是否有人能知道为什么我的数据框是 filld 有 3 列第一列是国家名称第二列只是一些数字数据第三列是颜色 countr

随机推荐

如何初始化 LinearLayout 变量？

快速通知我正在使用SharedPreferences这样我可以在重新打开应用程序时重新加载数据 Problem我有一个LinearLayout在我的应用程序的主要片段中一切都运行顺利直到我重新打开应用程序并尝试重新初始化LinearL
如何从 Perl 调用 gnuplot 脚本

我有一个 gnu gp 文件 grphist conf set terminal canvas Terminal type set to canvas Options are solid butt size 600 400 fsize 10
Highcharter 已弃用函数的输出与建议的不同

我正在用 Josh Kunst 的出色作品制作一个时间序列情节highcharterR 中的库使用此数据 gt dput t structure c 2 2 267822980 325286564 66697091 239352431 9
如何防止 CouchDB 在更新简单计数器时创建文档修订

我想将计数器存储在 CouchDB 文档中并在每个页面视图上递增 CouchDB 将创建本文档的完整修订版只需 1 次计数器更新这样会不会占用太多空间考虑到我一天的点击量为 100 万次我一天内可能会查看该文档的 100 万次修订
向 ChartJS 数据点添加逗号

我需要在 ChartJS 图表中的数字中添加逗号前任数据点可能是 1032 05 4334 75 8482 46 我需要它显示为 1 032 05 4 334 75 8 482 46 以下是包含当前代码的开发网站的链接投资计算器 ww
快速分类（分箱）

我有大量条目每个条目都是浮点数这些数据x可以通过迭代器访问我需要使用像这样的选择对所有条目进行分类10
如何关闭 Grizzly 日志记录？

如何关闭 Grizzly 的日志记录我想关闭以下日志记录 Okt 18 2018 8 42 24 AM org glassfish grizzly http server NetworkListener start INFORMATION
PCL 点特征直方图 - 分箱

分箱过程是点特征直方图估计的一部分结果是b 3bins 如果仅使用三个角度特征 alpha phi theta 其中 b 是 bins 的数量为什么b 3并不是b 3 假设我们考虑阿尔法将特征值范围细分为b个区间您迭代查询点的所有邻
修改 FOR 循环内的索引变量是否是一种好的做法？ [关闭]

Closed 这个问题是基于意见的 help closed questions 目前不接受答案给定代码 for int i 1 i lt 5 i Do work 改变其值是可以接受的i从循环内例如 for int i 1 i lt 5
TransactionScope 超时过早发生？

我在用着TransactionScope进行一些批量插入和更新问题是即使我设置了超时我也会在 30 分钟长的操作中遇到超时异常TransactionScope到一小时此外在异常之后它会插入看似随机数量的批次记录例如最后一个操
有什么方法可以有效地应用大型 git 补丁吗？

我们收到了一个大补丁修改了大约 17000 个文件其大小为5 2G 应用补丁时git apply 3 12个小时后还没有完成我们将每个文件的补丁分成更小的补丁然后一一应用它们这样至少我们可以看到进度再次卡在一个文件补丁上仍然有
.bind("move_node.jstree",.. -> data.rslt.obj undefined。如何获取节点数据？

我有一个 check move 的自定义功能 crrm move check move function m var p this get parent m o if p return false if m cr 1 return fals
NPM 无法安装依赖项 - 尝试解锁尚未锁定的内容

我一直在尝试在我的 package json 文件上运行 npm install 但遇到了很多麻烦我的所有依赖项上一直显示错误尝试解锁尚未锁定的 XXX 这是其中之一 Error Attempt to unlock tbd 0 6 4
为 Docker 容器分配静态 IP

我现在尝试在启动 Docker 容器时分配静态 IP 172 17 0 1 我使用端口 2122 作为该容器的 ssh 端口以便让该容器监听端口 2122 sudo docker run i t p 2122 2122 ubuntu 此命
Laravel 社交名流 $user->getId()?

我不确定这是否是真正导致我的问题的原因但也许有人会知道当我使用 Laravel Socialite 并执行以下操作时 social user Socialite driver provider gt user 然后我的代码中的其他地方执
将问号 (?) 替换为 (\\?)

我正在尝试定义一个模式来匹配文本中带有问号的文本在正则表达式中问号被认为是一次或根本不那么我可以用替换文本中的符号来解决模式问题吗 String text aaa aspx pubid 222 zzz Pattern p Pa
将Excel数据转换为特定的JSON格式

我收到一个 Excel 文件 xlsx 如下所示行和列的数量可以变化例如它也可以如下所示对于第一张图片中的 Excel 工作表 JSON 应如下所示 value Prename Nik Age 17 Country Switzerl
防止被 0 除的 Typescript 类型

我正在使用打字稿创建一个用于培训目的的计算系统但在除法过程中出现打字错误您知道如何解决吗 type Variable value number resolve gt number type NoZeroVariable value Om
从其他模块调用的数组扩展

其他模块例如 XCTest 项目无法使用数组扩展方法为了简单起见下面的代码什么也不做但可以用来重现错误 import Foundation extension Array mutating func myMethod toInde
将选择标准添加到 read.table

让我们采用以下我导入的数据集的简化版本read table a lt as data frame c M M F F F b lt as data frame c 25 22 33 17 18 df lt cbind a b colname

将选择标准添加到 read.table

将选择标准添加到 read.table 的相关文章

随机推荐

热门标签