只读取选定的列

2023-12-06

谁能告诉我如何仅读取下面每年数据的前 6 个月(7 列),例如使用read.table()?

Year   Jan  Feb  Mar  Apr  May  Jun  Jul  Aug  Sep  Oct  Nov  Dec   
2009   -41  -27  -25  -31  -31  -39  -25  -15  -30  -27  -21  -25
2010   -41  -27  -25  -31  -31  -39  -25  -15  -30  -27  -21  -25 
2011   -21  -27   -2   -6  -10  -32  -13  -12  -27  -30  -38  -29

假设数据在文件中data.txt,您可以使用colClasses的论证read.table()跳过列。这里前 7 列的数据是"integer"我们将剩下的 6 列设置为"NULL"表明应该跳过它们

> read.table("data.txt", colClasses = c(rep("integer", 7), rep("NULL", 6)), 
+            header = TRUE)
  Year Jan Feb Mar Apr May Jun
1 2009 -41 -27 -25 -31 -31 -39
2 2010 -41 -27 -25 -31 -31 -39
3 2011 -21 -27  -2  -6 -10 -32

Change "integer"为其中详细说明的可接受类型之一?read.table取决于数据的实际类型。

data.txt看起来像这样:

$ cat data.txt 
"Year" "Jan" "Feb" "Mar" "Apr" "May" "Jun" "Jul" "Aug" "Sep" "Oct" "Nov" "Dec"
2009 -41 -27 -25 -31 -31 -39 -25 -15 -30 -27 -21 -25
2010 -41 -27 -25 -31 -31 -39 -25 -15 -30 -27 -21 -25
2011 -21 -27 -2 -6 -10 -32 -13 -12 -27 -30 -38 -29

并通过使用创建

write.table(dat, file = "data.txt", row.names = FALSE)

where dat is

dat <- structure(list(Year = 2009:2011, Jan = c(-41L, -41L, -21L), Feb = c(-27L, 
-27L, -27L), Mar = c(-25L, -25L, -2L), Apr = c(-31L, -31L, -6L
), May = c(-31L, -31L, -10L), Jun = c(-39L, -39L, -32L), Jul = c(-25L, 
-25L, -13L), Aug = c(-15L, -15L, -12L), Sep = c(-30L, -30L, -27L
), Oct = c(-27L, -27L, -30L), Nov = c(-21L, -21L, -38L), Dec = c(-25L, 
-25L, -29L)), .Names = c("Year", "Jan", "Feb", "Mar", "Apr", 
"May", "Jun", "Jul", "Aug", "Sep", "Oct", "Nov", "Dec"), class = "data.frame",
row.names = c(NA, -3L))

如果事先不知道列数,则效用函数count.fields将读取文件并计算每行中的字段数。

## returns a vector equal to the number of lines in the file
count.fields("data.txt", sep = "\t")
## returns the maximum to set colClasses
max(count.fields("data.txt", sep = "\t"))
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

只读取选定的列 的相关文章

  • 提取模型摘要并将其存储为新列

    我是新来的purrr范例并正在努力解决它 根据一些来源 我已经设法嵌套一个数据框 在嵌套数据上运行线性模型 从每个 lm 中提取一些系数 并为每个 lm 生成摘要 我想做的最后一件事是从摘要中提取 r squared 我原以为这将是我想要实
  • 如何根据值扩展数据框? [复制]

    这个问题在这里已经有答案了 我有以下输入数据框 df lt data frame x c a b c y c 4 5 6 from c 1 2 3 to c 2 4 6 df x y from to 1 a 4 1 2 2 b 5 2 4
  • 在另一列的字符串中搜索一列中的文本

    这里是 R 新手 一直在搜索此论坛 尝试找到一种在同一行数据的字符串中搜索文本的方法 我以前使用过 grepl 但无法让它向下查找列并对每一行应用检查 我觉得这是一个简单的解决方案 但我花了几个小时 但似乎无法得到它 基本上我有类似下面第
  • R + ggplot2 - 无法分配大小为 128.0 Mb 的向量

    我有一个 4 5MB 9 223 136 行 的文件 其中包含以下信息 0 0 0 0147938 3 67598e 07 0 0226194 7 35196e 07 0 0283794 1 10279e 06 0 033576 1 470
  • 如何为 nls 函数找到良好的起始值?

    我不明白为什么我不能对这些数据使用 nls 函数 我尝试过很多不同的起始值 但总是出现相同的错误 这是我一直在做的事情 expFct2 function x a b c a 1 exp x b c vec x lt c 77 87 87 7
  • 如何在双对数图(ggplot2)中添加趋势线?

    我需要绘制一个遵循幂律分布的数据向量 所以如果我将它们绘制在对数轴上 它们将是一条直线 但是 如果我没有明确提供 y 参数 我不知道如何绘制 这是代码 library poweRlaw library ggplot2 xmin 1 alph
  • 在 r 中使用 SSasymp

    我想我不知道如何在 r 中使用 SSasymp 函数 我想为我的项目创建一个渐近函数 我试过这个 c lt seq 0 200 0 5 d lt SSasymp c 500 0 log 50 plot c d type l log 50 应
  • 删除ggplot2 geom_bar中没有数据的日期列[重复]

    这个问题在这里已经有答案了 我想隐藏 ggplot2 中没有数据的列 这是使用 nycflights13 库的可重现示例 library nycflights13 library dplyr library ggplot2 small da
  • Sweave + RweaveHTML:cat 输出未出现在输出中

    我对 Sweave RweaveHTML 有疑问 我希望 cat 的输出最终出现在正在生成的 html 文件中 我有一个案例 它没有 我不明白为什么 test function bla bla cat Result is 然后在 Rnw 文
  • R 比较所有列对的每个值[重复]

    这个问题在这里已经有答案了 我有一个 18x18 的数据框 我想将所有可能的列对相互比较 以便对于每对两列 18 行中的值相互比较 由于我的数据太大 无法放在这里 我写了一个小例子来说明到目前为止我所想到的 gt a lt c 1 18 g
  • 在函数中调用其他列的控制流程

    我正在尝试在给定条件的情况下连接到函数中的其他列 本质上 我想让数据框在给定条件的情况下从长到宽 其中一列中的这些值是NA相对于同一行中具有值的另一列 转动NAs转化为特定的数字 尽管分配的值必须是特定于列的 因此 如果2010 has N
  • 使用 R 中“rpart”包中的生存树来预测新的观察结果

    我正在尝试使用 R 中的 rpart 包来构建生存树 并且我希望使用这棵树来对其他观察结果进行预测 我知道有很多涉及 rpart 和预测的问题 但是 我还没有找到任何解决 我认为 特定于将 rpart 与 Surv 对象一起使用的问题的方法
  • Quanteda 包,朴素贝叶斯:如何预测不同特征的测试数据?

    I used quanteda textmodel NB创建一个模型 将文本分类为两个类别之一 我将模型拟合到去年夏天的训练数据集上 现在 我今年夏天尝试使用它对我们在工作中收到的新文本进行分类 我尝试这样做并收到以下错误 Error in
  • 无法将 bigrquery 与标准 sql 一起使用

    我正在 R ipython 笔记本 相对 R 新手 中工作 并尝试使用 bigrquery 从 Google Big Query 中提取数据 我被告知这应该很简单 但使用标准 sql 提取不起作用 这是我的代码 require bigrqu
  • R tidyr regex:从字符列中提取有序数字

    假设我有一个像这样的数据框 df lt data frame x c This script outputs 10 visualizations This script outputs 1 visualization This script
  • 使用 geom_abline() 和 ggplot

    我是初学者ggplot2 距离我开始试验才过去 4 天 所以 如果这个问题听起来太基本了 我深表歉意 我很感激任何指导 我已经在这个问题上苦苦挣扎了大约一个小时 我正在尝试使用geom abline 如下 p lt ggplot mpg a
  • 三角形内的热图

    考虑以下示例 triangle lines lt data frame X c 0 0 1 1 0 5 0 5 Y c 0 0 0 0 1 1 grp c 1 2 1 3 2 3 df lt matrix c c 0 2 0 5 0 8 c
  • 如何更改 R Markdown HTML 文档中目录的颜色和属性?

    我花了很多时间谷歌搜索这个 但似乎无法弄清楚 我正在使用 R Markdown 制作 HTML 文档 文档在这里 http rmarkdown rstudio com html document format html http rmark
  • Dplyr select_ 和starts_with 对变量列表中的多个值进行选择

    我正在从不同位置的不同传感器收集数据 数据输出类似于 df lt data frame date c 2011 2012 2013 2014 2015 Sensor1 Temp c 15 18 15 14 19 Sensor1 Pressu
  • 获得各州的边界

    编辑7 经过相当多的帮助后 我已经能够得到一张接近我需要的结果的地图 但我仍然需要在地图上显示州边界 但我无法弄清楚 为了制作一个合适的可重现示例 我需要链接到数据集 因为输出太大 为了使事情变得简单 我只对三个状态进行子集化 但边界线不显

随机推荐

  • Java ActionListener 错误:类型不兼容

    我在 JButton 上设置 ActionListener 时遇到一些问题 这是代码 package pipes import java awt import java awt event import javax swing public
  • 关闭窗口 - 如何确定窗口是如何打开的?

    在一页上 我有一个超链接target blank 在目标页面上 我有一个 关闭 按钮 它使用 JS 关闭新选项卡 窗口 如果用户点击超链接 我可以使用JS关闭打开的窗口 伟大的 如果用户右键单击链接并选择 在新选项卡中打开 我的 JS 事件
  • 从 GtkBin 扩展

    我正在尝试制作一个自定义小部件 类似于 Gtk 在所有类似 TreeView 的小部件上使用的 快速搜索 条目 这是我最初想法的一个简化示例 from gi repository import Gtk class QuickSearch G
  • 何时在 Modelica 语言中使用 noEvent 运算符?

    Modelica 中的 noEvent 运算符不使用迭代来查找触发事件的精确时刻 看来这会导致计算错误 这是我在以下网站上找到的示例https mbe modelica university behavior discrete decay
  • 如果不存在安全规则,Firestore 将创建文档

    我试图编写一个规则 如果文档的 id 不存在 则创建一个新文档 我的目标是 Message message new Message userId title messageBody timestamp 我正在使用WriteBatch创建一个
  • Socket.io“连接”事件在每个客户端心跳上触发?

    我有一个基本的 Socket io 服务器设置 如下所示 var server express createServer listen port this io socketIO listen server this io sockets
  • 如何让数据网格表现得像 ctrl 键处于活动状态?

    我希望我的数据网格默认的行为就像用户按住控制键一样 因此 当单击一个项目时 然后单击另一个项目 它们都是选择的一部分 再次单击它们会将它们从选择中删除 我已经有了allowMultipleSelection true但我似乎找不到任何可以执
  • 具有最大/最小值的 Accumarray 索引

    我有一个向量和一个大小相同的元胞数组 带有重复字符串 元胞数组定义组 我想找到每个组向量中的最小 最大值 例如 value randperm 5 just an example non unique in general value 4 1
  • Firebase 网络电话号码身份验证不起作用

    我已经在谷歌上搜索了 2 天的 html 和 JavaScript 代码 以便在我的网站中添加 firebase 电话号码身份验证 我看到 firebaseui 正在做这项工作 但它有自己的形式元素 我还没有找到任何文章或视频显示 如何使用
  • 使用 Python 更新 Facebook 状态

    我正在尝试使用 facebook API 解决问题更新状态pyfacebook 所以我看这里使用 pyfacebook 更新 Facebook 页面的状态我认为不再有效了 好吧 最后我解决了这个问题 usr bin python impor
  • Typescript 参数相互依赖

    我不明白下面出现的错误 这是一个最小的可重现示例 其中包含错误消息 type LeftChild element 0 type RightChild element 1 type Left child LeftChild type Righ
  • 在当今时代,是否有合理的理由强制代码文件的最大宽度为 80 个字符? [关闭]

    就目前情况而言 这个问题不太适合我们的问答形式 我们希望答案得到事实 参考资料或专业知识的支持 但这个问题可能会引发辩论 争论 民意调查或扩展讨论 如果您觉得这个问题可以改进并可能重新开放 访问帮助中心以获得指导 严重地 在 22 英寸显示
  • 未捕获的引用错误:进程未定义

    我正在使用 node js 创建一个 Web 应用程序 当我运行应用程序时 通过在浏览器上打开 index html 或在终端上使用命令 npm start 我收到两个错误 未捕获的引用错误 进程未定义 未捕获的引用错误 未定义要求 我通过
  • Edittext 字体不显示

    我正在经历一个奇怪的问题 我创造了自定义编辑文本类用于设置Typeface对于整个应用程序 它几乎在所有情况下都能成功运行 我在用circo ttf 问题是当我设置android inputType textPassword 文本在键入后停
  • 将图像添加到资源的不同方式

    您好 我发现了两种将图像添加到资源的方法 首先是 例如 我创建文件夹图像并向该文件夹添加一些图像 在资源上设置图像构建操作 像这里的东西 http www codewrecks com blog index php 2010 07 23 b
  • 活动编辑器的 pydev 控制台路径

    我想用 pydev 在 python 中编写一些脚本 我遇到的问题是我无法在脚本所在的项目目录中启动控制台 控制台在 pydev aptana 文件夹 aptana 文件夹中的某个位置 中启动 我可以通过将以下代码添加到我的脚本中来解决这些
  • 如何确定给定命名空间中的所有对象是否都是可序列化的?

    一些背景知识 我们要求所有 DTO 对象都是可序列化的 以便它们可以存储在会话中或缓存 正如您可以想象的那样 这非常烦人并且容易出错 是否有任何使用 Visual Studio 2010 的自动化方法 理想情况下作为构建过程的一部分 来确保
  • 如何使用文件流/流写入器处理并发文件访问?

    我正在编写一个审核文件 该文件在每个用户使用我的应用程序时写入用户名 时间以及应用程序中多个变量的旧 更改值 它正在使用一个FileStream and StreamWriter访问审计文件 每个用户的所有审核都将写入同一文件 问题是 当两
  • 将非模态表单重新设置为现有应用程序的父级

    我希望能够在现有的应用程序中显示非模式形式 目前我可以做类似的事情 myform ShowDialog handleToApp 但这将创建一个以应用程序为父级的模态表单 以及我真正在寻找的不是模态的东西 因此当表单失去焦点时 它不会破坏控制
  • 只读取选定的列

    谁能告诉我如何仅读取下面每年数据的前 6 个月 7 列 例如使用read table Year Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec 2009 41 27 25 31 31 39 2