R 的 read.csv() 省略行

2024-03-31

在 R 中，我尝试读取大约 42,900 行的基本 CSV 文件（由 Unix 的 wc -l 确认）。相关代码是

vecs <- read.csv("feature_vectors.txt", header=FALSE, nrows=50000)

其中 nrows 稍微高估了，因为为什么不呢？然而，

>> dim(vecs)
[1] 16853     5

表明生成的数据帧大约有 17,000 行。这是内存问题吗？每行由约 30 个字符的哈希码、约 30 个字符串和 3 个整数组成，因此文件的总大小仅约 4MB。

如果相关的话，我还应该注意到很多行都缺少字段。

感谢您的帮助！

此类问题通常很容易解决，使用count.fields，它告诉您如果调用，结果数据框将有多少列read.csv.

(n_fields <- count.fields("feature_vectors.txt"))

如果 n_fields 的所有值并非都相同，则会出现问题。

if(any(diff(n_fields)))
{
  warning("There's a problem with the file")
}

在这种情况下，查看以下值n_fields与您的预期不同：问题出现在这些行中。

正如贾斯汀提到的，一个常见的问题是引号不匹配。打开 CSV 文件并了解其中如何引用字符串。然后打电话read.csv，指定quote争论。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

readcsv

R 的 read.csv() 省略行的相关文章

如果条目出现次数少于 x 则删除数据框中的行

我有以下数据框称之为 df 它是由三个向量组成的数据框姓名年龄和邮政编码 df Name Age ZipCode 1 Joe 16 60559 2 Jim 20 60637 3 Bob 64 94127 4 Joe 23 9412
如何从 R 数据框中提取关键字

我是 R 中文本挖掘的新手我想从数据框的列中删除停用词即提取关键字并将这些关键字放入新列中我尝试制作一个语料库但它对我没有帮助 df C3是我目前拥有的我想添加栏目df C4 但我无法让它工作 df lt structure l
如何在 R 中绘制一列与其余列的关系图

我有一个数据集其中 1 是时间接下来的 14 个是幅度我想在一张图表上散布所有大小与时间的关系其中每个不同的列都是网格化的分层在另一个之上我想使用原始数据来制作这些图表并单独制作它们但只想执行此过程一次数据集A 唯一的自变
当有很多列时，使用 readr::read_csv() 导入数据时覆盖列类型

我正在尝试使用 R 中的 readr read csv 读取 csv 文件我导入的 csv 文件大约有 150 列我只包含示例的前几列我希望将第二列从默认类型我执行 read csv 时为日期覆盖为字符或其他日期格式 GIS Jo
计算互相关函数？

In R 我在用ccf or acf计算成对互相关函数以便我可以找出哪个移位给我带来最大值从它的外观来看 R给我一个标准化的值序列 Python 的 scipy 中是否有类似的东西或者我应该使用fft模块目前我正在这样做 xcor
通过使用 navbarPanel() 并隐藏导航栏构建多页闪亮应用程序用户端（在 ui.R 中）？

我想构建一个多页闪亮应用程序我可以在其中控制用户可以看到哪个页面迪安阿塔利确实这个演示应用程序中有类似的东西 https github com daattali advanced shiny tree master multiple
从 df 中提取具有两列的重叠行对

我想找出这两个表之间哪些对重叠 gt dput data1 structure list Name x c MDH1 MDH1 IDH2 IDH2 IDH2 IDH2 IDH2 IDH2 IDH2 SCOALB SCOALB CSY4 CS
用表达式分割轴标签

我有一个带有包含表达式的长标签的图我想将其分成两行在表达式中添加 n 结果不符合预期 ylabel lt expression A very long label with text and n expression alpha bet
删除字符串末尾的句点和数字

如何删除尾随句点后面紧跟一个数字长度为一位或两位数字例子 z lt c awe p 56 red 45 ted 5 you 88 tom 我只想删除 45和 5 你只需要一个简单的正则表达式 z new gsub 0 9 z 一些评论
融化R中的下半矩阵

如何融化下半三角形加对角矩阵 11 NA NA NA NA 12 22 NA NA NA 13 23 33 NA NA 14 24 34 44 NA 15 25 35 45 55 A lt t matrix c 11 NA NA NA NA
如何在ubuntu的conda环境中更改Rstudio中的R版本

我在基本系统中安装了 R 4 3 和 Rstudio 在 conda 环境中安装了旧版本的 R 4 2 3 命令which R返回环境中安装的 R 的目录 home 用户 miniconda3 envs anndata2ri pip bin
一段 R 代码会影响 foreach 输出中的随机数吗？

我使用运行模拟foreach and doParallel并与随机数名为random在代码中简而言之我模拟一个足球联赛随机生成所有比赛的获胜者以及相应的结果在dt base没有比赛进行在dt ex1 and dt ex24场比赛
使用字符串中的变量名称访问变量值，R

Intro 一个数据集有大量的age year变量 age 1990 age 1991 etc 我有一个字符串值数组length age years 表示这些变量使得age years 1 回报 age 1990 etc Need 我想搜
无法更新/编辑从 R 中的包（`gratia`）导出的 ggplot2 对象

我希望我在这里遗漏了一些令人痛苦的明显的东西我希望更新例如修复标题实验室等由生成的 ggplot 对象gratia draw 不太确定为什么我无法更新该对象有一个简单的解决方案吗 devtools install github
如何对数字进行四舍五入并使其显示零？

R 中将数字四舍五入到小数点后 2 位的常用代码是 gt a 14 1234 gt round a digits 2 gt a gt 14 12 但是如果该数字的前两位小数位为零则 R 会在显示中抑制零 gt a 14 0034 gt
R中的字典数据结构

在 R 中我有例如 gt foo lt list a 1 b 2 c 3 如果我输入foo I get a 1 1 b 1 2 c 1 3 我怎样才能看透foo仅获取键列表在这种情况下 a b c R 列表可以具有命名元素因此可
尝试使用 JRI 将 R 与我的 Java 应用程序集成，但出现错误。谁能解释一下原因和解决办法吗？

我需要将 Java 与 R 集成来运行一些数学命令并使用 R 的功能进行绘图以下部分代码给出了错误 public static void main String args HelloRWorld r new HelloRWorld r h
Quantmod 的简单功能不再起作用

我明天要交论文我收到了一条关于 quantmod 的非常奇怪的错误消息这是我在过去几周使用这个包时从未遇到过的我无法导入特定于道琼斯指数 DJI 的数据我收到以下错误消息 getSymbols DJI src yahoo from
如何在 data.table 中分组后使用条件计算行数

我有以下数据框 dat lt read csv s1 s2 v1 v2 a b 10 20 a b 22 NA a b 13 33 c d 3 NA c d 4 5 NA c d 10 20 dat gt A tibble 6 x 4 gt
如何按用户定义（例如非字母顺序）对数据框进行排序[重复]

这个问题在这里已经有答案了给定一个数据框dna gt dna chrom start chr2 39482 chr1 203918 chr1 198282 chrX 7839028 chr17 3874 以下代码重新排序dna by ch

随机推荐

Keras 中的 5 层 DNN 使用 GPU 训练速度较慢

我在 Keras 1 2 中使用 tensorflow gpu 作为后端编写了一个 5 层密集网络并在我的 MacBookPro CPU 和 AWS 中的 P2 xlarge 实例 K80 启用 cuda 中对其进行训练令人惊讶的是我
在事件中对 HTML 表格单元格（或整行）的背景颜色进行动画处理

我有一张桌子上面有一个菜单食品有几行和几列第二列包含食品的链接当用户点击它时该商品已添加到购物车中我想给用户一些点击和添加的视觉反馈确实有效我已经有一个用于添加链接的点击处理程序商品点击进入购物车一个简单的alert
如何计算从 Shiny 中的文本输入框获取的数据？

ui code library shiny shinyUI Use a fluid Bootstrap layout fluidPage Generate a row with a sidebar sidebarLayout Define
将日期转换为特定格式的字符在R中

我需要映射 3 4 个具有不同日期格式的不同数据帧我们如何将日期转换为以下格式 YYYY MM DD 转换为以下格式的字符 MMM YY 从字符串创建日期对象如果您的列已采用日期格式请跳过此操作 original date lt as
防止 SliverAppBar 标题在 Flutter 中收缩时换行

我有一个 Flutter 应用程序它在 CustomScrollView 中使用 SliverAppBar SliverAppBar 的标题非常长因此当 AppBar 在滚动时压缩时标题开始换行几次我想在不使用溢出的情况下防止这种行
根据条件合并不同行的字段

亚马逊为其市场客户提供 CSV 报告其中包含有关您销售的每篇文章的信息每篇文章有四行如下所示 orderid amounttype amountdescription amount 305 2406165 0572365 ItemPr
每次点击都会弹出新窗口

我有一个弹出窗口我使用下面的脚本打开它每次点击时我想打开新的弹出窗口据我了解为窗口指定唯一的名称将解决问题在本例中为 SampleWindow 保持窗户独特性的最佳方法是什么还有其他方法可以管理 javascript 弹出窗口
Orchard CMS 事务错误

我们的 Orchard 网站上经常随机出现以下错误当在页面之间快速导航时这种情况似乎最为普遍日志中没有其他错误因此我不确定如何找出根本原因我们没有对 ODBC 或类似的东西做任何特殊的事情这是 google 在搜索有关 Orch
使用 x64 汇编代码的基本输入

我正在编写有关汇编中基本输入和输出的教程我使用的是 64 位 Linux 发行版 Ubuntu 在教程的第一部分中我讨论了基本输出并创建了一个简单的程序如下所示 global start section text start mov
从 gradle/groovy 中的路径创建目录结构

我正在从 git 命令行输出在项目的 gradle 构建中实现 diff 包生成任务目前我有一个方法可以给我一个已更改文件的列表git diff name only 我想做的是在一个新目录中创建一个与每个文件的路径匹配的目录结构例如输
从Python中的日期字符串中删除时间戳

我遇到了应该忽略日期字符串中的时间戳的情况我尝试过以下命令但没有成功 start variable used below is in AbsTime Ex 01MAY2017 11 45 and not a string start d
是否有任何 AngularJS + ASP.NET-WebApi + OData + Breeze.js + Typescript 示例，或者有人尝试将这些示例结合起来

我试图结合这些技术但没有什么好的结果因为实体框架元数据不会被breeze js消耗即使是所有设置的配置这也是一个有点棘手的情况实际上没有这样的例子所以这个是我的示例代码它不能正常工作但不知何故也许有人会发现我的错误并最终
错误：数据库连接“Sqlite”丢失，或无法创建 Cakephp 2.9.0

您好我正在使用 phpdesktop 构建桌面应用程序我遇到了这个问题Error Database connection Sqlite is missing or could not be created 使用时cake bake 我能
如何在不使用属性路由的路由属性上指定名称的情况下生成 Web Api 2 URL？

我已将 ASP NET MVC5 应用程序配置为使用 WebApi 的 AttributeRouting public static class WebApiConfig public static void Register HttpCo
WordPress - 如何获取父类别 ID

WordPress 如何获取父类别 ID my category is news gt sport news 我有一个帖子在sport news 如何获得parent 新闻我进入体育新闻帖子时的ID 这段代码回显父猫的名字 foreach
如何为.NET Core 3.0 Worker Service设置serilog SEQ

日志记录正在工作但它没有发布到我的本地 seq 我尝试添加 serilog 和 useSerilog 但它没有登录到我的本地服务相关问题 https stackoverflow com questions 56941898 how to
“update”属性可以同时更新两个组件吗？

我有个问题是否可以同时更新两个组件我正在尝试这样的代码
‘源代码与字节码不匹配’使用IDEA调试JdbcTemplate

当我使用IDEA调试JdbcTemplate源代码时 IDE提示我源代码与字节码不匹配截屏我使用 mvn 来管理我的项目我的 maven pom 配置是
在 JTable 中显示 HTML

有人可以给我提供一个如何在 JTable 单元格中显示 HTML 的示例吗我知道这可以为其他 Swing 组件完成但我似乎无法弄清楚 JTables 的情况你记得放吗围绕 HTML 标记默认字符串渲染器JTable uses JLa
R 的 read.csv() 省略行

在 R 中我尝试读取大约 42 900 行的基本 CSV 文件由 Unix 的 wc l 确认相关代码是 vecs lt read csv feature vectors txt header FALSE nrows 50000 其中

R 的 read.csv() 省略行

R 的 read.csv() 省略行 的相关文章

随机推荐

热门标签

R 的 read.csv() 省略行的相关文章