在数据框或向量中查找非数字数据

2024-03-23

我读了一些冗长的数据read.csv()，令我惊讶的是，数据是以因子而不是数字的形式出现的，所以我猜测数据中必须至少有一个非数字项。我怎样才能找到这些物品的位置？

例如，如果我有以下数据框：

df <- data.frame(c(1,2,3,4,"five",6,7,8,"nine",10))

我想知道第 5 行和第 9 行有非数字数据。我该怎么做呢？

df <- data.frame(x = c(1,2,3,4,"five",6,7,8,"nine",10))

诀窍是知道通过转换为数字as.numeric(as.character(.))将非数字转换为NA.

which(is.na(as.numeric(as.character(df[[1]]))))
## 5 9

（只是使用as.numeric(df[[1]])不起作用 - 它只是降低级别而留下数字代码）。

您可以选择抑制警告：

which.nonnum <- function(x) {
   which(is.na(suppressWarnings(as.numeric(as.character(x)))))
}
which.nonnum(df[[1]])

为了更加小心，您还应该检查转换前的值是否不是 NA：

which.nonnum <- function(x) {
   badNum <- is.na(suppressWarnings(as.numeric(as.character(x))))
   which(badNum & !is.na(x))
}

lapply(df, which.nonnum)将报告数据框所有列的“错误”值。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

DataFrame

在数据框或向量中查找非数字数据的相关文章

PCA 图中带有名称的工具提示

我想用 ggplotly 生成交互式绘图工具提示应该显示变量的名称 interactive lt ggplotly pca dynamicTicks T tooltip c x y label list pca 是 PCA 的可视化 su
使用 R 中绘制的标准误差创建条形图

我试图找到在 R 中创建条形图并显示标准错误的最佳方法我看过其他文章但我无法弄清楚与我自己的数据一起使用的代码之前没有使用过 ggplot 这似乎是最常用的方法而 barplot 不与数据框合作我需要在两种情况下使用它我为此创建
Pandas - 按每个可能的键组合聚合

我有一个 DataFrame Pandas 我想通过 A B C 和 D 列的组合尽可能按数据进行分组假设它具有以下形式 A B C D E F G 0 Y X Y Z 1 2 7 1 Y X Y Z 3 4 8 2 X Y U V 1
计算分组序列中两个值之间的差异

这是这篇文章的后续问题循环遍历 R 中的数据帧并测量两个值之间的时间差 https stackoverflow com questions 44885856 loop through dataframe in r and measure
Python Pandas groupby、排名，然后根据自定义排名分配值

问题设置大熊猫数据框 df pd DataFrame Group A A A A A A A A A Subgroup Group 1 Group 1 Group 1 Group 1 Group 1 Group 1 Group 2 Gro
R：使用 RGDAL 和 RASTER 包时抛出错误

给所有可能相关的人这是源代码 GRA D1 lt raster files 1 Sets up an empty output raster GRA D1 lt writeStart GRA D1 filename GRA D1 tif
R 语言 - 等待用户使用 scan 或 readline 输入

我试图让用户输入一些关键字进行查询在我的脚本中我使用了 scan 或 readline 我使用 R 嵌入脚本编辑器 Windows 进行了尝试但是当我执行代码时它使用我的下一行脚本作为标准输入这是我的部分脚本 keywords
如何在 R 中执行随机森林/交叉验证

我无法找到对我尝试生成的回归随机森林模型执行交叉验证的方法因此我有一个数据集其中包含 1664 个解释变量不同的化学性质和一个响应变量保留时间我正在尝试生成一个回归随机森林模型以便能够预测给定保留时间的物质的化学性质 ID
从 foreach 循环赋值

我想并行化一个循环例如 td lt data frame cbind c rep 1 4 2 rep 1 5 rep 1 10 2 names td lt c val id res lt rep NA NROW td for i in l
有条件地将可选组替换为 gsub

一位用户问我如何做到这一点如何使 ggplot 图例中的选定单词变为斜体 https stackoverflow com questions 76054997 how to italicize select words in a ggplo
在 Bookdown 中呈现附录图号

Bookdown 是一个很棒的软件包我期待看到它如何发展但现在我在渲染数字方面遇到了麻烦pdf document2附录中的数字时的格式具体来说当带有标题的图形位于附录中时图形编号应采用 A 1 A 2 B 1 B 2 等形式但图
从 data.frame 创建新列

我有一个长格式的数据集其中测量时间嵌套在 Networkpartners NP 中而 Networkpartners NP 又嵌套在人员 ID 中下面是它的示例真实数据集有数千行 ID NP Time Outcome 1 11
使用 ggplot_build 和 ggplot_gtable 后使用 ggsave 保存图形

我正在通过更改 ggplot build 生成的数据来修改使用 ggplot 构建的图表原因类似于包括 geom boxplot 中填充美学中使用的缺失因子水平的空间 https stackoverflow com questions 1
xml2 包 (R) 中的 xml_find_all 函数未找到相关节点

我使用 R 中的 xml2 包来访问 xml 数据发现它在不同的 xml documents 上表现不同在这个宠物的例子中 library xml2 doc lt read xml
R中不同级别的李克特分组

我想使用 Likert 包并按变量分组并绘制结果问题是我想要可视化的变量有不同的级别有没有解决的办法一个简单的例子来说明我的问题 library reshape library likert foo lt data frame ca
从 Cox PH 模型预测概率

我正在尝试使用 cox 模型来预测时间称为停止 3 后失败的概率 bladder1 lt bladder bladder enum lt 5 coxmodel coxph Surv stop event rx size number cl
geom_密度匹配geom_histogram binwitdh

我想在 ggplot2 中的分布条形图上添加一条线以显示平均分布但遇到了麻烦像这样的 ggplot 调用 ggplot x aes date received geom histogram aes y count binwidth 30
R markdown 引文标识符

R markdown 允许使用 YAML 元数据部分中的参考书目元数据字段指定参考书目文件例如 title Sample Document output html document bibliography bibliography bi
将函数应用于每个列组合

我有一个数据框n列并希望对每个列应用一个函数组合列这与如何cor 函数将数据帧作为输入并生成相关矩阵作为输出例如 X lt data frame A rnorm 100 B rnorm 100 C rnorm 100 cor X 这将生
在多面图中用 N 注释 x 轴

我正在尝试生成一些按治疗条件和访问次数细分的数字结果的箱线图每个框中的观察次数都放在图下方并且也标记了访问次数这里有一些虚假数据可以用来说明我举了两个我尝试过但不太有效的例子 library ggplot2 library plyr

随机推荐

在 Swift 中查找字符串中第 N 个子字符串实例的索引

我的 Swift 应用程序涉及搜索 UITextView 中的文本用户可以在该文本视图中搜索某个子字符串然后跳转到文本视图中该字符串的任何实例例如第三个实例我需要找出它们所在字符的整数值例如示例1 用户搜索 hello 文本视
将会话信息存储在 ASP.Net Cookie 或会话状态中？

我需要为用户存储一些与会话相关的数据该数据不需要加密但我想确保用户无法修改它我认为我的选择是将其存储到隐藏字段中存储到 cookie 中或存储在 ASP Net 会话状态中我需要确保服务器场安全的解决方案如果它存储在 cooki
如何克隆 jQuery 中的单选按钮并修改选中状态？

我已经克隆了单选列表当我检查单选按钮并单击添加更多按钮时将添加新的克隆单选列表但添加的单选列表单选按钮不会由用户修改检查单选按钮的状态是固定的这是我的 html 代码 div class Box div class form
Formik、Material UI Autocomplete 和 Firestore - 在哪里查询以查找数组参数

如何修改 formik onChange 处理程序以便它仅保存传递给 Material UI Autocomplete 字段的选项的值而不是值加标签的数组我有一个集合其中有一个带有名为类别的属性的文档目前该类别使用表单输入选项中
协议族不支持地址族 - 特定计算机上的 SocketException

在我编写的应用程序中我有一个java net SocketException在特定计算机上 java net SocketException 协议族不支持地址族连接此特定计算机运行 Windows 7 32 位并通过本地连接以太网
Three.js 通过 Gui 阻止 Raycast

我想通过光线投射选择对象但每次我想在 Three js GUI 上选择某些内容时 Mousdown 事件都会被触发我怎么说如果 Gui 在对象前面则不触发之类的话 document addEventListener mousedo
C: 如何确定外部数组的 sizeof(array) / sizeof(struct) ？

定义类型x和一个数组X那种类型的 x h typedef struct x int p q r x extern x X 单独的文件来保存巨大的喇叭阵列X x c include x h x X lotsa stuff 现在我想用X mai
在“打开资源”对话框中键入内容时，是否可以通过目录而不是仅通过文件名来查找文件？

I have been using extensively Ctrl Shift to find and open files in my Eclipse project But sometimes I know the directory
JPG 与 JPEG 图像格式

我经常使用JPEG图像我注意到有两个非常相似的文件扩展名 jpg 我手机的摄像头和Preview应用程序的使用以及 jpeg 其中图像捕捉保存用我的扫描仪扫描的图像佳能MX455打印机 LaTeX似乎没有区别因为我给了它一个 jpeg
在同一个try块中锁定多个ReentrantReadWriteLock是否安全？

假设我有两个关键资源 foo 和 bar 我用一些东西来保护他们ReentrantReadWriteLock http docs oracle com javase 7 docs api java util concurrent locks
在jquery中为mouseleave添加延迟

我在我的网站中使用这段代码我想知道如何为 mouseleave 函数添加延迟 target mouseenter function e var tooltip this tipid ddimgtooltip showbox tooltip
具有单独轴的 Apache-POI 图表中的第二行

您好这段代码取自答案here https stackoverflow com questions 55192804 how do i add a second line with a second axis to an xddfchart
UIWebView - 如何禁用操作表 (UIActionSheet)？

我想知道如何禁用 UIActionSheets 特别是点击并按住 UIWebView 中的超链接后显示的操作表这些似乎在 UIWebViews 中默认启用其中包含警报标题中相应链接的链接地址它们也在 Safari 中启用如何是否可
画圆圈：将代码分成类

我正在尝试用随机颜色和随机直径绘制圆圈mousePressed事件但当我尝试稍微组织我的代码将我的代码分成类时我遇到了一些问题控制器类 public class Controller implements MouseListene
Webpack SCSS 图像 URL 链接在嵌套路由上损坏

这是我的目录结构 public src app js assets images logo b green png stylesheets nav scss And webpack config js module exports entr
使用curl NuGet无法解析的外部符号

环境微软视觉工作室 2017NuGet 包管理器C 项目工作流程我使用 NuGet 添加了curl 我尝试编译我的项目它抛出 8 个链接器错误无法解析的外部符号项目结构 root gt packages gt curl 7 30
for循环中的setTimeout不打印连续值[重复]

这个问题在这里已经有答案了我有这个脚本 for var i 1 i lt 2 i setTimeout function alert i 100 But 3两次都会收到警报而不是1 then 2 有没有办法通过i 而不将函数写为字符串
repo 同步命令的替代方案是什么？

我是 git 新手我想在完成后手动执行清单文件repo init 而不是做repo sync 测量正常 git 命令和repo sync在不同的情况下但我不确定 repo 使用哪个 git 命令我知道repo只是大型代码库的 git
寻找返回黑盒模型最大输出的最佳输入组合

在我的工作中将人工神经网络应用于回归任务时我面临的挑战之一是为了找到给定输入范围的最佳结果我必须将多维网格输入到我的模型中然后简单地选择最高的价值然而这总体上是一个计算成本非常高的解决方案下面的文字长度可能会令人恐惧但这只是
在数据框或向量中查找非数字数据

我读了一些冗长的数据read csv 令我惊讶的是数据是以因子而不是数字的形式出现的所以我猜测数据中必须至少有一个非数字项我怎样才能找到这些物品的位置例如如果我有以下数据框 df lt data frame c 1 2 3 4 f

在数据框或向量中查找非数字数据

在数据框或向量中查找非数字数据 的相关文章

随机推荐

热门标签

在数据框或向量中查找非数字数据的相关文章