将函数应用于数据框中的每一列，观察每列现有的数据类型

2024-02-25

我正在尝试获取大数据框中每列的最小值/最大值，作为了解我的数据。我的第一次尝试是：

apply(t,2,max,na.rm=1)

它将所有内容视为字符向量，因为前几列是字符类型。所以一些数字列的最大值是" -99.5".

然后我尝试了这个：

sapply(t,max,na.rm=1)

但它抱怨max 对因子没有意义. (lapply是一样的。）令我困惑的是apply想法max对于因素来说非常有意义，例如它为第 1 列返回“ZEBRA”。

顺便说一句，我看了一下在 POSIXct 向量上使用 sapply https://stackoverflow.com/questions/2482125/r-using-sapply-on-vector-of-posixct其中一个答案说“当您使用 sapply 时，您的对象被强制为数字，...“。这是发生在我身上的事情吗？如果是这样，是否有一个不强制的替代应用函数？当然这是一个常见的需求，因为数据框类型的关键特征之一是每列可以是不同的类型。

如果它是一个“有序因素”，事情就会有所不同。这并不是说我喜欢“有序因素”，我不喜欢，只是说有些关系是为“有序因素”定义的，而不是为“因素”定义的。因素被认为是普通的分类变量。您将看到因素的自然排序顺序，即您所在区域的字母词汇顺序。如果您想自动将每一列强制转换为“数字”，...日期和因素等等，请尝试：

sapply(df, function(x) max(as.numeric(x)) )   # not generally a useful result

或者，如果您想首先测试因素并按预期返回：

sapply( df, function(x) if("factor" %in% class(x) ) { 
            max(as.numeric(as.character(x)))
            } else { max(x) } )

@Darrens 评论确实效果更好：

 sapply(df, function(x) max(as.character(x)) )

max字符向量确实成功。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

将函数应用于数据框中的每一列，观察每列现有的数据类型的相关文章

R：根据元素长度从向量中删除元素

如何根据字符串的字符数或长度从字符串向量中删除元素 df lt c asdf fweafewwf af aewfawefwef awefWEfawefawef gt df 1 asdf fweafewwf af aewfawefwef aw
Django 中的 Rpy2 错误 - 未为“”类型的对象定义转换“py2rpy”

我以前从未使用过 R 并且正在尝试使用 rpy2 从 python 调用 R 函数它可以在独立的 python 终端上运行但不能在 Django 中运行但rpy2似乎无法将python字符串转换为r对象我正在使用同事提供的自定义库
ggplot 图例标签内的希腊字母、符号和换行符

我在尝试着有换行符自动或强制对齐文本左对齐或左右对齐有希腊字母和百分号在 gglot 图例标签内我尝试了几种方法但我似乎无法将我读到的所有技巧结合起来我可以通过插入来换行 n进入标签但这似乎不适用于希腊字母不适用于图例
使用自定义渐变填充直方图箱

我想在 R 和 ggplot2 中创建一个直方图其中根据连续的 x 值填充箱大多数教程仅通过离散值或密度计数进行着色下列的这个例子 https stackoverflow com questions 40284227 how to
R data.table 连接不等式条件

我想使用 data table 包根据多个不等式条件对数据进行子集化 data table 手册中的示例展示了如何使用字符变量执行此操作但不显示数字不等式我还了解了如何使用子集函数来执行此操作但我真的很想利用 data table 二
改进R中从google获取股票新闻数据的功能

我已经编写了一个函数来从 Google 获取和解析给定股票代码的新闻数据但我确信有一些方法可以改进它对于初学者来说我的函数返回一个 GMT 时区的对象而不是用户当前的时区如果传递的数字大于 299 它就会失败可能是因为 goog
R：ifelse 中的字符串列表

我正在寻找与 MySQL 中的 where var in 语句类似的东西我的代码如下 data lt data frame id 10001 10030 cc1 rep c a b c 10 attach data data new lt
如何读取 R 中的每个 .csv 文件并将其导出到单个大文件中

你好我有以下格式的数据 101 20130826T155649 3 1 round 0 10552 180 yellow 12002 1 round 1 19502 150 yellow 22452 1 round 2 28957 130
如果条目出现次数少于 x 则删除数据框中的行

我有以下数据框称之为 df 它是由三个向量组成的数据框姓名年龄和邮政编码 df Name Age ZipCode 1 Joe 16 60559 2 Jim 20 60637 3 Bob 64 94127 4 Joe 23 9412
如何确定 R 包的作者？

如何确定包的作者是谁鉴于我们拥有这个广泛使用的代码库我认为参考我在分析中使用的软件是合适的有没有办法以编程方式检索作者和任何其他相关信息在伪代码中我想执行以下操作 references base 我怎样才能做到这一点为了能够引用
R 多元一步预测和准确性

我想使用 R 来比较两个预测模型的 RMSE 均方根误差第一个模型使用 1966 年至 2000 年的估计值来预测 2001 年然后使用 1966 年至 2001 年的估计值来预测 2002 年依此类推直至 2015 年第二个模型使
更改 pander 中的默认对齐方式 (pandoc.table)

我目前正在切换到pander对于我的大部分时间knitr markdown格式化因为它提供了如此出色的pandoc支持我不太满意的一件事是默认的居中对齐营销人员可能会喜欢它但对于技术报告来说这是一个可怕的事情使用的最佳选择Hmis
如何返回包含最大值标签的向量

我有一个 4 列数组我想获得一个向量其中每行包含包含该行最大值的列的标签我可以在循环中执行此操作但我想使用矩阵函数来提高速度我怎样才能在不编写自己的库函数的情况下做到这一点有一个函数可以做到这一点如果x是你的矩阵尝试max
R 中的龙卷风图

我正在尝试在 R 中绘制龙卷风图又名敏感性图目标是可视化某些变量增加 10 和减少 10 的效果到目前为止我已经得到这个结果这是我正在使用的代码 Tornado plot data lt matrix c 0 02 0 02 0 0
R 编程常用工具

如果已经以不同的方式问过这个问题我深表歉意但我找不到任何达到我想要的东西我真的是从其他软件包 SPSS 开始接触 R 的当我了解真正可以做什么时我意识到我还需要其他工具这让我想到了我的问题您有哪些用于开发 R 代码的设置我
如何将同一行中以逗号分隔的值拆分到R中的不同行

我有一些数据来自谷歌表格 https forms gle rGQQL3tvA1PrE4dD8我想拆分以逗号分隔的答案 and 复制参与者的 ID 数据如下 gt head data names Q2 Q3 Q4 1 PART 1 fruit
R中整数类和数字类有什么区别

我想先说我是一个绝对的编程初学者所以请原谅这个问题是多么基本我试图更好地理解 R 中的原子类也许这适用于一般编程中的类我理解字符逻辑和复杂数据类之间的区别但我正在努力寻找数字类和整数类之间的根本区别假设我有一个简单的向量x
如何在 R 中将字符串解析为层次结构或树

有没有办法将表示组的字符串解析为 R 中的层次结构假设我的小组结构如下 1 1 1 1 1 1 1 1 1 1 1 1 2 1 1 3 1 1 3 1 1 1 3 2 1 1 3 3 1 2 1 2 1 1 2 1 1 1 2 1 2 1
更快的 %in% 运算符

The 快速匹配 https cran r project org web packages fastmatch index html包实现了更快的版本match对于重复匹配例如在循环中 set seed 1 library fastma
排序因素与水平

有人能解释一下 R 中 ordered 参数的用途吗 R says ordered逻辑标志来确定级别是否应被视为有序按给定的顺序所以如果我有一个名为名称的因素并设置ordered TRUE names lt factor c fred

随机推荐

在发布模式下未针对异步方法调用 IDisposable.Dispose()

我在 VS2015 1 上使用 NET 4 6 1 在 VB NET 14 中编写了以下 WPF 示例应用程序 Class MainWindow Public Sub New InitializeComponent End Sub Priv
除法结果不正确

我有一个时间计算器多年来一直运行良好然而一直困扰我的一件事是如果使用小数秒结果将成为浮点错误的牺牲品所以我最近改用这个 BigDecimal 库 https github com dtrebbien BigDecimal
使用 FCM 向订阅主题的所有设备（批量）发送推送通知时出现扩展问题

我已将所有设备订阅了一个主题即约100万用户当设备收到通知时会有一个调用 REST API 的操作按钮现在如果我向订阅特定主题的所有设备触发通知所有用户都会收到通知并点击操作按钮该按钮将调用其余 API 来获取数据太多的 R
从 ClearCase 快照中删除文件的“正确”方法是什么？

当我从快照视图中删除文件时下次在 ClearCase Explorer 中查看快照时它会显示已签出但已删除的图标当我在快照上运行查找修改的文件时不会显示已删除的文件在快照上运行更新视图会导致 ClearCase 将丢失的
如何将表从转储恢复到数据库？

我使用 pg dump 创建表转储 pg dump h server1 U postgres t np points gisurfo gt D np point sql 当我进入 psql 并说 f D np point sql 但获取标准
从多个线程中选择同一个文件描述符

如果我打电话会发生什么select来自多个线程的同一个打开的文件描述符这有记录在某处吗根据POSIX 2008select http pubs opengroup org onlinepubs 9699919799 functions
复选框和单选按钮

复选框是否有权像单选按钮一样工作我正在开发一个测验应用程序其中选项具有单选按钮的行为并且选项的图标像复选框一样我是否可以将复选框分组为我们将单选按钮分组如果您想要看起来像复选框的单选按钮将RadioButton的样式设置为 an
GNU Flex 库 libfl 提供什么？

我可以从 flex 和 bison 生成的文件编译一个程序 cc lex yy c program tab c o output 也由 cc lex yy c program tab c lfl o output 它们都运行顺利没有任何问
通过 GenericEntity> 在 RESTful Response 对象中使用 Java 泛型模板类型

我有一个通用的 JAX RS 资源类并且我已经定义了一个通用的findAll method public abstract class GenericDataResource
为什么Complete输出模式需要聚合？

我在 Apache Spark 2 2 中使用最新的结构化流处理并遇到以下异常 org apache spark sql AnalysisException 完整输出模式不当流上没有流聚合时支持数据框数据集为什么完整输出模式需要流式
禁止访问消息以防止从 Excel 重复导入

我正在将数据从 Excel 导入到 Access 中的现有表中并希望抑制以下消息我尝试使用多字段索引将新记录导入表中并且还尝试首先导入临时表然后将新记录附加到现有表中然而在这两种情况下它仍然会弹出以下消息我想避免用户看到该消
使用 Linq 查询 Xml 文件中的记录

以下是我的 xml 文件我必须为每个页面和每个类型获取以逗号分隔的字符串提到的字段请帮助了解如何继续使用 Linq 示例如果我想为 page1 定义 Type customFields 则必须以逗号分隔输出项目ID 员工ID 员工姓
同一个Python解释器实例同时运行多个脚本？

6 7 年前我看到了一种在资源紧张的 env 上运行 python 的倡议只需运行解释器一次同时允许多个脚本同时使用它这个想法是节省解释器启动开销并节省 RAM 是否存在类似的东西这个问题Python 从同一个解释器同时执行多个脚
Scanf 漏行

我编写了一个测试程序它应该接受 3x3 字符矩阵并输出输入的矩阵但是我必须输入 4 行才能让程序生成相应的矩阵我已经查找了 scanf 函数的问题但我尝试过的解决方案似乎都不起作用你能帮我解决这个问题吗 My code incl
Paramiko Python：IOError：[Errno 13]权限被拒绝

问题我可以做类似的事情吗 self sftp put sourceFilePath final destination use sudo True 我可以创建文件夹但不能创建文件我需要显式调用 sudo 或在 paramiko 中设置
从 CSV 文件创建 Networkx 图表

我正在尝试构建一个 NetworkX 社交网络图CSV file https github com MelissaLaurino DolphinSocialNetwork Laurino blob master test csv 我正在使用
java 字符串分割

如果我想分割任意字符串的字符考虑有间隙和无间隙该怎么办例如如果我有字符串My Names James我希望每个角色都像这样 M y n a m e s etc 你是这个意思 String sentence Hello World S
该方法必须重写超类方法

最近我将计算机更新到 Ubuntu 11 10 64 位我在导入项目时遇到问题它给了我一个错误方法 onView 必须重写超类方法我在其他一些帖子中读到错误应该是使用java 1 5 但是Ubuntu 11 10附带了open 6
Laravel 核心方法混乱

我一直在挖掘 Laravel 的核心因为我想了解它是如何工作的但我想出了一个方法即使三天后我也无法理解在 start php 中应用程序与其自身绑定到目前为止一切都很好但是当我检查 app gt share 方法时我迷失了
将函数应用于数据框中的每一列，观察每列现有的数据类型

我正在尝试获取大数据框中每列的最小值最大值作为了解我的数据我的第一次尝试是 apply t 2 max na rm 1 它将所有内容视为字符向量因为前几列是字符类型所以一些数字列的最大值是 99 5 然后我尝试了这个 sapply

将函数应用于数据框中的每一列，观察每列现有的数据类型

将函数应用于数据框中的每一列，观察每列现有的数据类型 的相关文章

随机推荐

热门标签

将函数应用于数据框中的每一列，观察每列现有的数据类型的相关文章