R手册(Common)--tidyverse+tibble

2023-10-31

tidyverse是一系列包的组合，构建了一套完整的数据分析生态链，提供了一套整洁的数据导入，分析和建模方法，刷新了R语言原有的数据科学体系。

文章目录

tidyverse
- Usage
- core tidyverse packages
- Import
- Wrangle
- Program
- Model
tibble
- 创建tibble
- 函数

tidyverse

tidyverse

Usage

small, in-memory data ( <2Gb): tidyverse
larger data (10-100 Gb): data.table
Parallel computing : need a system (like Hadoop or Spark)

core tidyverse packages

tidyverse_packages() #查看tidyverse内含的包
tidyverse_update() #更新tidyverse packages

library(tidyverse) will load the core tidyverse packages:

ggplot2, for data visualisation.
dplyr, for data manipulation.
tidyr, for data tidying.
readr, for data import.
purrr, for functional programming.(FP)
tibble, for tibbles, a modern re-imagining of data frames.

Import

As well as readr, for reading flat files, the tidyverse includes:

readxl for .xls and .xlsx sheets.
feather, for sharing with Python and other languages.
haven for SPSS, Stata, and SAS data.
jsonlite for JSON.
xml2 for XML.
httr for web APIs.
rvest for web scraping.
DBI for relational databases.

Wrangle

As well as tidyr, and dplyr, there are five packages designed to work with specific types of data:

stringr for strings.
lubridate for dates and date-times.
forcats for categorical variables (factors).
hms for time-of-day values.
blob for storing blob (binary) data.

Program

除了purrr处理函数式编程外，还有三个解决常规编程的包

rlang 提供了R的核心语言和tidyverse的工具
magrittr 管道函数
glue 提供了base::paste()的更加丰富的版本

Model

modelr, for modelling within a pipeline
broom, for turning models into tidy data

tibble

tibble 重塑了data.frame，可存储任意类型，包括list，tbl_df 等。

tibble()永远不会改变输入的类型（例如它永远不会将字符串转换为因子），永远不会改变变量的名称，并且它永远不会创建row.names()

创建tibble

`as_tibble(x)` #从现有对象创建
`tibble() `    #使用列向量创建
`tribble()`    #逐行布局生成

# 示例
as_tibble(iris)

tibble(x = runif(10), y = x * 2)
tibble(x =list(1,2), y = tibble("a","b"))

tribble(~colA,~colB, 
        "a",  1,
        "b",  2)

取子集	说明
`[`	返回data.frame
`[[`, `$`	返回子向量

函数

函数	说明
is_tibble(x)	判断
增加行/列
add_column(.data, …, .before = NULL, .after = NULL)	将列添加到数据框
add_row(.data, …, .before = NULL, .after = NULL)	将行添加到数据框
用于处理行名的工具
has_rownames(df)
remove_rownames(df)
rownames_to_column(df, var = “rowname”)
rowid_to_column(df, var = “rowid”)
column_to_rownames(df, var = “rowname”

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

R手册

R手册(Common)--tidyverse+tibble 的相关文章

R手册(Tidy+Transform)--tidyr

文章目录 Reshape Data Split or Unit Cells Handle Missing Values tidyr Easily tidy data with spread and gather functions Resh
R手册(Tidy+Transform)--缺失处理(naniar and simputation)

文章目录 naniar 缺失数据摘要阴影矩阵可视化缺失值变量分布关系 simputation make imputation simpler for missing data 缺失值是指粗糙数据中由于缺少信息而造成的数据的聚类分组删
R手册(Parallel Computing)--foreach

R手册 Parallel Computing foreach foreach foreach 后端支持 library doParallel 为foreah包提供一个并行的后端 n cores lt detectCores logical
R手册(Tidy+Transform)--forcats

forcats 分类变量数据处理 forcats for factor 函数说明 factor x levels labels ordered as factor x fct expand f 添加更多级别 fct explicit na
R手册(Machine Learning)--mlr (Part 2)

文章目录 Configuration 配置 Parallelization 并行 Imputation 插补 Feature Extraction 特征提取 1 Feature filtering 特征筛选 2 Feature select
R手册(Common)--R语言入门

说明本节中大部分内容摘自书籍 R语言实战第2版文章目录 RStudio Take control of your R code 数据处理一般流程 R 数据结构 R 运算符概率函数控制语句与循环语句自定义函数调试拟合线性模型f
R手册(Import)--rvest

文章目录解析html 提取组件提取修改和提交形式的函数浏览网站解析html 函数说明 read html x encoding x为a url或 a local path html nodes x css xpath 通过使用
R手册(Common)--tidyverse+tibble

tidyverse是一系列包的组合构建了一套完整的数据分析生态链提供了一套整洁的数据导入分析和建模方法刷新了R语言原有的数据科学体系文章目录 tidyverse Usage core tidyverse packages Impo
R手册(Common)--面向对象(R6 and S4)

R 主要面向统计计算似乎很少会用到面向对象的编程方法但在统计计算中在下列情形中使用面向对象的编程方法可以编程更有效率文章目录面向对象R6类面向对象S4类自定义S4类实例化函数 S4的泛型函数面向对象R6类 R 的面向对象
R手册(Visualise)--geomnet(ggplot2 extensions)

文章目录 geomnet 返回ggplot2扩展主目录 geomnet Geom 网格图关系图 geom net aes from id to id fontsize data stat net position identity na
R手册(Visualise)--ggplot2

文章目录 Overview Geoms 基本图形单变量双变量三变量文本误差可视化地图 Stats Scales 常用标尺格式坐标轴标尺 Color and fill scales Shape and size scales C
R手册(Common)--R语言基础包

文章目录环境设置输入输出文件操作进度条数据创建数据选取及数据信息列联表内置常量数学矩阵运算模型其他函数 R语言基础包 base stats 环境设置系统函数函数说明 options 显示或设置当前选项 digi
R手册(NLP)--wordcloud2

文章目录 wordlcoud2函数 letterCloud函数 shiny支持 wordcloud2 R interface to wordcloud for data visualization Wordcloud2主要包括两个函数 wo
R手册(Syntax)--magrittr

magrittr pipe lhs gt rhs forward pipe lhs为rhs第一个参数时 x gt f y 等价于 f x y lhs在任意位置时用点代替 z gt f x y arg 等价于 f x y arg z rh
R手册(Time Series)--forecast and prophet

文章目录 forecast for Time Series and Linear Models 时间序列分析模型预测 ggplot2扩展模型评估 prophet 构建模型模型预测可视化交叉验证时间序列分析 Time Serie
R手册(NLP)--text2vec

文章目录分词器 I O 处理迭代器支持 create 函数向量化主题模型 text2vec 这个 R 包提供了高性能和简洁的 API 来进行文本分析自然语言处理分词器 word tokenizer strings 英语分词器
R手册(Common)--data.table

R语言data table包是自带包data frame的升级版用于数据框格式数据的处理最大的特点快包括两个方面一方面是写的快代码简洁只要一行命令就可以完成诸多任务另一方面是处理快内部处理的步骤进行了程序上的优化使用多线程
R手册(Communicate)--R Markdown

文章目录 Overview Rmd Structure YAML Header Parameters Set render options with YAML 初始文档信息 Text Embed code with knitr syntax
R手册(Visualise)--gganimate(ggplot2 extensions)

文章目录 gganimate Create easy animations with ggplot2 返回ggplot2扩展主目录 gganimate Create easy animations with ggplot2 GitHub链接
R手册(Visualise)--GGally(ggplot2 extensions)

本站已停止更新查看最新内容请移至本人博客 Wilen s Blog 文章目录 GGally ggmatrix ggplot2矩阵 ggpairs ggplot2广义配对图 ggscatmat 纯粹定量变量的传统散点图矩阵返回ggplot

随机推荐

python 运行中 Error 解决方法汇总

大家在运行python过程中想必都遇见过此类情况好了话不多说言归正传各类ERROR出现情况总结 SyntaxError 括号没有成对出现时使用或者自增自减操作符时使用Python关键字作为变量名时引号没有成对出现时误将
【ES】索引创建，为“非查询字段”不建索引 index store

目录创建索引 PUT 索引的名字 mappings properties xxx1属性 type 该属性的类型 xxx2属性 type 该属性的类型 ES客户端 PUT 索引的名字 Linux
Unity3d Ugui 5 Text

Character 字符 1 Font 字体 2 Font Style 1 Normal 正常 2 Bold 粗体 3 Italic 斜体 4 Bold And Italic 粗体斜体 3 Font Size 字体大小 4 Line Sp
train.Saver() restory Key not found in checkpoint

加上tf reset default graph 在最前面就解决了 saver import tensorflow as tf tf reset default graph v1 tf get variable v1 shape 3 ini
如何对Element组件的样式进行自定义修改

如何对Element 组件的样式进行自定义修改前言举例项目主要代码效果一定位需要修改的样式二使用全局样式的修改方法代码如下三使用局部样式的修改方法代码如下前言在项目开发过程中我们常常需要借助第三方组件库而ele
Java经典面试题整理及答案详解（一）

简介面试题包括java集类和设计模式 spring工作原理动态代理事务的控制等方面码住我们能赢 Java在编程语言中占据着重要的地位随着技术的更新与发展越来越多的人进入互联网行业踏上Java编程之旅本系列内容来源于阿里云
leedcode

本节只写自己做的leedcode 只是用来当笔记里面记录的方法有自己想的也有来自各位大神的思路 1 重建二叉树输入某二叉树的前序遍历和中序遍历的结果请重建该二叉树假设输入的前序遍历和中序遍历的结果中都不含重复的数字例如给出前
【华为OD机试】比赛【C++ Java Python】

题目描述一个有N个选手参加比赛选手编号为1 N 3 lt N lt 100 有M 3 lt M lt 10 个评委对选手进行打分打分规则为每个评委对选手打分最高分10分最低分1分请计算得分最多的3位选手的编号如果得分相同则得
三点“揭露”内向技术人如何做好分享?

引言内向的人不适合做分享似乎有这么一个想法根植在所有人的心底特别对于程序员这个群体内向的人更加多了毕竟不内向谁当程序员呢我当时选择程序员这个职业就是因为不太喜欢和人打交道但是经过这些年的实践我逐渐发现内向的人如果能充分
Windows软件：如何安装ideaIU-2020.3.3并使用无限重置插件达到永久使用

前言在我们做SpringBoot Java项目时一个好的开发工具可以让我们的效率达到事半功倍早期的eclipse已经无法满足我们日常需求当然idea集成开发工具在很早前就已经进入市场如今取得了无法撼动的地位首居Java开发工具第
Redis学习笔记(三)——事务控制及Jedis使用

又是一个新的周末上周由于周末睡过头了 Redis的学习进度也慢了不少这篇内容本该是上周应该发布的晚了一些哈哈这篇文章我会学习一下Redis的事务控制可能对于初学的小伙伴来说事务控制比较难以理解我的语言也不是很精炼但还是希望对小
Mybatis学习——使用Limit分页

Limit分页 SQL语句语法 SELECT FROM table LIMIT stratIndex pageSize SELECT FROM table LIMIT 5 10 检索记录行 6 15 为了检索从某一个偏移量到记录集的结束所
NDK编译时报错： Android NDK: NDK Application 'local' targets unknown ABI(s): arm64-v8a x86_64

网上下了一个github项目 NDK编译时报错 Android NDK NDK Application local targets unknown ABI s arm64 v8a x86 64 Android NDK Please fix
Intellij IDEA设置HTTP Proxy

Intellij IDEA设置HTTP Proxy MAC版打开Appearance Behavior gt System Settings gt Http Proxy 点选 Auto detect proxy settings gt A
Apache Hive+Kerberos安装配置及 Kettle(Pentaho)访问带 Kerberos 认证的 Hive的集成

目录 1 连接 2 KDC 安装 2 1 安装 Kerberos 服务 2 2 配置 var kerberos krb5kdc kdc conf 2 3 配置 var kerberos krb5kdc kadm5 acl 2 4 配置 et
Java从后台重定向（redirect）到另一个项目的方法

1 通过ModelAndView跳转 RequestMapping alipayforward public ModelAndView alipayforward HttpServletRequest req HttpServletResp
uview基本配置，在HubildX中如何配置uni-app相关的组件

配置步骤 1 引入uView主JS库在项目根目录中的main js中引入并使用uView的JS库注意这两行要放在import Vue之后 main js import uView from uview ui Vue use uView
重心坐标

数学中重心坐标是由单形如三角形或四面体等顶点定义的坐标重心坐标是齐次坐标的一种设 v1 vn 是向量空间 V 中一个单形的顶点如果 V 中某点 p 满足那么我们称系数 1 n 是 p 关于 v1 vn 的重心坐标这些顶点自己
utf-8 中的一个汉字占几个字节

原文链接 http blog csdn net chummyhe89 article details 7777613 占 2 个字节的占 3 个字节的基本等同于 GBK 含 21000 多个汉字占 4 个字节的中日韩超大字符集里面的
R手册(Common)--tidyverse+tibble

tidyverse是一系列包的组合构建了一套完整的数据分析生态链提供了一套整洁的数据导入分析和建模方法刷新了R语言原有的数据科学体系文章目录 tidyverse Usage core tidyverse packages Impo

热门标签