R手册(Common)--tidyverse+tibble

2023-10-31

tidyverse是一系列包的组合,构建了一套完整的数据分析生态链,提供了一套整洁的数据导入,分析和建模方法,刷新了R语言原有的数据科学体系。
tidyverse

tidyverse

tidyverse

Usage

  • small, in-memory data ( <2Gb): tidyverse
  • larger data (10-100 Gb): data.table
  • Parallel computing : need a system (like Hadoop or Spark)

core tidyverse packages

tidyverse_packages() #查看tidyverse内含的包
tidyverse_update() #更新tidyverse packages

library(tidyverse) will load the core tidyverse packages:

  • ggplot2, for data visualisation.
  • dplyr, for data manipulation.
  • tidyr, for data tidying.
  • readr, for data import.
  • purrr, for functional programming.(FP)
  • tibble, for tibbles, a modern re-imagining of data frames.

Import

As well as readr, for reading flat files, the tidyverse includes:

  • readxl for .xls and .xlsx sheets.
  • feather, for sharing with Python and other languages.
  • haven for SPSS, Stata, and SAS data.
  • jsonlite for JSON.
  • xml2 for XML.
  • httr for web APIs.
  • rvest for web scraping.
  • DBI for relational databases.

Wrangle

As well as tidyr, and dplyr, there are five packages designed to work with specific types of data:

  • stringr for strings.
  • lubridate for dates and date-times.
  • forcats for categorical variables (factors).
  • hms for time-of-day values.
  • blob for storing blob (binary) data.

Program

除了purrr处理函数式编程外,还有三个解决常规编程的包

  • rlang 提供了R的核心语言和tidyverse的工具
  • magrittr 管道函数
  • glue 提供了base::paste()的更加丰富的版本

Model

  • modelr, for modelling within a pipeline
  • broom, for turning models into tidy data

tibble

tibble 重塑了data.frame,可存储任意类型,包括list,tbl_df 等。

tibble()永远不会改变输入的类型(例如它永远不会将字符串转换为因子),永远不会改变变量的名称,并且它永远不会创建row.names()

创建tibble

`as_tibble(x)` #从现有对象创建
`tibble() `    #使用列向量创建
`tribble()`    #逐行布局生成

# 示例
as_tibble(iris)

tibble(x = runif(10), y = x * 2)
tibble(x =list(1,2), y = tibble("a","b"))

tribble(~colA,~colB, 
        "a",  1,
        "b",  2)
取子集 说明
[ 返回data.frame
[[, $ 返回子向量

函数

函数 说明
is_tibble(x) 判断
增加行/列
add_column(.data, …, .before = NULL, .after = NULL) 将列添加到数据框
add_row(.data, …, .before = NULL, .after = NULL) 将行添加到数据框
用于处理行名的工具
has_rownames(df)
remove_rownames(df)
rownames_to_column(df, var = “rowname”)
rowid_to_column(df, var = “rowid”)
column_to_rownames(df, var = “rowname”
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

R手册(Common)--tidyverse+tibble 的相关文章

  • R手册(Tidy+Transform)--tidyr

    文章目录 Reshape Data Split or Unit Cells Handle Missing Values tidyr Easily tidy data with spread and gather functions Resh
  • R手册(Tidy+Transform)--缺失处理(naniar and simputation)

    文章目录 naniar 缺失数据摘要 阴影矩阵 可视化缺失值变量分布关系 simputation make imputation simpler for missing data 缺失值是指粗糙数据中由于缺少信息而造成的数据的聚类 分组 删
  • R手册(Parallel Computing)--foreach

    R手册 Parallel Computing foreach foreach foreach 后端支持 library doParallel 为foreah包提供一个并行的后端 n cores lt detectCores logical
  • R手册(Tidy+Transform)--forcats

    forcats 分类变量数据处理 forcats for factor 函数 说明 factor x levels labels ordered as factor x fct expand f 添加更多级别 fct explicit na
  • R手册(Machine Learning)--mlr (Part 2)

    文章目录 Configuration 配置 Parallelization 并行 Imputation 插补 Feature Extraction 特征提取 1 Feature filtering 特征筛选 2 Feature select
  • R手册(Common)--R语言入门

    说明 本节中大部分内容摘自书籍 R语言实战 第2版 文章目录 RStudio Take control of your R code 数据处理一般流程 R 数据结构 R 运算符 概率函数 控制语句与循环语句 自定义函数 调试 拟合线性模型f
  • R手册(Import)--rvest

    文章目录 解析html 提取组件 提取 修改和提交形式的函数 浏览网站 解析html 函数 说明 read html x encoding x为a url或 a local path html nodes x css xpath 通过使用
  • R手册(Common)--tidyverse+tibble

    tidyverse是一系列包的组合 构建了一套完整的数据分析生态链 提供了一套整洁的数据导入 分析和建模方法 刷新了R语言原有的数据科学体系 文章目录 tidyverse Usage core tidyverse packages Impo
  • R手册(Common)--面向对象(R6 and S4)

    R 主要面向统计计算 似乎很少会用到面向对象的编程方法 但在统计计算中 在下列情形中使用面向对象的编程方法可以编程更有效率 文章目录 面向对象R6类 面向对象S4类 自定义S4类 实例化函数 S4的泛型函数 面向对象R6类 R 的面向对象
  • R手册(Visualise)--geomnet(ggplot2 extensions)

    文章目录 geomnet 返回ggplot2扩展主目录 geomnet Geom 网格图 关系图 geom net aes from id to id fontsize data stat net position identity na
  • R手册(Visualise)--ggplot2

    文章目录 Overview Geoms 基本图形 单变量 双变量 三变量 文本 误差可视化 地图 Stats Scales 常用标尺格式 坐标轴标尺 Color and fill scales Shape and size scales C
  • R手册(Common)--R语言基础包

    文章目录 环境设置 输入输出 文件操作 进度条 数据创建 数据选取及数据信息 列联表 内置常量 数学 矩阵运算 模型 其他函数 R语言基础包 base stats 环境设置 系统函数 函数 说明 options 显示或设置当前选项 digi
  • R手册(NLP)--wordcloud2

    文章目录 wordlcoud2函数 letterCloud函数 shiny支持 wordcloud2 R interface to wordcloud for data visualization Wordcloud2主要包括两个函数 wo
  • R手册(Syntax)--magrittr

    magrittr pipe lhs gt rhs forward pipe lhs为rhs第一个参数时 x gt f y 等价于 f x y lhs在任意位置时 用点 代替 z gt f x y arg 等价于 f x y arg z rh
  • R手册(Time Series)--forecast and prophet

    文章目录 forecast for Time Series and Linear Models 时间序列分析 模型 预测 ggplot2扩展 模型评估 prophet 构建模型 模型预测 可视化 交叉验证 时间序列分析 Time Serie
  • R手册(NLP)--text2vec

    文章目录 分词器 I O 处理 迭代器 支持 create 函数 向量化 主题模型 text2vec 这个 R 包提供了高性能和简洁的 API 来进行文本分析 自然语言处理 分词器 word tokenizer strings 英语分词器
  • R手册(Common)--data.table

    R语言data table包是自带包data frame的升级版 用于数据框格式数据的处理 最大的特点快 包括两个方面 一方面是写的快 代码简洁 只要一行命令就可以完成诸多任务 另一方面是处理快 内部处理的步骤进行了程序上的优化 使用多线程
  • R手册(Communicate)--R Markdown

    文章目录 Overview Rmd Structure YAML Header Parameters Set render options with YAML 初始文档信息 Text Embed code with knitr syntax
  • R手册(Visualise)--gganimate(ggplot2 extensions)

    文章目录 gganimate Create easy animations with ggplot2 返回ggplot2扩展主目录 gganimate Create easy animations with ggplot2 GitHub链接
  • R手册(Visualise)--GGally(ggplot2 extensions)

    本站已停止更新 查看最新内容请移至本人博客 Wilen s Blog 文章目录 GGally ggmatrix ggplot2矩阵 ggpairs ggplot2广义配对图 ggscatmat 纯粹定量变量的传统散点图矩阵 返回ggplot

随机推荐

  • python 运行中 Error 解决方法汇总

    大家在运行python过程中想必都遇见过此类情况 好了 话不多说 言归正传 各类ERROR出现情况总结 SyntaxError 括号没有成对出现时 使用 或者 自增自减操作符时 使用Python关键字作为变量名时 引号没有成对出现时 误将
  • 【ES】索引创建,为“非查询字段”不建索引 index store

    目录 创建索引 PUT 索引的名字 mappings properties xxx1属性 type 该属性的类型 xxx2属性 type 该属性的类型 ES客户端 PUT 索引的名字 Linux
  • Unity3d Ugui 5 Text

    Character 字符 1 Font 字体 2 Font Style 1 Normal 正常 2 Bold 粗体 3 Italic 斜体 4 Bold And Italic 粗体 斜体 3 Font Size 字体大小 4 Line Sp
  • train.Saver() restory Key not found in checkpoint

    加上tf reset default graph 在最前面就解决了 saver import tensorflow as tf tf reset default graph v1 tf get variable v1 shape 3 ini
  • 如何对Element组件的样式进行自定义修改

    如何对Element 组件的样式进行自定义修改 前言 举例项目 主要代码 效果 一 定位需要修改的样式 二 使用全局样式的修改方法 代码如下 三 使用局部样式的修改方法 代码如下 前言 在项目开发过程中我们常常需要借助第三方组件库 而ele
  • Java经典面试题整理及答案详解(一)

    简介 面试题包括java集类和设计模式 spring工作原理 动态代理 事务的控制等方面 码住 我们能赢 Java在编程语言中 占据着重要的地位 随着技术的更新与发展 越来越多的人进入互联网行业 踏上Java编程之旅 本系列内容来源于阿里云
  • leedcode

    本节只写自己做的leedcode 只是用来当笔记 里面记录的方法有自己想的 也有来自各位大神的思路 1 重建二叉树 输入某二叉树的前序遍历和中序遍历的结果 请重建该二叉树 假设输入的前序遍历和中序遍历的结果中都不含重复的数字 例如 给出 前
  • 【华为OD机试】比赛【C++ Java Python】

    题目描述 一个有N个选手参加比赛 选手编号为1 N 3 lt N lt 100 有M 3 lt M lt 10 个评委对选手进行打分 打分规则为每个评委对选手打分 最高分10分 最低分1分 请计算得分最多的3位选手的编号 如果得分相同 则得
  • 三点“揭露”内向技术人如何做好分享?

    引言 内向的人不适合做分享 似乎有这么一个想法根植在所有人的心底 特别对于程序员这个群体 内向的人更加多了 毕竟 不内向谁当程序员呢 我当时选择程序员这个职业 就是因为不太喜欢和人打交道 但是经过这些年的实践 我逐渐发现 内向的人如果能充分
  • Windows软件:如何安装ideaIU-2020.3.3并使用无限重置插件达到永久使用

    前言 在我们做SpringBoot Java项目时 一个好的开发工具可以让我们的效率达到事半功倍 早期的eclipse已经无法满足我们日常需求 当然idea集成开发工具在很早前就已经进入市场 如今取得了无法撼动的地位 首居Java开发工具第
  • Redis学习笔记(三)——事务控制及Jedis使用

    又是一个新的周末 上周由于周末睡过头了 Redis的学习进度也慢了不少 这篇内容本该是上周应该发布的 晚了一些哈哈 这篇文章我会学习一下Redis的事务控制 可能对于初学的小伙伴来说事务控制比较难以理解 我的语言也不是很精炼 但还是希望对小
  • Mybatis学习——使用Limit分页

    Limit分页 SQL语句 语法 SELECT FROM table LIMIT stratIndex pageSize SELECT FROM table LIMIT 5 10 检索记录行 6 15 为了检索从某一个偏移量到记录集的结束所
  • NDK编译时报错: Android NDK: NDK Application 'local' targets unknown ABI(s): arm64-v8a x86_64

    网上下了一个github项目 NDK编译时报错 Android NDK NDK Application local targets unknown ABI s arm64 v8a x86 64 Android NDK Please fix
  • Intellij IDEA设置HTTP Proxy

    Intellij IDEA设置HTTP Proxy MAC版 打开Appearance Behavior gt System Settings gt Http Proxy 点选 Auto detect proxy settings gt A
  • Apache Hive+Kerberos安装配置及 Kettle(Pentaho)访问带 Kerberos 认证的 Hive的集成

    目录 1 连接 2 KDC 安装 2 1 安装 Kerberos 服务 2 2 配置 var kerberos krb5kdc kdc conf 2 3 配置 var kerberos krb5kdc kadm5 acl 2 4 配置 et
  • Java从后台重定向(redirect)到另一个项目的方法

    1 通过ModelAndView跳转 RequestMapping alipayforward public ModelAndView alipayforward HttpServletRequest req HttpServletResp
  • uview基本配置,在HubildX中如何配置uni-app相关的组件

    配置步骤 1 引入uView主JS库 在项目根目录中的main js中 引入并使用uView的JS库 注意这两行要放在import Vue之后 main js import uView from uview ui Vue use uView
  • 重心坐标

    数学中 重心坐标是由单形 如三角形或四面体等 顶点定义的坐标 重心坐标是齐次坐标的一种 设 v1 vn 是向量空间 V 中一个单形的顶点 如果 V 中某点 p 满足 那么我们称系数 1 n 是 p 关于 v1 vn 的重心坐标 这些顶点自己
  • utf-8 中的一个汉字占几个字节

    原文链接 http blog csdn net chummyhe89 article details 7777613 占 2 个字节的 占 3 个字节的 基本等同于 GBK 含 21000 多个汉字 占 4 个字节的 中日韩超大字符集里面的
  • R手册(Common)--tidyverse+tibble

    tidyverse是一系列包的组合 构建了一套完整的数据分析生态链 提供了一套整洁的数据导入 分析和建模方法 刷新了R语言原有的数据科学体系 文章目录 tidyverse Usage core tidyverse packages Impo