R手册(Tidy+Transform)--tidyr

2023-10-26


tidyr: Easily tidy data with spread and gather functions.

Reshape Data

  • gather将多列聚集成键值对(key-value pairs) (reshap2::melt)
    gather(data,key, value, ..., na.rm = FALSE, convert = FALSE,factor_key = FALSE)

参数:
key, value: 要聚合成的新key,value列的名字
… : 要gather的列名. (选择x到z的所有列 x:z, 除了y -y

  • spread 将key扩展成多列,value为要显示的值 (reshap2::dcast)
    spread(data, key, value, fill = NA , drop = TRUE,sep = NULL)

说明:

  1. 若行和key组成的索引不唯一,报错
  2. sep: If NULL, 列名为变量key的值. If non-NULL, 列名为 <key_name><sep><key_value>

Split or Unit Cells

separate(data, col, into, sep, remove = TRUE)  #单列分割成多列
separate_rows(data, ..., sep = "[^[:alnum:].]+", convert = FALSE)  #当列分裂成多行
unite(data,col,sep =”_”,remove = TRUE)  #多列联合成单列

# 示例
table3 %>% 
  separate(rate, into = c("cases", "population"), convert = TRUE)

Handle Missing Values

replace_na(data, replace = list() )
drop_na(data)
fill(data, ..., .direction = c("down", "up")) 
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

R手册(Tidy+Transform)--tidyr 的相关文章

  • R手册(Tidy+Transform)--tidyr

    文章目录 Reshape Data Split or Unit Cells Handle Missing Values tidyr Easily tidy data with spread and gather functions Resh
  • R手册(Tidy+Transform)--缺失处理(naniar and simputation)

    文章目录 naniar 缺失数据摘要 阴影矩阵 可视化缺失值变量分布关系 simputation make imputation simpler for missing data 缺失值是指粗糙数据中由于缺少信息而造成的数据的聚类 分组 删
  • R手册(Parallel Computing)--foreach

    R手册 Parallel Computing foreach foreach foreach 后端支持 library doParallel 为foreah包提供一个并行的后端 n cores lt detectCores logical
  • R手册(Tidy+Transform)--forcats

    forcats 分类变量数据处理 forcats for factor 函数 说明 factor x levels labels ordered as factor x fct expand f 添加更多级别 fct explicit na
  • R手册(Machine Learning)--mlr (Part 2)

    文章目录 Configuration 配置 Parallelization 并行 Imputation 插补 Feature Extraction 特征提取 1 Feature filtering 特征筛选 2 Feature select
  • R手册(Common)--R语言入门

    说明 本节中大部分内容摘自书籍 R语言实战 第2版 文章目录 RStudio Take control of your R code 数据处理一般流程 R 数据结构 R 运算符 概率函数 控制语句与循环语句 自定义函数 调试 拟合线性模型f
  • R手册(Import)--rvest

    文章目录 解析html 提取组件 提取 修改和提交形式的函数 浏览网站 解析html 函数 说明 read html x encoding x为a url或 a local path html nodes x css xpath 通过使用
  • R手册(Common)--tidyverse+tibble

    tidyverse是一系列包的组合 构建了一套完整的数据分析生态链 提供了一套整洁的数据导入 分析和建模方法 刷新了R语言原有的数据科学体系 文章目录 tidyverse Usage core tidyverse packages Impo
  • R手册(Common)--面向对象(R6 and S4)

    R 主要面向统计计算 似乎很少会用到面向对象的编程方法 但在统计计算中 在下列情形中使用面向对象的编程方法可以编程更有效率 文章目录 面向对象R6类 面向对象S4类 自定义S4类 实例化函数 S4的泛型函数 面向对象R6类 R 的面向对象
  • R手册(Visualise)--geomnet(ggplot2 extensions)

    文章目录 geomnet 返回ggplot2扩展主目录 geomnet Geom 网格图 关系图 geom net aes from id to id fontsize data stat net position identity na
  • R手册(Visualise)--ggplot2

    文章目录 Overview Geoms 基本图形 单变量 双变量 三变量 文本 误差可视化 地图 Stats Scales 常用标尺格式 坐标轴标尺 Color and fill scales Shape and size scales C
  • R手册(Common)--R语言基础包

    文章目录 环境设置 输入输出 文件操作 进度条 数据创建 数据选取及数据信息 列联表 内置常量 数学 矩阵运算 模型 其他函数 R语言基础包 base stats 环境设置 系统函数 函数 说明 options 显示或设置当前选项 digi
  • R手册(NLP)--wordcloud2

    文章目录 wordlcoud2函数 letterCloud函数 shiny支持 wordcloud2 R interface to wordcloud for data visualization Wordcloud2主要包括两个函数 wo
  • R手册(Syntax)--magrittr

    magrittr pipe lhs gt rhs forward pipe lhs为rhs第一个参数时 x gt f y 等价于 f x y lhs在任意位置时 用点 代替 z gt f x y arg 等价于 f x y arg z rh
  • R手册(Time Series)--forecast and prophet

    文章目录 forecast for Time Series and Linear Models 时间序列分析 模型 预测 ggplot2扩展 模型评估 prophet 构建模型 模型预测 可视化 交叉验证 时间序列分析 Time Serie
  • R手册(NLP)--text2vec

    文章目录 分词器 I O 处理 迭代器 支持 create 函数 向量化 主题模型 text2vec 这个 R 包提供了高性能和简洁的 API 来进行文本分析 自然语言处理 分词器 word tokenizer strings 英语分词器
  • R手册(Common)--data.table

    R语言data table包是自带包data frame的升级版 用于数据框格式数据的处理 最大的特点快 包括两个方面 一方面是写的快 代码简洁 只要一行命令就可以完成诸多任务 另一方面是处理快 内部处理的步骤进行了程序上的优化 使用多线程
  • R手册(Communicate)--R Markdown

    文章目录 Overview Rmd Structure YAML Header Parameters Set render options with YAML 初始文档信息 Text Embed code with knitr syntax
  • R手册(Visualise)--gganimate(ggplot2 extensions)

    文章目录 gganimate Create easy animations with ggplot2 返回ggplot2扩展主目录 gganimate Create easy animations with ggplot2 GitHub链接
  • R手册(Visualise)--GGally(ggplot2 extensions)

    本站已停止更新 查看最新内容请移至本人博客 Wilen s Blog 文章目录 GGally ggmatrix ggplot2矩阵 ggpairs ggplot2广义配对图 ggscatmat 纯粹定量变量的传统散点图矩阵 返回ggplot

随机推荐

  • 2021年全国职业院校技能大赛 “大数据技术与应用”—模拟赛题(一)

    2021年全国职业院校技能大赛 大数据技术与应用 模拟赛题 一 文章适合了解大数据技术与应用技能大赛 赛题 文章在编写过程中难免有疏漏和错误 欢迎大佬指出文章的不足之处 更多内容请点进 Lino White 查看 未来的世界充满着各式各样的
  • vscode的“安装”、“软件中文化”、“代码格式化”和“前端边编程边看到效果”的过程设置方法

    本文主要用来对vscode进行基础设置 通篇看起来偏过程化 最好从头到尾一步一步跟着设置 目录 一 安装vscode 二 安装 Chinese 插件 使软件中文化 三 安装软件主题 使软件界面个性化 四 将一个文件目录作为项目目录打开 五
  • Matlab:尝试将 SCRIPT XXX 作为函数执行的解决方案

    Matlab 尝试将 SCRIPT XXX 作为函数执行的解决方案 最近在做图像处理小实验的过程中遇到了无比沙雕的情况 被自己佛了 最近真的智商不在线 或者没在线过 先描述一下问题 在Matlab中调用直方图均衡化函数histeq 但是出现
  • 进程、线程相关基础理论总结

    进程 线程相关基础理论 一 进程与线程的区别 1 进程是指一个程序在计算机中的一次运行 它是资源分配的最小单位 2 线程是进程中调度执行的最小单位 3 进程有独立的内存空间 线程没有独立的内存空间 它必须运行在进程中 4 线程之间通信更方便
  • Runnable可以实现资源共享但Thread不能实现资源共享的原因

    转自 http blog csdn net javaniceyou article details 6859305 线程的两种实现方式 通过实现Runnable接口的线程方式可以实现资源的共享 而继承Thread则不可以 原因何在 先看下面
  • 华为OD2023(A卷)基础题37【工单调度策略】

    工单调度策略 题目描述 当小区通信设备上报警时 系统会自动生成待处理的工单 工单调度系统需要根据不同的策略 调度外线工程师 FME 上站去修复工单对应的问题 根据与运营商签订的合同 不同严重程度的工单被处理并修复的时长要求不同 这个要求被修
  • Android OpenGL 纹理绘制图像---Native实现

    本文纹理贴图的native实现 是指指定纹理的功能放在了native中实现 其他流程和Java实现类似 在这里就不赘述了 再回头看一下指定纹理数据的方法 void glTexImage2D GLenum target GLint level
  • 剑指 Offer 29. 顺时针打印矩阵

    顺时针打印矩阵 顺时针打印矩阵 思路 题解 JAVA判断二维数组是否空 左 下 右 上四条变上的循环 思路 参考视频 题解 注意边界条件 JAVA判断二维数组是否空 1 二维数组首地址是否为空 即array null 2 二维数组是否为 即
  • 命令行svn commit时注释实现换行

    svn ci m 11111 其中 111111 就是你填写的注释 如果你想换行写 也是可以的 只要你不写后面的那个引号 你可以写一行就回车一次 最后写完了 再加上后面的引号 然后再回车 就执行提交动作了 svn ci m 11111 gt
  • flutter简单的本地草稿箱功能

    需求1 发帖退出时提示是否保存草稿 需求2 每条草稿中可以保存多张图片 最多9张 或一条视频及三十来个其它参数 需求3 每条草稿都是可以被覆盖的 可以点击删除 需求4 草稿页面可以一键清空 需求5 草稿随app删除一起没掉 看到需求第一时间
  • 剑指 Offer 04. 二维数组中的查找

    题目链接 04 二维数组中的查找 思路分析 利用右上角的数来判断减少判断行数 如果右上角的数大于target那么该列都大于 所以j 如果小于target那么改行都小于 所以i class Solution public bool findN
  • MFC之模态非模态与自定义对话框16

    1 模态非模态对话框 由于我们这里使用按下菜单栏的选项弹出对话框 所以放在框架类中使用 注意 按下选项可以使用左键按下事件或者选项对应的处理事件 我们使用后者 这点需要区分好 1 先在菜单栏添加对话框的选项 2 在资源视图添加对话框 3 添
  • 语义分割的基本网络结构

    1 编码器 编码器通常可以理解为一些列对应的卷积模块 通常由卷积层 池化层以及BN层 卷积层负责获取图像特征 池化层对图像进行下采样并且将尺度不变特征传送到下一层 而BN主要对训练图像的分布归一化 加速学习 可以理解为编码器是用来进行特征提
  • BSC链节点搭建

    BSC 节点同步教程 准备步骤 安装go环境包 GO下载地址 https golang org doc install wget c https golang org dl go1 16 3 linux amd64 tar gz O sud
  • elasticjob启动报错KeeperErrorCode = OperationTimeout

    elasticjob报错 Caused by com dangdang ddframe job reg exception RegException org apache zookeeper KeeperException Operatio
  • 在学习DNS的过程中给我的启发

    在学习DNS的过程中给我的启发 在国内 关于DNS相关的话题一直络绎不绝 比如DNS根服务器为什么中国没有 还有Anycast BGP实现负载 为什么DNS只有13个 还有DNS over HTTPS 和 DNS over TLS的优劣等等
  • 使用SqlBulkCopy大批量导入数据

    实际的开发可能会遇到数据大批量插入数据的问题 若是一条条的循环倒数效率非常低下 这个较好的解决方案 1 2 protected void Button1 Click object sender EventArgs e 3 4 5 DateT
  • android 使用SurfaceFlinger 服务的流程分析,基于4.4(三)----图像的输出过程

    经过前面两篇的介绍 现在可以分析surfaceflinger 的处理UI buffer的流程了 目录 一 onMessageReceived 1 handleMessageTransaction 2 handleMessageInvalid
  • 百度飞桨(厦门)人工智能产业赋能中心签约,共创人工智能产业协同服务新生态...

    9月8日 第二十三届中国国际投资贸易洽谈会在厦门正式开幕 当日 厦门市思明区政府和火炬管委会 与百度正式签约 联手共建百度飞桨 厦门 人工智能产业赋能中心 思明区委书记林重阳 厦门市工信局副局长 大数据局长许文恭 厦门市科技局副局长黄颖 火
  • R手册(Tidy+Transform)--tidyr

    文章目录 Reshape Data Split or Unit Cells Handle Missing Values tidyr Easily tidy data with spread and gather functions Resh