R手册(Common)--R语言基础包

2023-11-04


R语言基础包: base, stats

环境设置

  • 系统函数
函数 说明
options(…) 显示或设置当前选项(digits,encoding,…)
memory.limit(size=NA) 内存信息
source()/sink() 加载/输出R脚本
quit()/q() 退出R
  • packages操作函数
函数 说明
install.package(“pkg”) 安装包
devtools::install_github(“pkg”) 安装github开发版包
library(pkg, warn.conflicts = TRUE) 加载包
detach(“package:pkg”) 移除加载的包
(.packages()) 展示加载的包
installr::updateR() 更新R(复制包)
或者将老版本的R包复制到新版本后,update.packages()
help(package=”pkg”) 展示包的信息
update.packages() 更新包
remove.packages(pkgs, lib) 卸载包
if(!require(“installr”))
install.packages(‘installr’)
library(“installr”)
安装并加载

输入输出

函数 说明
edit(x),fix(x),pico(x) 输入
print(…),cat(…) 输出
save(objects,file=”.RData”) 保存
load(file)
format(x, digits) 有效数字
format(x, format = “”) 日期格式
iconv(x,encoding) 字符串编码转换

文件操作

函数 说明
system.file() 获取系统文件路径
getwd(),setwd() 获得/设置工作路径
dir.create() 创建新目录
list.files(path,pattern=NULL,
all.files = FALSE,
full.names = FALSE)
path列出文件名,pattern筛选文件
all.files是否子文件夹下的全部文件
full.names是否输出文件名包含路径全称
choose.dir(default = “”,caption) 交互式选择文件夹
choose.files(default = “”,caption,multi = TRUE, filters = Filters) 交互式选择文件,multi:复选,filters:文件过滤向量
menu(choices, graphics = FALSE, title = NULL) 菜单交互函数
winDialog(type =“yesno”,message) type in c(“ok”, “okcancel”, “yesno”, “yesnocancel”)

进度条

函数 说明
txtProgressBar(min=0,max=1,initial=0,char ="=",width=NA,style=1) 初始化文本进度条
参数: 进度最小值,最大值,初始值,文本,宽度,格式(1,2:支持换行,3:进度值)
setTxtProgressBar(pb, value) 加载进度条,value进度值
winProgressBar(title,label,min, max, initial, width) win进度条
setWinProgressBar(pb, value, title = NULL, label = NULL)
close(con,…) 关闭进度条

数据创建

函数 说明
c(…); list(…) 向量
matrix(data, nrow, ncol, byrow = FALSE,dimnames=list(rownames,colnames)) 矩阵
array(data, dim, dimnames) 数组
data.frame(col1,col2,col3,…, row.names) 数据框
factor(x, levels, labels, ordered) sex<-factor(sex,levels=c(1,2),labels=c("Male","Female"))
seq(from = 1, to = 1, by) 等差数列
rep(x,…)
rep(c("character","integer","numberic"),c(4,1,2))
times每个元素重复的次数
length.out期望长度,each

数据选取及数据信息

函数 说明
str(),summary() 概要
x[-(1:n)]
x[‘rows’,‘cols’]
索引和切片
x$name
x[x>3]
x[x %in% c(…)]
索引和切片
head(x,n),tail(x,n)
dim(x), dimnames(x), names(x) 信息
nrow(),ncol(x), length(x) 行数,列数,长度
which.max(), which.min(), which() 返回索引
cut(x,breaks,labels = NULL,right,ordered) 返回切割而后的factor
breaks切割点向量或切割间隔数,right是否右开区间,ordered是否有序

列联表

函数 说明
table(var1, var2,…,useNA=“no”) useNA in c(“no”, “ifany”, “always”)
prop.table(x, margin) 小数比例的形式
xtabs(formula=~., data) formula:var~var+var+…
左边为要透视的值(默认sum函数,左边缺失时计数),右边为列联表的维度
ftable(table) 将多维table对象转为二维table(data.frame)
xtabs(mpg+cyl~am+gear,mtcars)%>%ftable()

内置常量

函数 说明
NA,NULL 缺失值
Inf/-Inf 无穷
pi
as.roman(x) 罗马数字
month.abb, month.name 月份
letters, LETTERS 大小写字母

数学

函数 说明
ˆ, %%, %/% 求幂(**),求余数(mod),整除
sign() 提取正负(1,0,-1)
log(x, base),exp(x)
round(x, digits = 0) 四舍五入
signif(x, digits = 6) 有效数字
trunc(x) 取整
ceiling(x) 天花板
floor(x) 地板
max,min,median,mean(x,trim=0,na.rm=FALSE)
range,IQR 极差,四分位距
quantile(x, probs = seq(0, 1, 0.25)) 百分位数
abs,sqrt
sum,prod
rank(x, na.last = TRUE,ties.method = c(“average”, “first”, “last”, “random”, “max”, “min”)) na.last:NA排名处置方式
diff 差分
cum_sum 返回向量x[i]=sum{x[1]:x[i]}
cum_prod
scale(x, center = TRUE, scale = TRUE)
combn(x, m, FUN = NULL) x中m个元素的所有(统计)组合

Matrix包中的函数使得R可以处理高密度矩阵或稀疏矩阵。可以高效的访问BLAS(Basic Linear Algebra Subroutines)、Lapack(密集矩阵) 、TAUCS(稀疏矩阵)和UMFPACK(稀疏 矩阵) 。

矩阵运算

运算符或函数 描 述
+ - * / ^ 分别是逐个元素的加、减、乘、除和幂运算
A %*% B 矩阵乘法
A %o% B 外积:AB
cbind(A, B, …) 横向合并矩阵或向量
chol(A) A的Choleski分解。若R <- chol(A),那么chol(A)包含上三角因子,即R’R=A
colMeans(A) 返回A的列均值组成的向量
crossprod(A) 返回A’A
crossprod(A, B) 返回A’B
colSums(A) 返回A的列总和组成的向量
diag(A) 返回主对角元素组成的向量
diag(x) 用x中元素作为主对角元素创建对角矩阵
diag(k) 如果k是标量,就创建k × k的单位矩阵
eigen(A) A的特征值和特征向量。若y <- eigen(A),那么:
y$val是A的特征值
y$vec是A的特征向量
ginv(A) A的Moore-Penrose广义逆(需要MASS包)
qr(A) A的QR分解。若 y <- qr(A),那么: y$qr的上三角是分解结果,下三角是分解的信息
y$rank是A的秩
y$qraux是Q的附加信息向量
y$pivot是所使用的主元素选择策略
rbind(A, B, …) 纵向合并矩阵或向量
rowMeans(A) 返回A的行均值组成的向量
rowSums(A) 返回A的行总和组成的向量
solve(A, b) 求解方程b = Ax中的向量x
svd(A) A的奇异值分解。若 y <- svd(A),那么:
y$d是A的奇异值组成的向量
y$u是矩阵且每一列都是A的左奇异向量
y$v是矩阵且每一列都是A的右奇异向量
t(A) A的转置

模型

函数 说明
var,sd,cov
cor(x, y = NULL, use = “everything”,method = “pearson”) data%>%cor%>%symnum(相关系数矩阵可视化)
method in c(‘person’,‘spearman’,‘kendall’)
cor.test 相关性检验
anova 单因素方差分析
ancova 单因素协方差分析
lm/glm 线性回归
aov 方差分析模型

其他函数

函数 说明
Sys.sleep(seconds)
system.time(expr)
expression(expr) 创建表达式
eval(expr) 在指定的环境下运行表达式
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

R手册(Common)--R语言基础包 的相关文章

  • R手册(Tidy+Transform)--tidyr

    文章目录 Reshape Data Split or Unit Cells Handle Missing Values tidyr Easily tidy data with spread and gather functions Resh
  • R手册(Tidy+Transform)--缺失处理(naniar and simputation)

    文章目录 naniar 缺失数据摘要 阴影矩阵 可视化缺失值变量分布关系 simputation make imputation simpler for missing data 缺失值是指粗糙数据中由于缺少信息而造成的数据的聚类 分组 删
  • R手册(Parallel Computing)--foreach

    R手册 Parallel Computing foreach foreach foreach 后端支持 library doParallel 为foreah包提供一个并行的后端 n cores lt detectCores logical
  • R手册(Tidy+Transform)--forcats

    forcats 分类变量数据处理 forcats for factor 函数 说明 factor x levels labels ordered as factor x fct expand f 添加更多级别 fct explicit na
  • R手册(Machine Learning)--mlr (Part 2)

    文章目录 Configuration 配置 Parallelization 并行 Imputation 插补 Feature Extraction 特征提取 1 Feature filtering 特征筛选 2 Feature select
  • R手册(Common)--R语言入门

    说明 本节中大部分内容摘自书籍 R语言实战 第2版 文章目录 RStudio Take control of your R code 数据处理一般流程 R 数据结构 R 运算符 概率函数 控制语句与循环语句 自定义函数 调试 拟合线性模型f
  • R手册(Import)--rvest

    文章目录 解析html 提取组件 提取 修改和提交形式的函数 浏览网站 解析html 函数 说明 read html x encoding x为a url或 a local path html nodes x css xpath 通过使用
  • R手册(Common)--tidyverse+tibble

    tidyverse是一系列包的组合 构建了一套完整的数据分析生态链 提供了一套整洁的数据导入 分析和建模方法 刷新了R语言原有的数据科学体系 文章目录 tidyverse Usage core tidyverse packages Impo
  • R手册(Common)--面向对象(R6 and S4)

    R 主要面向统计计算 似乎很少会用到面向对象的编程方法 但在统计计算中 在下列情形中使用面向对象的编程方法可以编程更有效率 文章目录 面向对象R6类 面向对象S4类 自定义S4类 实例化函数 S4的泛型函数 面向对象R6类 R 的面向对象
  • R手册(Visualise)--geomnet(ggplot2 extensions)

    文章目录 geomnet 返回ggplot2扩展主目录 geomnet Geom 网格图 关系图 geom net aes from id to id fontsize data stat net position identity na
  • R手册(Visualise)--ggplot2

    文章目录 Overview Geoms 基本图形 单变量 双变量 三变量 文本 误差可视化 地图 Stats Scales 常用标尺格式 坐标轴标尺 Color and fill scales Shape and size scales C
  • R手册(Common)--R语言基础包

    文章目录 环境设置 输入输出 文件操作 进度条 数据创建 数据选取及数据信息 列联表 内置常量 数学 矩阵运算 模型 其他函数 R语言基础包 base stats 环境设置 系统函数 函数 说明 options 显示或设置当前选项 digi
  • R手册(NLP)--wordcloud2

    文章目录 wordlcoud2函数 letterCloud函数 shiny支持 wordcloud2 R interface to wordcloud for data visualization Wordcloud2主要包括两个函数 wo
  • R手册(Syntax)--magrittr

    magrittr pipe lhs gt rhs forward pipe lhs为rhs第一个参数时 x gt f y 等价于 f x y lhs在任意位置时 用点 代替 z gt f x y arg 等价于 f x y arg z rh
  • R手册(Time Series)--forecast and prophet

    文章目录 forecast for Time Series and Linear Models 时间序列分析 模型 预测 ggplot2扩展 模型评估 prophet 构建模型 模型预测 可视化 交叉验证 时间序列分析 Time Serie
  • R手册(NLP)--text2vec

    文章目录 分词器 I O 处理 迭代器 支持 create 函数 向量化 主题模型 text2vec 这个 R 包提供了高性能和简洁的 API 来进行文本分析 自然语言处理 分词器 word tokenizer strings 英语分词器
  • R手册(Common)--data.table

    R语言data table包是自带包data frame的升级版 用于数据框格式数据的处理 最大的特点快 包括两个方面 一方面是写的快 代码简洁 只要一行命令就可以完成诸多任务 另一方面是处理快 内部处理的步骤进行了程序上的优化 使用多线程
  • R手册(Communicate)--R Markdown

    文章目录 Overview Rmd Structure YAML Header Parameters Set render options with YAML 初始文档信息 Text Embed code with knitr syntax
  • R手册(Visualise)--gganimate(ggplot2 extensions)

    文章目录 gganimate Create easy animations with ggplot2 返回ggplot2扩展主目录 gganimate Create easy animations with ggplot2 GitHub链接
  • R手册(Visualise)--GGally(ggplot2 extensions)

    本站已停止更新 查看最新内容请移至本人博客 Wilen s Blog 文章目录 GGally ggmatrix ggplot2矩阵 ggpairs ggplot2广义配对图 ggscatmat 纯粹定量变量的传统散点图矩阵 返回ggplot

随机推荐

  • 2021年电工杯数学建模A题高铁牵引供电系统运行数据分析及等值建模求解全过程论文及程序

    2021年电工杯数学建模 A题 高铁牵引供电系统运行数据分析及等值建模 原题再现 我国是世界上电气化铁路运营里程最长 服役电力机车型号最多 运营最繁忙的国家 截至 2020 年底 我国铁路年消耗电量约 800 亿千瓦时 约占三峡年总发电量的
  • node.js详解+案例

    系列文章目录 提示 node基础 系统模块 第三方模块 node js 对数据库的操作 增删改查 使用node实现对列表简单的增删改查功能 博客项目连接数据库 博客项目前端 文章目录 系列文章目录 前言 一 node js 是什么 二 No
  • web html做菜单,Web元素设计之导航菜单

    1 横向导航菜单 导航菜单实际上相当于一个列表 自然地 我们可以选择HTML中的列表元素ul来进行实现 HTML 首页 探索 观察 解密 关于 ul本身是一个块级元素 其中包含的列表项li同样也是块级元素 所以要实现横向菜单 我们需要使用到
  • Apache-ant 使用总结

    文章目录 指定特定的 jdk 指定特定的 jdk
  • 【STM32】STM32CUBEMX + ADC(单通道,双通道DMA)

    STM32CUBEMX ADC 单通道 双通道DMA 案例应用 使用ADC采集电压 单通道 单通道 DMA 双通道 DMA 并利用串口打印采集转换后的电压值 1 工具 IAR STM32CUBEMX 开发板STM32F411VET6 预备知
  • 读取云服务器文件列表,读取云服务器文件列表

    读取云服务器文件列表 内容精选 换一换 当卸载数据盘时 支持离线或者在线卸载 即可在挂载该数据盘的云服务器处于 关机 或 运行中 状态进行卸载 弹性云服务器在线卸载磁盘 详细信息请参见在线卸载磁盘 裸金属服务器当前支持将SCSI类型磁盘挂载
  • nginx 神奇的斜线,各种斜线的搭配访问结果

    两台服务器 一台客户端 服务器B1 192 168 1 1 服务器B2 192 168 2 2 客户端C1 127 0 0 1 1 代理模式 在客户端中请求服务器B1 请求路径为 http 192 168 1 1 test api B1 配
  • 计算机条件格式设置方法,excel怎样利用条件格式把

    2013 09 08 怎么设置excel复制默认复制文本 谁知道 可以分几种情况来解决 1 如果是从文本文件复制过来 可以利用EXCEL的外部数据导入功能 点击菜单数据 导入外部数据 导入数据 在打开的对话框中 把文件类型选择为 所有文件
  • docker好难用啊!为啥说它移植性好?

    刚刚接触docker 真的好麻烦啊 不明白为什么要选择docker 我都搞了两天还在搭环境 又告诉我Windows版本过低不适配docker 转而在Ubuntu里装docker 然后MySQL php Nginx又得重新装一遍 好麻烦啊 1
  • C++基础知识 - STL(标准模板库)

    STL主要分为分为三类 algorithm 算法 对数据进行处理 解决问题 步骤的有限集合 container 容器 用来管理一组数据元素 Iterator 迭代器 可遍历STL容器内全部或部分元素 的对象 容器和算法通过迭代器可以进行无缝
  • 软件测试面试题:有验证码的功能,怎么做性能测试?

    有验证码的功能 怎么做性能测试 1 将验证码暂时屏蔽 完成性能测试后 再恢复 2 使用万能的验证码 个人简介 我是一名测试兼开发工程师 目前25K 目前做的是无人驾驶 欢迎和大家一起交流测试技术 一起高薪就业 我们还有一起打妖怪的群哦 还有
  • hdu 1050 Moving Tables

    http acm hdu edu cn showproblem php pid 1050 简单的题目 就是求交叉的路线最多次数 注意 房间可能从大到小 也可能从小到大 1和2属于同一个 2和3也是 等等 include
  • 将桌面文件映射至E盘

    打开 计算机 gt Administrator gt 桌面 DOS添加盘符 不是真实存在的 subst H C 123subst 为创建的意思H 为盘符C 123为C盘下的文件subst H d为删除盘符H Windows7中有一个问题记录
  • linux之安装java教程,一看就会

    一 第一种 1 直接用yun安装jdk yum install java 1 8 0 openjdk x86 64 2 执行完直接直接查看版本就好了 java version 二 第二种 1 进入下载目录 cd usr local src
  • python进阶:python高级编程技巧(中)

    1 通过实例方法名字的字符串调用方法 getattr object name default None 得到一个对象中的name方法 如果没有则返回默认值 map func iterables 第一个传递函数名称 第二个传递一个可迭代的对象
  • 世界首位 AI 机器人「女老板」:24 小时待命,全年无休!

    整理 朱珂欣 出品 CSDN程序人生 ID coder life 作曲 写稿 编代码 眼看 AI 轻松胜任种种工作 如今还成了 老板 近日 波兰酒精饮料公司 Dictador 宣布 已聘请一位机器人担任 CEO 并称 这是全球公司中第一位
  • JS-----数据结构与算法(1)

    目录 一 初识数据结构与算法 1 常见的数据结构 2 算法 二 数组结构 数据类型分类 1 创建一个数组 2 数组的 length 3 数组的索引 4 数组的常用方法 数组常用方法之 push 数组常用方法之 pop 数组常用方法之 uns
  • 线程池创建线程

    定义 使用池化技术来管理和使用现成的技术 就叫做线程池 线程池的优势 总体来说 线程池有如下的优势 1 降低资源消耗 通过重复利用已创建的线程降低线程创建和销毁造成的消耗 2 提高响应速度 当任务到达时 任务可以不需要等到线程创建就能立即执
  • spring IOC 控制反转详解生命周期

    spring IOC 控制反转 通过Spring提供的IoC容器 可以将对象间的依赖关系交由Spring进行控制 避免硬编码所造成的过度程序耦合 用户也不必再为单例模式类 属性文件解析等这些很底层的需求编写代码 可以更专注于上层的应用 AO
  • R手册(Common)--R语言基础包

    文章目录 环境设置 输入输出 文件操作 进度条 数据创建 数据选取及数据信息 列联表 内置常量 数学 矩阵运算 模型 其他函数 R语言基础包 base stats 环境设置 系统函数 函数 说明 options 显示或设置当前选项 digi