R语言中的函数5:purrr:map()

2023-11-07

前言

**map()**类函数在很大程度上替代了循环的作用,并且计算中利用的多线程并行计算,多使用不但可以提高计算效率还可以让代码更加整洁。

map(.x,.f,…),map2(.x,.y,.f,…),pmap(.I,.f,…)

  • x,y这里可以是atomic vector(向量或矩阵)或是list(列表,数据框),长度要相等。
  • map(x, f),map2(x,y,f),pmap(I,f)返回的是一个和x有同样长度的list.
  • map2()中变量长度必须相同,这点没有python灵活。
  • 在pmap()函数中,I是一个list, f是个多元函数每次从list的每个原子中选一个对象进行计算。
  • f 是一个函数,或者是一个公式例如: ~ x + 2
  • …表示.f所需的参数。

数据准备

library(purrr)
fun=function(x){x+1}
funxy=function(x,y){x-y}
x=c(1,5,8,9)
X=list(1,2,6,5)
y=c(8,4,6,2)
z=c(1,4,8,6)

map()测试

x是vector的情况:

res=map(x,fun);res
# [[1]]
# [1] 2
# 
# [[2]]
# [1] 6
# 
# [[3]]
# [1] 9
# 
# [[4]]
# [1] 10

x包含list的情况:

res=map(X,fun);res
# [[1]]
# [1] 2
# 
# [[2]]
# [1] 3
# 
# [[3]]
# [1] 7
# 
# [[4]]
# [1] 6

map2()测试

res=map2(x,y,funxy);res
# [[1]]
# [1] -7
# 
# [[2]]
# [1] 1
# 
# [[3]]
# [1] 2
# 
# [[4]]
# [1] 7

如果被映射变量长度不同就会报错:

y2=c(8,4)
res=map2(x,y2,funxy);res
# 错误: Mapped vectors must have consistent lengths:
#   * `.x` has length 4
#   * `.y` has length 2

list与vector混合的情况:

res=map2(X,y,funxy);res
# [[1]]
# [1] -7
# 
# [[2]]
# [1] -2
# 
# [[3]]
# [1] 0
# 
# [[4]]
# [1] 3

pmap()测试

funxyz=function(x,y,z){x+y+z}
I=list(X,y,z)
res=pmap(I,funxyz);res
# [[1]]
# [1] 10
# 
# [[2]]
# [1] 10
# 
# [[3]]
# [1] 20
# 
# [[4]]
# [1] 13

map_lgl(),map2_lgl(),pma_lgl()

返回逻辑向量

library(purrr)
fun=function(x){x>1}
funxy=function(x,y){x>y}
funxyz=function(x,y,z){x>y-z}
y=c(8,4,6,2)
x=c(1,5,8,9)
z=c(9,5,4,6)
mydata=data.frame(x,y,z)


res=map_lgl(x,fun);res
#[1] FALSE  TRUE  TRUE  TRUE

res=map2_lgl(x,y,funxy);res
#[1] FALSE  TRUE  TRUE  TRUE

res=pmap_lgl(mydata,funxyz);res
# [1] TRUE TRUE TRUE TRUE

map_chr(), map2_chr(), pmap_chr(),

返回字符串向量

library(purrr)
fun=function(x){as.character(x)}
funxy=function(x,y){paste0(as.character(x),as.character(y))}
funxyz=function(x,y,z){paste0(as.character(x),as.character(y),as.character(z))}
y=c(8,4,6,2)
x=c(1,5,8,9)
z=c(9,5,4,6)
mydata=data.frame(x,y,z)


res=map_chr(x,fun);res
# "1" "5" "8" "9"

res=map2_chr(x,y,funxy);res
# "18" "54" "86" "92"

res=pmap_chr(mydata,funxyz);res
# "189" "545" "864" "926"

map_dbl(),map2_dbl(),pmap_dbl()

返回的是一个双精度向量

library(purrr)
fun=function(x){x+0.11}
funxy=function(x,y){x-y+0.69}
funxyz=function(x,y,z){x-y-z-0.554}
y=c(8,4,6,2)
x=c(1,5,8,9)
z=c(9,5,4,6)
mydata=data.frame(x,y,z)


res=map_dbl(x,fun);res
# [1] 1.11 5.11 8.11 9.11

res=map2_dbl(x,y,funxy);res
# [1] -6.31  1.69  2.69  7.69

res=pmap_dbl(mydata,funxyz);res
# [1] -16.554  -4.554  -2.554   0.446

map_dfr(), map2_dfr(), pmap_dfr()

返回一个dataframe, 是由每个f(x)输出rbind后的结果,因此也需要f的返回是一个dataframe。

 library(purrr)
fun=function(x){data.frame(var1=x+0.11,var2=x)}
funxy=function(x,y){data.frame(var1=x-y+0.69,var2=x)}
funxyz=function(x,y,z){data.frame(var1=x-y-z-0.554,var2=x+y+z)}
y=c(8,4,6,2)
x=c(1,5,8,9)
z=c(9,5,4,6)
mydata=data.frame(x,y,z)


res=map_dfr(x,fun);res
# var1 var2
# 1 1.11    1
# 2 5.11    5
# 3 8.11    8
# 4 9.11    9

res=map2_dfr(x,y,funxy);res
# var1 var2
# 1 -6.31    1
# 2  1.69    5
# 3  2.69    8
# 4  7.69    9

res=pmap_dfr(mydata,funxyz);res
# var1 var2
# 1 -16.554   18
# 2  -4.554   14
# 3  -2.554   18
# 4   0.446   17

map_dfc(), map2_dfc(), pmap_dfc()

返回一个dataframe, 是由每个f(x)输出cbind后的结果,因此也需要f的返回是一个可以被cbind的输出。

library(purrr)
fun=function(x){data.frame(var1=x+0.11,var2=x)}
funxy=function(x,y){c(x-y+0.69,x)}
funxyz=function(x,y,z){data.frame(var1=x-y-z-0.554,var2=x+y+z)}
y=c(8,4,6,2)
x=c(1,5,8,9)
z=c(9,5,4,6)
mydata=data.frame(x,y,z)


res=map_dfc(x,fun);res
# var1 var2 var11 var21 var12 var22 var13 var23
# 1 1.11    1  5.11     5  8.11     8  9.11     9

res=map2_dfc(x,y,funxy);res
# # A tibble: 2 x 4
# V1    V2    V3    V4
# <dbl> <dbl> <dbl> <dbl>
#   1 -6.31  1.69  2.69  7.69
#   2  1     5     8     9   

res=pmap_dfc(mydata,funxyz);res
# var1 var2  var11 var21  var12 var22 var13 var23
# 1 -16.554   18 -4.554    14 -2.554    18 0.446    17

map_if(.x,.p,.f,.else),map_at(.at.x,.p,.f,.else)

这里.p是判断函数,.f是判断为真的执行语句,.else是判断为假的执行语句,.at可以是字符串或者数值索引,表示对.x中这些对象起作用。注意这里的作用单元是list或vector中的每个原子,而非横向地从每个原子中取元素执行。

library(purrr)
fun=function(x){sum(x)>8}
x=c(1,5,8,9)
y=c(9,8,5,3)
z=c(-1,-2,5,3)
mydata=data.frame(x=x,y=y,z=z)
res=map_if(.x=x,.p=fun,.f=~'right',.else=~'wrong');res
# [[1]]
# [1] "wrong"
# 
# [[2]]
# [1] "right"
# 
# [[3]]
# [1] "right"
# 
# [[4]]
# [1] "right"

res=map_if(.x=mydata,.p=fun,.f=sum,.else=~'wrong');res
# $x
# [1] 23
# 
# $y
# [1] 20
# 
# $z
# [1] "wrong"



res=map_at(.at=2:3,.x=x,.p=fun,.f=~'right',.else=~'wrong');res
# [[1]]
# [1] 1
# 
# [[2]]
# [1] "right"
# 
# [[3]]
# [1] "right"
# 
# [[4]]
# [1] 9


res=map_at(.at=2:3,.x=mydata,.p=fun,.f=~'right',.else=~'wrong');res
# $x
# [1] 1 5 8 9
# 
# $y
# [1] "right"
# 
# $z
# [1] "right"

说明文档中的一些例子

1:10 %>%
  map(rnorm, n = 10) %>%
  map_dbl(mean)

# Or use an anonymous function
1:10 %>%
  map(function(x) rnorm(10, x))

# Or a formula
1:10 %>%
  map(~ rnorm(10, .x))



# Using set_names() with character vectors is handy to keep track
# of the original inputs:
set_names(c("foo", "bar")) %>% map_chr(paste0, ":suffix")





# Supply multiple values to index deeply into a list
l2 <- list(
  list(num = 1:3,     letters[1:3]),
  list(num = 101:103, letters[4:6]),
  list()
)
l2 %>% map(c(2, 2))






# A more realistic example: split a data frame into pieces, fit a
# model to each piece, summarise and extract R^2
mtcars %>%
  split(.$cyl) %>%
  map(~ lm(mpg ~ wt, data = .x)) %>%
  map(summary) %>%
  map_dbl("r.squared")





# If each element of the output is a data frame, use
# map_dfr to row-bind them together:
mtcars %>%
  split(.$cyl) %>%
  map(~ lm(mpg ~ wt, data = .x)) %>%
  map_dfr(~ as.data.frame(t(as.matrix(coef(.)))))
# (if you also want to preserve the variable names see
# the broom package)
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

R语言中的函数5:purrr:map() 的相关文章

随机推荐

  • 实战wxPython:051- 自定义控件

    前面系列文章中 我们介绍了wxPython提供各种的各种控件 在一般情况下可以满足我们开发应用的各种需求 但是在一些情况下 比如对按钮的美化 一个可以显示CPU占用率的控件等等 这首就需要自定义的控件 才能满足要求 自定义控件可以通过两种方
  • Postgresql 学习记录,模式,分区表,触发器,事务,窗口函数,视图,建表,约束等

    Postgresql 学习记录 模式 分区表 触发器 事务 窗口函数 视图 建表 约束等 PostgreSQL使用一种客户端 服务器的模型 一次PostgreSQL会话由下列相关的进程 程序 组成 一个服务器进程 它管理数据库文件 接受来自
  • 将word文档转换为图片格式的PDF

    0x00 前言 编写一篇文档后 往往会通过转为pdf版本后发布来避免在不同环境下格式出现混乱的情况 但这样操作转出pdf文档可以通过普通的pdf阅读器进行文本的抓取 不能达到我们想要保护知识产权的想法 因此在这里推出一篇如何将word文档转
  • 设计模式之(二)---代理模式Proxy Pattern

    什么是代理模式呢 我很忙 忙的没空理你 那你要找我呢就先找我的代理人吧 那代理人总要知道 被代理人能做哪些事情不能做哪些事情吧 那就是两个人具备同一个接口 代理人虽然不能干活 但是被 代理的人能干活呀 比如西门庆找潘金莲 那潘金莲不好意思答
  • 前端优化-WEB综合

    开启 gzip 压缩 gzip 是 GNUzip 的缩写 最早用于 UNIX 系统的文件压缩 HTTP 协议上的 gzip 编码是一种用来改进 web 应用程序性能的技术 web 服务器和客户端 浏览器 必须共同支持 gzip 目前主流的浏
  • object...args参数

    Java object args参数 Java反射中用到方法public Object newInstance String className Object args 该方法中使用了object args参数 也可以写成object ar
  • 认清现实重新理解游戏的本质

    认清现实重新理解游戏的本质 OVERVIEW 认清现实重新理解游戏的本质 现实 两条小路的启发 四个动机 1 当前的学习任务或工作任务太艰巨 2 完美主义 3 对未来太过于自信 无知 4 大脑小看未来的收益 四个方法 1 让未来的收益足够巨
  • R语言 时间序列ARIMA模型方法

    原理什么的百度一搜一堆 看不明白 先学会用这个工具吧 ARIMA 全称为自回归积分滑动平均模型 Autoregressive Integrated Moving Average Model 简记ARIMA 是由博克思 Box 和詹金斯 Je
  • 使用git提交代码到gerrit

    系统 Linux 需要安装 git 第一步 cd mkdir learn git cd learn git 注意 下面的用户名和邮箱和gerrit网站的账号一定要相同 git config global user name 用户名 git
  • python爬取百度使用kw关键字爬取时出现,百度安全验证,解决方法

    python爬取百度使用kw关键字爬取时出现 百度安全验证 解决方法 之前爬取百度用kw时的代码 没有任何问题 import requests url http www baidu com s headers User Agent Mozi
  • 工具类用于ajax使用json请求时返回一个json

    package com noe utils import java util HashMap 工具类 封装响应内容 会被转成json响应 MyStatus ok gt new MyStatus 0 gt code 0 new MyStatu
  • Jenkins部署及代码静态检查工具Checkstyle集成

    CheckStyle是SourceForge下的一个项目 提供了一个帮助JAVA开发人员遵守某些编码规范的工具 接下来给大家讲下如何在jenkins 我是在tomcat下安装的jenkins 集成checkstyle 构建项目并发送邮件 一
  • Face Alignment / Human Pose Estimation [CVPR‘23, ECCV‘22, NeurIPS‘22]

    CVPR 23 accepted paper list Facial Landmark Face Alignment 论文较少 CVPR 23 3篇 值得关注的子领域 Synthetic Data STAR Loss Reducing Se
  • Service层有多个查询,若依(ruoyi)分页失灵?如何解决呢?

    Service层有多个查询 若依分页失灵 教你如何解决 情景一 当Service层只有一个查询时 若需要分页 只需要在Controller层做以下操作 添加继承BaseController中的startPage 和getDataTable
  • Linux共享内存的查看和删除

    使用的总结 1 共享内存查看 命令 ipcs m Shared Memory Segments key shmid owner perms bytes nattch status 0x00000000 1867776 root 600 39
  • linux ikev1切换到ikev2,IKEv2与IKEv1的差异.doc

    IKEv2与IKEv1的差异 IKEv2与IKEv1的差异IKEv2与IKEv1的差异 摘自RFC4306 附录 A 1 To define the entire IKE protocol in a single document repl
  • 教你动手移植RT-Thread到国产MCU

    摘要 现在芯片价格不断上涨 国内很多厂商也在不断的找替换方案 以ST为例 一个芯片涨了十几倍 蛋疼 最近刚好有机会拿到国产芯片MCU 兆易创新的评估板 GD32350R 板载资源如下 硬件 描述 芯片型号 GD32F350R8T6 CPU
  • AD出Gerber,keepout 不显示(无数据、无外形层)

    AD出Gerber keepout 不显示 无数据 无外形层 版本 16 右键选中keepout 点击 Find Similar Objects 下一步 作如下红框内选择 如图勾选选中板框对象 点击 确定 下一步 先点击变为 True 然后
  • oauth2授权码模式遇到的坑,1.走网关无法返回授权码 2.refresh_token新token丢失用户信息

    主要有2个坑 1 通过网关访问 oauth authorize的时候 无法跳转到redirect uri返回授权码 2 访问 oauth token 刷新token的时候 新的token解析后用户信息丢失 用户信息变成了用户名 问题一 通过
  • R语言中的函数5:purrr:map()

    文章目录 前言 map x f map2 x y f pmap I f 数据准备 map 测试 map2 测试 pmap 测试 map lgl map2 lgl pma lgl map chr map2 chr pmap chr map d