对 R 非常陌生,已经开始使用 tidytext 包。
我正在尝试使用参数来填充unnest_tokens
函数,这样我就可以进行多列分析。所以而不是这个
library(janeaustenr)
library(tidytext)
library(dplyr)
library(stringr)
original_books <- austen_books() %>%
group_by(book) %>%
mutate(linenumber = row_number(),
chapter = cumsum(str_detect(text, regex("^chapter [\\divxlc]",
ignore_case = TRUE)))) %>%
ungroup()
original_books
tidy_books <- original_books %>%
unnest_tokens(word, text)
最后一行代码是:
output<- 'word'
input<- 'text'
tidy_books <- original_books %>%
unnest_tokens(output, input)
但我得到这个:
check_input(x) 中的错误:
输入必须是任意长度的字符向量或字符列表
向量,每个向量的长度为 1。
我尝试过使用as.character()
没有太多运气。
关于这将如何运作有什么想法吗?
Try
tidy_books <- original_books %>%
unnest_tokens_(output, input)
与下划线unnest_tokens_
.
unnest_tokens_
是“标准评估”版本unnest_tokens
,并允许您将变量名称作为字符串传递。看非标评价 https://cran.r-project.org/web/packages/dplyr/vignettes/nse.html讨论标准与非标准评估。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)