R Tidytext 和 unnest_tokens 错误

2024-06-21

对 R 非常陌生，已经开始使用 tidytext 包。

我正在尝试使用参数来填充unnest_tokens函数，这样我就可以进行多列分析。所以而不是这个

library(janeaustenr)
library(tidytext)
library(dplyr)
library(stringr)

original_books <- austen_books() %>%
  group_by(book) %>%
  mutate(linenumber = row_number(),
         chapter = cumsum(str_detect(text, regex("^chapter [\\divxlc]",
                                                 ignore_case = TRUE)))) %>%
  ungroup()

original_books

tidy_books <- original_books %>%
              unnest_tokens(word, text)

最后一行代码是：

output<- 'word'
input<- 'text'

tidy_books <- original_books %>%
              unnest_tokens(output, input)

但我得到这个：

check_input(x) 中的错误：输入必须是任意长度的字符向量或字符列表向量，每个向量的长度为 1。

我尝试过使用as.character()没有太多运气。

关于这将如何运作有什么想法吗？

Try

tidy_books <- original_books %>% 
              unnest_tokens_(output, input)

与下划线unnest_tokens_.

unnest_tokens_是“标准评估”版本unnest_tokens，并允许您将变量名称作为字符串传递。看非标评价 https://cran.r-project.org/web/packages/dplyr/vignettes/nse.html讨论标准与非标准评估。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

textmining

R Tidytext 和 unnest_tokens 错误的相关文章

绘图不适合 R 窗口

我正在使用metaR 中的包对比例进行荟萃分析我的分析中有大约一百项研究当我打字时forest result 创建我的森林图它可以工作但图形在顶部和底部被切掉无论我做什么它都不适合绘图窗口我对如何解决这个问题感到困惑有任何想
零膨胀泊松分布的经验和理论分布图

以下是我正在研究的一种数据集 data lt c 0 1 0 11 2 0 3 0 0 2 1 3 1 0 1 0 0 0 2 3 0 0 0 8 1 1 1 0 1 1 2 7 0 0 0 5 2 3 6 1 1 5 2 9 0 0 1
R：使用 dcast 时包含没有条目的因子

我在数据帧上使用 reshape2 函数 dcast 其中一个变量是某些级别未出现在数据框中的因素但我会将所有值包含在创建的新列中例如假设我运行以下命令 library reshape2 dataDF lt data frame id
是否可以使用像“tz=NULL”这样的东西？...“as.POSIXct”默认为依赖于语言环境的时区（与“as.Date”不同），这会导致问题

我知道这是一个长期存在根深蒂固的问题但这是我经常遇到的问题而且我看到初学者R经常与此斗争我希望有一个令人满意的解决方案到目前为止我的谷歌和 SO 搜索都是空的但如果在其他地方重复请指出正确的方向 TL DR 有没有办法使用类
有没有办法将字母扩展到超过 26 个字符，例如 AA、AB、AC...？

我大部分时间都使用字母来表示我的因素但今天我尝试超过 26 个字符 LETTERS 1 32 期待有自动递归因式分解 AA AB AC 但很失望这只是字母的限制还是有办法使用其他函数来获取我正在寻找的内容 702够吗 LETTERS70
不同的分位数：箱线图与小提琴图

require ggplot2 require cowplot d iris ggplot2 ggplot d aes factor 0 Sepal Length geom violin fill black alpha 0 2 draw
在 RStudio 控制台中显示西里尔字母

我在 Rstudio 控制台中显示俄语字符时遇到问题我使用 readxl 包加载带有俄语的 Excel 文件西里尔字母在数据框中正确显示但是如果我运行一个输出包含变量名称的函数 RStudio 控制台将显示符号而不是正确的西里尔字符
使用 dplyr 和 ggplot 绘制包括负值的多面水平发散堆积条形图

我希望这个例子能够让人清楚我想要堆叠条形其中中间条形跨越 0 因为它代表中性值这与李克特量表一起使用为了重现性我使用钻石数据集以下示例与我的用例足够接近并演示了我很难以正确的顺序获取好或正数据因此中性最接近 0 这是
哪种 LaTeX 包与 knit 一起使用以获得更多的表格控制？禁忌？

我正在用 knitr 写一张更长的桌子xtable和tabular environment longtable 在 longtable 包中时print将它们纳入我的 Rnw file 问题是我对longtable环境控制不够我有一些文本
两个闪亮的操作按钮

我正在编写一个闪亮的函数其中包含两个操作按钮这两个按钮是左右按钮单击时可以帮助绘图移动第一次单击时这两个按钮都工作正常当我重新单击它们时就会出现问题无论我单击哪个按钮它都会在两个范围之间来回弹跳我猜可能是右和左按
R Plotly 禁用图例单击和图例双击

我想使用 R Plotly 从服务器端禁用绘图图例选择我们看here https community plot ly t disable legend click functionality hiding traces 1345 2可以使
如何在闪亮的应用程序中显示矩阵，并用条件指定颜色？

我有一个具有正值和负值的矩阵 M 我正在尝试使用 DT 包在闪亮的应用程序中显示为表格我想用不同的颜色显示矩阵红色的正数和负数例如到目前为止我只能以一对一的方式添加颜色但我想以这种方式添加颜色如果matrix values g
将 R 传单地图保存为 html：不包括图块

我正在尝试使用 saveWidget 或将 rmd 文件输出到 html 来保存 R 传单地图如下所述将传单输出保存为 html https stackoverflow com questions 30110377 saving lea
R：使用 as.formula 修复模型中的模型调用

我有一个gls模型其中我将公式来自另一个对象分配给模型 equation lt as formula aic obj row model gt equation temp avg I year 1950 mod1 lt gls equ
如何重试错误语句？

如果某个语句出错我如何简单地告诉 R 重试该语句几次例如我希望做类似的事情 tryCatch dbGetQuery Query database error function e if is locking error e If da
如何在shell脚本中运行R代码？

我有一个 R 文件 myfile R 我想使用 shell 脚本来运行它我怎样才能做到这一点我试过这个 bin bash Rscript myfile R 但它给了我这个错误 Rscript 找不到命令我也尝试过这个 bin bash
将英寸高度的字符向量转换为厘米？

我得到一个字符向量 tibble H c 6 2 5 10 5 5 5 1 5 5 5 4 我想将其转换为厘米请告知我该怎么做有几种方法可以使用 1 阅读与fread粘贴到单个字符串后 library data table fread
如何将变量传递给 ddply 中的自定义函数？

考虑以下数据 d data frame experiment as factor c foo foo foo bar bar si runif 5 ti runif 5 我想进行相关性测试si and ti 对于每个experiment因素
动态显示仪表板页面

我有一个实用的闪亮应用程序它使用shinydashboard包裹新功能需要特定于用户的行为例如针对不同的用户名使用不同的数据集因此我打算显示登录表单验证凭据并设置反应值LoggedIn to true如果成功的话显示实际情况
修改x轴刻度标签

我正在尝试更改由生成的箱线图的 x 轴刻度标签ggplot2 x 轴是一个分类变量 HabFac 我想要的是将其刻度更改为 6 个化学品 A E 下面是我的代码 raw data read table Read data p TT ggpl

随机推荐

使用 Jersey Client 忽略自签名 ssl 证书 [重复]

这个问题在这里已经有答案了我正在使用 Jersey 客户端库对 jboss 上运行的其余服务运行测试我使用自签名证书在服务器上正确设置了 https 在本地主机上运行但是每当我使用 https url 运行测试时都会收到以下错误
如何可靠地判断 boost 线程是否已退出其 run 方法？

我以为 joinable 会表明这一点但事实似乎并非如此在工人阶级中我试图表明它仍在通过谓词进行处理 bool isRunning return thread gt joinable 已经退出的线程不是不能加入吗我错过了什么 boo
图算法：邻接图的可达性

我有一个依赖图我将其表示为Map
在 Java 中跨平台地播种随机生成器，无需时间

我几乎同时在两个线程上初始化两个随机数生成器并且我希望这两个生成器的行为完全不同我会打电话Random nextInt 7 经常一个接一个地在两台发电机上运行使用System currentTimeMillis 这不是一个好主意因为
在 git svn fetch 期间解压树对象时发生致命错误

当运行 get svn fetch 从上游 svn 存储库提取最新的新分支时我收到此错误 git svn fetch fatal failed to unpack tree object 5ecb324e8b8fcb918acb253f3
使用 Clang 将 C++ 转换为 C 代码

我知道llvm可用于将c 转换为c代码我想知道是否clang可以做同样的事情看成clang源自llvm 那么我可以使用clang将c 代码转换为c代码如果你想知道我为什么要这样做这是我的场景 PIC是一家微控制器制造商不生产C 编
无法让 DelTree 删除 Inno Setup 中的文件夹

我有一个程序DeleteTransferFolder在安装过程中使用 Inno Setup 中的 BeforeInstall 调用它我知道该过程被调用因为我显示了几条 MsgBox 消息但DelTree不会删除指定的文件夹和子文件夹
不明白这个 haskell 代码中的内容

我有一些 Haskell 代码我正在尝试完成它但我不明白其中发生了什么 type Bag a a gt Int emptyB Bag a emptyB e gt 0 countB Eq a gt Bag a gt a gt Int co
IIS / .Net 只允许对给定用户会话进行单个并发响应

这是我的问题我们有一个 Net 4 5 Web 表单应用程序由于服务器端的大量数据访问和操作应用程序中的某些页面需要很长时间才能加载如果用户在页面完成加载之前关闭浏览器选项卡然后打开新选项卡则新选项卡中对应用程序的任何请求都将挂
jQuery $(ui.draggable).remove() 不适用于 IE

我可以让 IE 删除对象只要它不是当前的可拖动对象这适用于 Chrome 和 Firefox 我做错了什么吗 ul li class dropme One li li class dropme Two li ul div div
如何解锁和锁定 Excel 单元格以运行宏

我有一个电子表格有两个按钮从数据库检索记录另一个按钮用于将更改从 Excel 上传到数据库从数据库检索记录的宏如下现在在检索记录后我希望用户仅编辑某些列此处为从一月到场景的列以便用户在更新这些单元格后可以单击更新按钮将更改
Big Query - 将数组/json 对象转置为列

这个问题是这两个问题的延续 Bigquery 将数组转置为列 https stackoverflow com q 64346504 7463780 大查询将特定字段转置为列 https stackoverflow com q 643983
如何更改VSCode集成终端中文本的字体颜色？

我想轻松区分 VSCode 终端中的输入命令和终端输出因此如果我可以更改 my Macbook Air Folder myname 的颜色或字体这将非常有帮助来自互联网的示例图像在VSCode集成终端中如何做到这一点查看这两个来
带有 Null 的 Soap WSDL

我需要在函数中指定一个可为空的参数这不起作用
无法运行应用程序，gradle 给出错误：No Such Field 错误

我正在使用 Amazon Face Rekognition API 并在从相机捕获图像后将图像发送到 aws 时收到此错误 java lang NoSuchFieldError 没有类型的静态字段实例 Lorg apache http co
检索和设置 IntelliJ IDEA 插件开发的拆分窗口设置

我正在编写一个 IntelliJ IDEA 插件用于保存打开选项卡的会话称为选项卡会话 https github com alp82 idea tabsession 这个问题是后续问题IntelliJ IDEA 插件开发保存选项卡组
Oracle 中仅在一列上不同

我想在下表中使用不同的值但仅在 PlayerID 列上使用这就是我现在所拥有的 MATCHID PLAYERID TEAMID MATCHDATE STARTDATE 20 5 2 14 JAN 12 01 JUN 11 20 5 4
如何在代码中设置TextView的文字颜色？

在 XML 中我们可以通过以下方式设置文本颜色textColor属性比如android textColor FF0000 但如何通过编码来改变它呢我尝试过类似的东西 holder text setTextColor R color R
Java 多头中的斐波那契计算显示负值

我的斐波那契计算器工作正常但当数字增加时结果会出现负值就像它是一个Integer超过其最大值它正在使用缓存java util Map
R Tidytext 和 unnest_tokens 错误

对 R 非常陌生已经开始使用 tidytext 包我正在尝试使用参数来填充unnest tokens函数这样我就可以进行多列分析所以而不是这个 library janeaustenr library tidytext library

R Tidytext 和 unnest_tokens 错误

R Tidytext 和 unnest_tokens 错误 的相关文章

随机推荐

热门标签

R Tidytext 和 unnest_tokens 错误的相关文章