将语料库转换为R中的data.frame

2024-04-03

我正在使用 tm 包来应用词干提取，并且需要将结果数据转换为数据框。可以在这里找到解决方案R tm包vcorpus：将语料库转换为数据帧时出错 https://stackoverflow.com/questions/24703920/r-tm-package-vcorpus-corpus-to-dataframe，但就我而言，我的语料库内容为：

[[2195]]
i was very impress

代替

[[2195]]
"i was very impress"

正因为如此，如果我申请

data.frame(text=unlist(sapply(mycorpus, `[`, "content")), stringsAsFactors=FALSE)

结果将是

<NA>.

任何帮助深表感谢！

下面以代码为例：

sentence <- c("a small thread was loose on the sandals, otherwise it looked good")
mycorpus <- Corpus(VectorSource(sentence))
mycorpus <- tm_map(mycorpus, stemDocument, language = "english")

inspect(mycorpus)

[[1]]
a small thread was loo on the sandals, otherwi it look good

data.frame(text=unlist(sapply(mycorpus, `[`, "content")), stringsAsFactors=FALSE)

 text
1 <NA>

通过应用

gsub("http\\w+", "", mycorpus)

输出具有 class = 字符，因此它适用于我的情况。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

DataFrame

tm

corpus

将语料库转换为R中的data.frame 的相关文章

rpart“as.character(x) 中的错误：无法强制类型 'builtin' 为类型 'character' 的向量”消息是什么意思？

我一直在用头撞rpart几天了尝试为我拥有的这个数据集制作分类树我认为现在是时候询问生命线了我确信这是我没有看到的愚蠢的事情但这里是我一直在做什么 EuropeWater lt read csv file paste Users a
如何在 R 中合并同名列表中的数据框？

我有一个包含很多数据框的列表如果它们具有相同的名称我想合并它们即合并所有具有相同名称 a 和 b 的数据框像这样 a lt aaaaa b lt bbbbb c lt ccccc g lt list df1 lt data fram
使用 R 下载压缩数据文件、提取和导入数据

EZGraphs 在 Twitter 上写道很多在线 csv 都被压缩了有没有办法下载解压缩存档并使用 R 将数据加载到 data frame Rstats 我今天也尝试这样做但最终只是手动下载 zip 文件我尝试过类似的东西 f
R 中两个时间戳之间的左连接

我的目标是执行左连接intervals哪里的bike id比赛和created at时间戳在records在之间start and end in the intervals table gt class records 1 data ta
R 闪亮仪表板中的动态重复条件面板

我正在尝试创建一个动态条件面板所以我的条件如下在用户界面中输入 selectInput inpt Input Number seq 1 50 1 selectize FALSE 我的条件面板 UI 输入是 conditionalPane
不同编程语言中的浮点数学

我知道浮点数学充其量可能是丑陋的但我想知道是否有人可以解释以下怪癖在大多数编程语言中我测试了 0 4 到 0 2 的加法会产生轻微的错误而 0 4 0 1 0 1 则不会产生错误两者计算不平等的原因是什么在各自的编程语言中可以采
需要在R中按行绑定列表数据

我在 R 中按行绑定列表时遇到问题我的列表数据集是 id 1 data k 1 id k b c 1 1 1 3 data k 2 id k b c 1 2 1 4 id 2 data k 1 id k b c 2 1 1 6 data
如何在 data.table 中分组后使用条件计算行数

我有以下数据框 dat lt read csv s1 s2 v1 v2 a b 10 20 a b 22 NA a b 13 33 c d 3 NA c d 4 5 NA c d 10 20 dat gt A tibble 6 x 4 gt
在R中循环子文件夹

我正在 R 环境中包含多个子文件夹的文件夹中工作我想要循环遍历多个子文件夹然后在每个子文件夹中调用 R 脚本来执行我想出了下面的代码但我的代码似乎添加了到子文件夹列表我收到错误文件中的错误文件名 r 编码编码无效的描述
将列表中的每个元素转换为数据框中的一列

假设我有以下列表 d library combinat d permn c a b c 这看起来如下 1 1 a b c 2 1 a c b 3 1 c a b 4 1 c b a 5 1 b c a 6 1 b a c 是否可以将此列表的
多个动态滤镜更新闪亮

我希望能够让 UI 输入闪亮并根据用户之前的选择进行自我更新因此在下面的示例中预期的行为是用户选择cyl vsor carb那么这将过滤数据集mtcars用于创建绘图即用户根据过滤条件调整绘图并更新其他过滤器中的剩余输入选择
如何在 R 中的 for 循环内将值存储在向量中

我正在开始使用 R 但我对以下问题感到非常沮丧我试图将 for 循环内完成的某些计算的值存储到我之前定义的向量中问题是如何进行索引因为for循环迭代代码的次数取决于用户的输入所以变量i不一定要从1开始它可以从80开始 for举个例
R ggplot 中的柯尔莫哥洛夫-斯米尔诺夫图

我正在尝试在 r 中绘制 KS 图一切似乎都很顺利除了我只能使用颜色来可视化两个不同的样本而不是线型这一事实我已经尝试过以下方法 sample1 lt SD13009 sample2 lt SD13009PB group lt c r
R，使用具有两种以上可能性的二项式分布

我知道这可能是基本的但我似乎有一个心理障碍假设您想要计算在一个骰子上掷出 4 5 或 6 的概率在 R 中这很简单 sum 1 6 1 6 1 6 这给出了 1 2 这是正确答案然而我内心深处可能应该保留的地方认为我应该能够
使用选定因子水平的值向 ggplot-barchart 添加水平线

在这个情节中 df lt data frame factor as factor c rep A 3 rep B 3 Treatment c rep c A B C 2 values runif 6 0 1 ggplot df aes Tr
如何计算数据框中按另一列的列值分组的一列的连续字符串值？

我有以下数据框 Levels Labels Confidence 0 Hands 0 8 0 Leg 0 7 0 Eye 0 9 1 Ear 0 9 1 Eye 0 8 2 Hands 0 9 2 Eye 0 8 3 Eye 0 8 我想检
将 Python Pandas DataFrame 写入 Word 文档

我正在努力创建一个使用 Pandas DataFrames 的 Python 生成的报告目前我正在使用DataFrame to string 方法但是这会作为字符串写入文件有没有办法让我实现这一目标同时将其保留为表格以便我可以使
R：按组，测试一个变量的每个值是否存在于另一个变量中

我有一个数据框架结构如下 a lt c 1 1 1 2 2 2 3 3 3 3 4 4 b lt c 1 2 3 1 2 3 1 2 3 4 1 2 c lt c NA NA 2 NA 1 1 NA NA 1 1 NA NA df lt
当将遗传算法与 lme4 一起使用时，glmulti 无限期运行

我在 R 中使用 glmulti 进行模型平均我的模型中有大约 10 个变量使得详尽的筛选不切实际因此我需要使用遗传算法 GA 调用 method g 我需要包含随机效应因此我使用 glmulti 作为 lme4 的包装器此处提供
需要在R中跳过不同数量的行

我正在使用以下代码来处理我的数据但最近我意识到使用skip 27 在数据开始之前跳过存储在我的文件中的信息不是一个好的选择因为每个文件中要跳过的行数不同我的目标是读取存储在多个文件夹中的各种txt文件并非所有文件都有相同的列数列的

随机推荐

协议中的公共默认初始化

我有这个代码 public protocol MyProtocol init public extension MyProtocol public init self init public final class MyClass MyPr
如何处理“intrin.h：没有这样的文件或目录”？

include
深层路由的 webpack HistoryApiFallback 配置

webpack dev server 可以设置为将您发送回 index html 并找到单个路由的脚本例如http localhost 4301 sdr http localhost 4301 sdr但是当您放入更深的路线或末尾带有的
Mercurial 和 Notepad++ 集成

Notepad 是否有插件可以与 Mercurial 和 TortoiseHg 集成如果将以下内容添加到我们的配置文件中您可以使用 Notepad 打开文件 tortoisehg editor
在用户交互之前，GoogleMap 不会加载详细地图

我正在 android 上编写一个应用程序它将显示谷歌地图的地图当我启动应用程序时地图以当前位置为中心当我使用animateCamera 我可以看到整个世界的放大动画直到它聚焦于当前位置问题是我需要触摸地图才能使地图以我期望的缩
将 scipy 稀疏矩阵存储为 HDF5

我想以 HDF5 格式压缩和存储一个巨大的 Scipy 矩阵我该怎么做呢我尝试过以下代码 a csr matrix dat row col shape 947969 36039 f h5py File foo h5 w dset f c
pyenv install 3.6.3 发生错误：为什么？

user syyun pyenv install 3 6 3 Downloading Python 3 6 3 tar xz gt https www python org ftp python 3 6 3 Python 3 6 3 tar
应用程序可以在通知中心同时使用警报和横幅吗？

我正在创建一个 Mac OS X 应用程序来使用通知中心一些通知应保留在屏幕上直到用户与它们交互而其他通知应在显示后不久消失 The NSUserNotificationAlertStyle键和更改系统偏好设置允许在横幅和警报之间进行
无法理解通过引用传递

我发现理解 C 中的引用传递真的很令人困惑在我的代码中我有一个带有两个参数的函数 private bool SerialUnEscape byte serialData ref byte serialResult if SerialPr
JAVA数组内不重复的随机数

我想在一个数组中生成 6 个数字同时对其进行比较这样它们就不会相同或没有重复的数字例如我想以任意顺序生成 1 2 3 4 5 6 最重要的是不重复所以我的想法是将生成的数组中的当前数组一一比较如果数字重复它将重新运行该方法并再
在 Python 中用多边形计算 Pi

我在精确计算 Pi 时遇到问题我使用的方法是我得到一个半径为 1 的圆并在其内部放置具有 8 16 32 64 角的多边形在每个步骤后将它们加倍但问题是结果只有前15位小数是正确的这是程序 import math import
如何在reason-react组件中添加版权符号？

我是理性反应新手我正在尝试将版权符号放入反应原因组件中我试过了 span ReasonReact stringToElement copy span 但这并没有给我符号简单的说 copy 如果你不放不起作用
为什么要将对象的副本作为函数的参数？为什么 const ref 不是参数的默认方式？

尽管我非常喜欢 C 编程但有一件事我确实不明白对我来说最常见的函数编程方式似乎是这样的 some function a variable do something according to the data in the variab
Xcode 10、sourcery 和 swiftlint 构建阶段顺序

更新到 Xcode 10 后初始项目配置存在一些问题步骤如下所示使用生成一些文件Sourcery https github com krzysztofzablocki Sourcery 棉绒与SwiftLint https githu
我的特殊字符在 WordPress 中显示为 ’

如何让我的特殊字符在 WordPress 上正确显示 My are being converted to 8217 所有特殊字符都会发生这种情况有什么功能或者插件可以修复吗您可以使用htmlspecialchars decode htt
Visual Studio C# 语句崩溃

当编辑很长的代码块时无论如何肯定应该重构但这超出了这个问题的范围我经常渴望能够折叠语句块就像折叠功能块一样也就是说如果减号图标出现在大括号内的所有内容的代码大纲上那就太好了它似乎出现在函数类区域命名空间使用中但不适
在中包含子包的语法是什么？

我正在使用Spring并且我有一个很长的子包列表我是否必须在包中一一指定它们
Android上批量获取大量位图资源

我有一长串图形 icon1 0 png icon1 1 png icon1 2 png icon12 0 png icon12 1 png icon12 2 png 我想将它们打包到我的android应用程序中理想情况下我认为我应该能够
如何从 C++ DLL 中的 C# 简单函数调用

我在 C 中有一个简单的函数不是类的方法 declspec dllexport extern C void stdcall TestFunc 我尝试从 C 调用它 DllImport ImportTest dll public stati
将语料库转换为R中的data.frame

我正在使用 tm 包来应用词干提取并且需要将结果数据转换为数据框可以在这里找到解决方案R tm包vcorpus 将语料库转换为数据帧时出错 https stackoverflow com questions 24703920 r tm

将语料库转换为R中的data.frame

将语料库转换为R中的data.frame 的相关文章

随机推荐

热门标签