从列表创建虚拟变量

2024-04-01

因此，我尝试根据框架的特定列是否包含特定单词来创建虚拟变量以附加到数据框架。该列看起来像这样：

 dumcol = c("good night moon", "good night room", "good morning room", "hello moon")

我将根据每行中包含的单词创建虚拟变量，例如对于第一个，它包含"good", "night", and "moon"，但不是"room", "morning" or "hello".

到目前为止，我一直在以一种非常原始的方式进行处理，即创建一个适当大小的 0 值矩阵，然后使用 for 循环，如下所示：

result=matrix(ncol=6,nrow=4)
wordlist=unique(unlist(strsplit(dumcal, " ")))
for (i in 1:6)
{ result[grep(wordlist[i], dumcol),i] = 1 }

或类似的东西。我猜想有一种更快/更高效的方法来做到这一点。有什么建议吗？

你可以尝试：

library(tm)
myCorpus <- Corpus(VectorSource(dumcol))
myTDM <- TermDocumentMatrix(myCorpus, control = list(minWordLength = 1))
as.matrix(myTDM)

这使：

#         Docs
#Terms     1 2 3 4
#  good    1 1 1 0
#  hello   0 0 0 1
#  moon    1 0 0 1
#  morning 0 0 1 0
#  night   1 1 0 0
#  room    0 1 1 0

如果您想要列中的虚拟变量，您可以使用DocumentTermMatrix反而：

#    Terms
#Docs good hello moon morning night room
#   1    1     0    1       0     1    0
#   2    1     0    0       0     1    1
#   3    1     0    0       1     0    1
#   4    0     1    1       0     0    0

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

dummydata

从列表创建虚拟变量的相关文章

删除字符串末尾的句点和数字

如何删除尾随句点后面紧跟一个数字长度为一位或两位数字例子 z lt c awe p 56 red 45 ted 5 you 88 tom 我只想删除 45和 5 你只需要一个简单的正则表达式 z new gsub 0 9 z 一些评论
对 data.table 中的列表列执行操作

假设我有一个data table 例如dt lt data table foo list 1 3 4 6 bar c 2 7 如何使用 dt 框架对 foo 向量列表执行操作操作可能是将 bar 添加到 foo 返回列表 3 5 11 1
R 将多个值与向量进行比较并返回向量[重复]

这个问题在这里已经有答案了我有一个向量 A 对于 A 的每个元素我想检查它是否等于第二个向量 Targets 中的任何元素我想要一个逻辑值向量其长度为 A 作为返回也提到了同样的问题here http r 789695 n4 na
跟踪循环迭代

抛硬币成功你赢100 否则你输50 你会一直玩直到你口袋里有钱a 的价值如何a在任何迭代中都被存储 a lt 100 while a gt 0 if rbinom 1 1 0 5 1 a lt a 100 else a lt a 50
使用字符串中的变量名称访问变量值，R

Intro 一个数据集有大量的age year变量 age 1990 age 1991 etc 我有一个字符串值数组length age years 表示这些变量使得age years 1 回报 age 1990 etc Need 我想搜
从 n,k 维矩阵数组中减去 n,k 维矩阵

如果我有一个数组A A lt array 0 c 4 3 5 for i in 1 5 set seed i A i lt matrix rnorm 12 4 3 如果我有矩阵 B set seed 6 B lt matrix rnorm
为什么数据帧上的 is.vector 不返回 TRUE？

tl dr R 中的向量到底是什么长版 R 中很多东西都是向量例如数字是长度为 1 的数值向量 is vector 1 1 TRUE 列表也是一个向量 is vector list 1 1 TRUE 好的所以列表是一个向量显然数
R 可以创建带有可单击条形图的条形图图像以插入网页吗？

我知道如何创建条形图以及如何将其粘贴在网页上例如使用hwriteImage in the 作家包 http www embl de gpau hwriter 我想要的是每个栏都是一个在鼠标悬停时突出显示的区域并且每个栏在单击时都有不
不同编程语言中的浮点数学

我知道浮点数学充其量可能是丑陋的但我想知道是否有人可以解释以下怪癖在大多数编程语言中我测试了 0 4 到 0 2 的加法会产生轻微的错误而 0 4 0 1 0 1 则不会产生错误两者计算不平等的原因是什么在各自的编程语言中可以采
如何在 data.table 中分组后使用条件计算行数

我有以下数据框 dat lt read csv s1 s2 v1 v2 a b 10 20 a b 22 NA a b 13 33 c d 3 NA c d 4 5 NA c d 10 20 dat gt A tibble 6 x 4 gt
如何在 Shiny 中提取动态生成的输入值？

我正在创建一个闪亮的应用程序它将根据客户的不同功能为客户生成分数在我闪亮的应用程序中我提供了 checkboxGroupInput 来选择所需的功能根据所选功能应用程序将动态地将 numericInput 添加到 Web ui 以
为什么 sapply 的缩放速度比样本大小的 for 循环慢？

假设我想采用向量 X 2 1 N 并将 e 计算为每个元素的指数是的我认识到最好的方法就是通过向量化 exp X 但这样做的目的是将 for 循环与 sapply 进行比较我通过逐步尝试三种方法一种使用 for 循环两种以不同方
我可以使用哪个 R 函数来查找两条线的交点？

我刚刚研究了 stackoverflow 上所有的在 R 中寻找交集问题它们要么是关于曲线要么是关于分布像这个 https stackoverflow com questions 20519431 finding point of
如何在 R 中的 for 循环内将值存储在向量中

我正在开始使用 R 但我对以下问题感到非常沮丧我试图将 for 循环内完成的某些计算的值存储到我之前定义的向量中问题是如何进行索引因为for循环迭代代码的次数取决于用户的输入所以变量i不一定要从1开始它可以从80开始 for举个例
`as.matrix` 和 `as.data.frame` S3 方法与 S4 方法

我注意到定义as matrix or as data frame作为 S4 类的 S3 方法使例如lm formula objS4 and prcomp object 开箱即用如果它们被定义为 S4 方法则这不起作用为什么将方法定义
在 Shiny 中显示反应式 htmlTable 表格

我正在制作我的第一个 Shiny 应用程序但找不到任何有关如何显示使用 htmlTable 包创建的表格的示例我基本上想在按下按钮时创建一个表格并显示它 Shiny 显示 html 代码而不是表格我不知道用什么替换服务器部分中的 re
R，使用具有两种以上可能性的二项式分布

我知道这可能是基本的但我似乎有一个心理障碍假设您想要计算在一个骰子上掷出 4 5 或 6 的概率在 R 中这很简单 sum 1 6 1 6 1 6 这给出了 1 2 这是正确答案然而我内心深处可能应该保留的地方认为我应该能够
在网格中制作一个矩形图例，并标记行和列

我有一个 ggplot 我将因子映射到填充和 alpha 如下所示 set seed 47 the data lt data frame value rpois 6 lambda 20 cat1 rep c A B each 3 cat2
从数据框中绘制多条平滑线

我对 R 比较陌生我正在尝试绘制从 csv 文件加载的数据框数据由 6 列组成如下所示 xval col1 col2 col3 col4 col5 第一列 xval 由一系列单调递增的正整数例如 10 40 60 等组成其他列
如何为自定义 S3 类实现提取/取子集 ([ [<-, [[ [[<-)] 函数？

我有一个自定义的 S3 类foo 它在正常的基础上添加了一些自定义行为data frame foo object lt data frame class foo object lt c foo data frame 对于这个类还应该有一个

随机推荐

group by 和 group concat ，不使用main pk优化mysql查询

我的例子是 MYSQL 版本是 5 6 34 日志 Problem摘要以下查询需要40秒订单商品 table has 758423 records And PAYMENT table has 177272 records And 提交条目
LINQ to Entities 不支持 LINQ 表达式节点类型“ArrayIndex”

public List
选项卡更改时刷新/重新加载 MUI WPF 页面

我正在使用 WPF 的 Modern UI 开发桌面应用程序当我转到新标签页时我尝试刷新我的标签页但我做不到当我使用选项卡控制器转到另一个页面时我想刷新我的 MUI WPF 选项卡页面谁能帮我我不太清楚你的意思到底是什么但是
将字符串中保存的数字中的每个数字转换为 int 数组

我正在 DFA 上编写这个项目我想将保存为字符串的整数的每个数字保存并转换为 int 数组这是负责此操作的函数的代码 int l final states size int temp final temp final new int l
覆盖 Rails 中的 MIME 类型

我想将 Rails 中的 JSON MIME 类型 application json 覆盖为 text x json 我尝试在 mime types rb 中再次注册 MIME 类型但这不起作用有什么建议么 Thanks 这应该可以工作
c2512 错误：没有合适的默认构造函数可用

即使我声明了构造函数我也遇到了 c2512 错误我的代码是这样的在我的 first h 文件中我将其声明为 class myClass public tmpM cv Mat model 然后在我的 first cpp 中我做了 in
从 Word OLE 应用程序对象获取应用程序标题

有没有办法从 Word Application OLE 对象获取窗口标题我想用它来尝试使用窗口FindWindow 我正在创建一个 OLE 对象并添加一个现有文档如下所示 App CreateOLEObject Word Applica
Java - 如何限制特定方法的方法调用

我有一个特殊的要求我需要确保只允许一个类中的特定方法调用第二个类中的公共非静态方法不能使用继承一种选择是使用 StackTrace 如下所示 A类 java package org rnd stack public class C
.ToTitleCase 不适用于所有大写字符串

Public Function TitleCase ByVal strIn As String Dim result As String Dim culture As New CultureInfo en False Dim tInfo A
将 std::wstring 从 Visual Studio 移植到 mingw gcc

我正在将一些代码从 Visual Studio 移植到 mingw gcc 我看到了这个声明 if mnode GetTag T val return true 这是 GetTag 方法的定义 const std wstring GetTa
Python 多处理与多线程相结合

我不确定我想做的是否是有效的做法但事情是这样的我需要我的程序高度并行化所以我想我可以创建 2 3 个进程每个进程可以有 2 3 个线程 1 这可能吗 2 这有什么意义吗 3 这是我的代码但当我尝试加入进程时它会挂起 PQ mult
如何在 React-Navigation/Drawer 6 中实现“返回”

我在 React navigation drawer 6 中实现 goBack 功能时遇到问题 react navigation drawer 6 1 4 准确地说我能够使用以下代码在react navigation drawer 5中完
解析 JSON 数据以将其显示在 gridview 中

我创建了一个应用程序它将数据从 URL 解析为 JSON 对象并将其显示在GridView 虽然没有显示错误但每次运行应用程序时都会收到消息不幸的是应用程序已停止运行这是我的申请文件 MainActivity java packag
将 HttpResponse 转换为 .apk 文件

问题是这样的我与某个 url 建立互联网连接并收到带有 app example apk 的 HttpResponse 然后我想创建一个文件 apk 在带有此数据的 SD 卡中以便此下载的应用程序可以稍后安装如何将 HttpRespo
如何在样式表中使用非标准自定义字体？

我有一个PyQt4由外部设计的应用程序 qss使用以下代码创建文件 app QtGui QApplication sys argv stylesheet open mystylesheet qss read app setStyleShee
使用 pyspark 使用嵌套结构 ArrayType 展平数据框

我有一个具有此架构的数据框 root AUTHOR ID integer nullable false NAME string nullable true Books array nullable false element struct
Project.json 定义 dnx451 与 .dotnet ( 4.51)

我有一些在 asp vnext 中我可以定义 3 种类型的运行时 dnxCore dnx451 dotnet 在 Project json 中它看起来像这样 frameworks dotnet dnx451 dnxcore50 用户界面
如何使用 Java 创建 TensorProto for TensorFlow？

现在我们使用tensorflow serving进行推理它公开了 gRPC 服务我们可以从 proto 文件生成 Java 类现在我们可以生成PreditionService from https github com tensorf
如何在 Angular 中包含 JavaScript 脚本文件并从该脚本调用函数？

我有一个名为的 JavaScript 文件abc js有一个名为公共的函数xyz 我想在我的 Angular 项目中调用该函数我怎么做参考里面的脚本angular cli json angular json当使用 Angular 6
从列表创建虚拟变量

因此我尝试根据框架的特定列是否包含特定单词来创建虚拟变量以附加到数据框架该列看起来像这样 dumcol c good night moon good night room good morning room hello moon 我将根

从列表创建虚拟变量

从列表创建虚拟变量 的相关文章

随机推荐

热门标签

从列表创建虚拟变量的相关文章