我的数据框的一列包含单词和短语。我正在尝试为此列中具有特定文本字符串的字段创建一个虚拟变量。
例如:
- kite
- cars
- 箱形风筝
- 模型车
- 我喜欢飞翔的风筝
-
世界汽车
myvector<-c("kite","cars","box kites","model cars","i like kites that fly",
"cars of the world")
我想用字符串“kite”标识所有字段
我尝试过一些事情,比如any()
, which()
and %in%
但到目前为止还没有任何效果。
非常感谢任何帮助
您没有提供任何可重现的示例。但你的答案将是 grep。
grepl("kite", df$words)
如果该单词在行中,它将返回一个逻辑向量。
如果要匹配多个单词,请使用逻辑或|
在要匹配的字符串内
grepl("kite|cars|box kites", df$words)
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)