我是一个困惑的语言学家,试图使用 R 从 Twitter 收集数据。
我一直在使用 twitteR 包,它在固定字符串上运行得很好,但我想要求它获取包含“querendo + 不定式动词”的推文。在葡萄牙语中,不定式动词总是以字符“r”结尾。如何查询以特定字符结尾的单词?
searchtwitteR(" ", n = 1000, lang = pt, locate = Brazil)
有很多方法可以做到这一点。考虑words
作为向量
words <- c('rock', 'tempr', 'infinitr', 'end', 'twitter')
在基数 R 中:
1)使用endsWith
words[endsWith(words, 'r')]
#[1] "tempr" "infinitr" "twitter"
2)使用grep
grep('r$', words, value = TRUE)
3) grepl
words[grepl('r$', words)]
Using stringr
:
library(stringr)
1) str_detect
words[str_detect(words, 'r$')]
2) str_subset
str_subset(words, 'r$')
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)