在全球范围内,我有兴趣从 R 文档中获取所有文本数据,将它们放入数据框架中并应用文本挖掘技术。
- 包级别:假设我对一个包感兴趣,例如“utils”,并且我想获取向量中的所有文本数据。
这有效:
package_d <- packageDescription("utils")
package_d$Description
但不是这个:package_d$Details
-
功能级别:同样的问题,但功能不同。我尝试了这个但没有成功:
function_d <- ?utils::adist
function_d$Description
子级别:我想提取特定包的函数的所有详细信息、参数描述和值......
非常感谢您的帮助 !
我找不到内置函数,但查看完成大部分工作的函数的源代码,这里有一个可以从帮助页面提取文本的函数。
help_text <- function(...) {
file <- help(...)
path <- dirname(file)
dirpath <- dirname(path)
pkgname <- basename(dirpath)
RdDB <- file.path(path, pkgname)
rd <- tools:::fetchRdDB(RdDB, basename(file))
capture.output(tools::Rd2txt(rd, out="", options=list(underline_titles=FALSE)))
}
您可以将其与包帮助页面和函数帮助页面一起使用。
h1 <- help_text(utils)
h2 <- help_text(adist)
您将从帮助页面获得行数组。您可以使用以下命令打印它们
cat(h1, sep="\n")
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)