在详细信息部分中有一些关于此的好信息help(data)
。这是基础知识,使用plyr以包为例。首先,让我们看看可以从以下位置获得什么:data()
.
names(data())
#[1] "title" "header" "results" "footer"
对这些元素的进一步研究将揭示其中的成分。接下来,我们可以使用参数data()
然后对结果列表进行子集化以查找包中数据集的名称。
d <- data(package = "plyr")
## names of data sets in the package
d$results[, "Item"]
# [1] "baseball" "ozone"
## assign it to use later
nm <- d$results[, "Item"]
## call the promised data
data(list = nm, package = "plyr")
## get the dimensions of each data set
lapply(mget(nm), dim)
# $baseball
# [1] 21699 22
#
# $ozone
# [1] 24 24 72
编辑/更新:如果您想查找数据集的名称all安装的软件包,您可以使用以下内容。.packages(TRUE)
给出库位置路径中可用的所有包lib.loc
。由于数据集在base and stats包已移至datasets包,我们需要通过将它们拿出来来解决这个问题setdiff()
.
## names of all packages sans base and stats
pkgs <- setdiff(.packages(TRUE), c("base", "stats"))
## get the names of all the data sets
dsets <- data(package = pkgs)$result[, "Item"]
## look at the first few in our result
head(dsets)
# [1] "AirPassengers" "BJsales" "BJsales.lead (BJsales)"
# [4] "BOD" "CO2" "ChickWeight"