在包中包含一个“哈希表”

2024-03-24

我正在整理一个我已经工作了近一年的包。我有一个音节查找函数所需的哈希表。哈希表实际上只是一个环境（我想我不是计算机高手），它是一个查找表。您可以在下面看到我创建它的函数。我有一个数据集DICTIONARY（约 20,000 个字）将在加载包时加载。我也这个什么DICTIONARY加载包时传递给哈希函数以创建新环境；就像是env <- hash(DICTIONARY)因为这就是我现在加载环境的方式。如何在加载包时使函数在启动时运行，以便为使用我的包的用户创建这个新环境？

hash <- function(x, type = "character") {
    e <- new.env(hash = TRUE, size = nrow(x), parent = emptyenv())
    char <- function(col) assign(col[1], as.character(col[2]), envir = e)
    num <- function(col) assign(col[1], as.numeric(col[2]), envir = e)
    FUN <- if(type=="character") char else num
    apply(x, 1, FUN)
    return(e)
}

#currently how I load the environment with the DICTIONARY lookup table
env <- hash(DICTIONARY)

这是头DICTIONARY如果有帮助：

    word syllables
1     hm         1
2    hmm         1
3   hmmm         1
4   hmph         1
5  mmhmm         2
6   mmhm         2
7     mm         1
8    mmm         1
9   mmmm         1
10   pff         1

你们中的许多人可能会想“这由用户决定是否要加载环境”。观点正确，但该软件包的目标受众是扫盲领域的人员。该领域的 R 用户并不多，因此我必须让这个东西尽可能易于使用。只是想弄清楚我为什么要这样做的哲学，这样它就不会成为争论的焦点。

先感谢您。（PS我看过这本手册（LINK http://cran.r-project.org/doc/manuals/R-exts.html#Package-structure）但似乎找不到有关此主题的任何信息）

编辑：根据安德烈的建议，我认为会是这样的？但我不确定。此加载是否会在包中的所有其他函数和数据集加载之后加载？这个东西让我有点困惑。

.onLoad <- function(){
   env <- hash(DICTIONARY)
}

如果哈希值很少更改（从问题描述来看似乎是这种情况），则将哈希值保存到包源树中：

save(env, file="<my_pkg>/R/sysdata.rda")

安装软件包后，env将在名称空间内可用，my_pkg:::env。请参阅“编写 R 扩展”的 1.1.3 节。您可能有一个脚本，例如在“/inst/scripts/make_env.R”中创建env，并且您作为开发人员在极少数情况下使用env需要更新。

另一种可能性是哈希值发生变化，但仅在包上发生变化安装。那么解决方案是编写在包安装时评估的代码。所以在文件 /R/env.R 中写一些类似的内容

env <- local({
    localenv <- new.env(parent=emptyenv())
    ## fill up localenv, then return it
    localenv[["foo"]] = "bar"
    localenv
})

解决的可能性是.onLoad是每次加载包时数据都会发生变化，例如，因为它正在从某些在线源检索更新。

env <- new.env(parent=emptyenv())

.onLoad <- function(libname, pkgname)
{
    ## fill up env
    env[["foo"]] = "bar"
}

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

package

在包中包含一个“哈希表” 的相关文章

R 中的 huxtable 即使有选项也默认为科学记数法(scipen=999)

我试图生成像样的桌子并在过去的一周尝试了很多软件包我的头在游泳今天早上开始使用 package huxtable 并试图摆脱科学记数法 x lt mtcars 1 5 1 2 x mpg lt x mpg 10000000 get s
熊猫记忆

我有冗长的计算我重复了很多次因此我想使用记忆诸如jug http packages python org Jug and joblib http packages python org joblib memory html 与Pan
如何缩放（标准化）每列内的 ggplot2 stat_bin2d 值（按 X 轴）

我有一个 ggplot stat bin2d 热图 library ggplot2 value lt rep 1 5 1000 df lt as data frame value df group lt rep 1 7 len 5000 d
如何在r中进行左连接[重复]

这个问题在这里已经有答案了我有两个数据集一和二数据集一 a b c 111 a 1 112 b 2 113 c 3 114 d 4 115 e 5 数据集二 e d g 222 ss 11 111 ff 22 113 ww 33 114
如果指定了多个存储库，install.packages 的行为是什么？

从文档中并不清楚如果在 install packages 中指定了多个存储库会出现什么行为我的直觉告诉我它将尝试第一个存储库如果找不到包它将尝试第二个存储库依此类推不幸的是情况似乎并非如此我看到的是只尝试了第一个并返回错
使用 fread 导入数据后所有列均作为字符

我导入了一个 CSV 文件包含文本列和数字列 x lt fread myfile csv header TRUE verbose T na strings c null null 但导入后当我运行summary x 时所有列都被视为字
矩阵中两个字符串的最大 nchar

我想找到更好的方法来找到我正在相互比较的两个字符串的更大的 nchar 假设我有字符串句子匹配data frame 和我需要创建一个 max nchar string1 nchar string2 矩阵但没有 for 循环这是非常慢的方
准备编程竞赛的缩写和函数[关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心 help reopen questi
使用 ape 包在 R 中进行标签和色叶树状图（系统发育）

继上一篇文章之后 r 中的标签和彩色叶树状图 https stackoverflow com questions 18802519 label and color leaf dendrogram in r 我有一个后续问题我的问题与提到的
r testthat 和 covr 在非包库中使用

我希望能够使用testthat and covr在一个项目中not一个 r 包事实上不使用任何第三方服务只是普通的旧 r 源文件的集合我正在努力找出这是否可行如果可以则已设置有关如何设置的说明我发现假设你正在编写一个 r 包我
R源代码.调用函数[重复]

这个问题在这里已经有答案了我正在查看R中cov的source code 并遇到了一段我不太明白的代码协方差的数学定义goes http en wikipedia org wiki Covariance here if method pe
R CMD 检查警告：在文档对象中使用的函数/方法...但不在代码中

我正在写一个包但一个持久的R CMD check警告阻止我完成包裹并将其发布到 CRAN 我用roxygen2对于内联文档尽管这可能不是错误的根本原因如果您知道如何删除此警告我很可能可以找到一种方法来使用roxygen2 如何删除警
R testthat 单元测试数据和辅助函数约定

我正在编写一个 R 包并使用 testthat 进行单元测试我的许多单元测试都是为了测试适用于我的包特定对象的功能对于这些测试我创建了一个辅助函数来设置模拟对象我还有一些其他辅助函数来减少单元测试中的代码量目前这些辅助函数在我的
从频率表生成 data.frame

我在 2 4 数组中有包含 500 个观察值的合成数据 datax array c 120 181 50 43 41 33 24 8 dim c 2 4 dimnames datax list gender c male female pu
为 Linux 安装 R 包时出错

我试图在 R 3 3 上安装一个名为 rgeos 的包但是当我输入 install packages rgeos 但它返回给我以下错误其他包也会发生同样的情况但不是所有包 gt installing source package rg
R：install.packages 中出现错误：无法打开连接

我试图安装 RINDSEL 包但无法安装它并且不断收到以下错误 install packages 中出错无法打开连接我从以下位置下载了该软件包 rindsel 1 0 2 zip 综合养殖平台 http old ibpdev net
如何拆分 data.frame -> 将合并应用于子集 -> 合并到 data.frame 中

我真的不知道如何在不使用 for 循环的情况下实现这一目标 x lt c a b c d gt x 1 a b c d data lt data frame x c a b a b c a a b c d name c one one tw
在闪亮的应用程序中使用传单地图作为过滤器

是否可以使用传单地图来过滤闪亮应用程序中的数据就像在 Tableau 或 Power BI 中一样方法是单击地图上的某个状态然后根据条件过滤另一个图表或表格选择 None
为“facet_wrap”中的每列创建边框和标题

我想在每个方面周围放置带有标签和标题的黑色边框facet wrap 与此类似的东西样本数据 library tidyverse mtcars gt mutate gear factor gear levels c 4 3 5 gt ggp
替换向量中非 %in% 向量的值

简短的问题我可以像这样替换某些变量值 values lt c a b a b c a b df lt data frame values 将 df values 的所有值替换为 x 其中值是neither a 或 b 输出应该是 c a

随机推荐

未在命名空间中捕获 PDOException

我不知道怎样才能抓住PDOException在下面的代码中请告诉我下面的代码中哪里抛出异常我有目录 folder 1 b php 2 c php autoloader in the b php and in c php class c
测试“0”、“-0”、“0.0”、“00”时的 PHP 和 Perl 行为

当 PHP Perl 测试一个值时我遇到了这个有趣的行为 print 0 Yes No gt No print 00 Yes No gt Yes print 0 0 Yes No gt Yes print 0 Yes No gt Yes
为什么C#中没有反向枚举器？

有谁知道是否有特定原因或设计决定不在 C 中包含反向枚举器如果有一个与 C 相当的东西就好了reverse iterator就像 Enumerator 相当于 C 一样iterator 可以反向迭代的集合只需实现 IReverseEnum
关于如何识别右值或左值引用以及 if-it-has-a-name 规则

我正在读托马斯贝克尔的书article http thbecker net articles rvalue references section 05 html关于右值引用及其使用在那里他定义了他所说的如果它有一个名字 rule 声明为
当 ISO 年份与公历年份不同时，Python Dataframe isocalendar() 布尔条件不会产生所需的结果

令我惊讶的是当我只想要当年第一周的数据时我的简单布尔条件却产生了完整的一年结果 My code Some sample data df1 pd DataFrame 1596 1537 1482 1960 1879 1824 index
c中int (*pt)[5]的含义是什么[重复]

这个问题在这里已经有答案了我读过一些关于这种类型声明的地方声明是 int arr 5 我对这个类型声明有点困惑实际上这个声明的含义是什么以及我们什么时候使用它 int arr 5 arr是 5 个指针的数组 int arr 5 arr
组件、行为和 MonoBehaviour 之间有什么区别？为什么这些是分开的？

MonoBehaviour延伸Behaviour and Behaviour延伸Component 我想知道为什么这些类被分开以及这些类的语义含义区分这些类有什么目的吗是否有任何课程延伸Behaviour or Component直接地
Youtube Api playVideo 方法在某些移动设备上不起作用

我正在尝试创建一个移动网站点击图像后可以播放 YouTube 视频我已经在几款 Android 手机版本上进行了测试有些手机的行为与预期不符我的意思是它停止在缓冲并且永远不会播放视频我注意到的另一件事是播放器在用户触发视频播放
Eclipse GridData 的垂直滚动条

我在 Eclipse 应用程序中有以下 Java 代码 import org eclipse swt layout GridData import org eclipse swt widgets List import org eclips
如何从我的 Subversion 托管帐户创建转储文件？

我的 SVN 存储库托管在某处我想搬到别人那里去如何创建存储库的转储以便将其导入到我的新主机中这就是我一直看到的 svnadmin dump path to repos gt repos dump 我的存储库是托管的因此它不是本地的
在单独的函数中修改指向字符串文字的指针

我希望这是一个微不足道的问题有人可以用比我已经遇到的更简单的术语向我解释在工作过程中 C 之旅第二版我一直在尝试几个例子我目前正在尝试在单独的函数中修改指向字符串文字的指针我认为这很容易 using namespace std
小块饼图上的标签（ggplot）

我想用ggplot制作饼图 My data lab lt c a b c d e f g h percentage lt c 50 20 10 10 2 2 2 2 df prison lt data frame lab percentag
如何设置内联集合？

例如 DataTable table new DataTable Columns new DataColumnCollection new DataColumn col1 new DataColumn col2 你说的是集合初始化器 htt
完全用汇编语言编写操作系统有什么好处？ [关闭]

Closed 这个问题是基于意见的 help closed questions 目前不接受答案 MenuetOS http en wikipedia org wiki MenuetOS是完全用汇编编写的操作系统的示例用汇编语言编写它比用
在 Visual Basic 6 中对 Excel 工作表进行编码

我想将excelsheet1的列A的值获取到Visual Basic的某个变量中然后在更改该值后发送回下一个sheet2 这是一个完整且有效的项目示例它将值从 Sheet1 单元格 A1 复制到 Sheet2 单元格 A1 declar
C# 中的空可扩展树节点

我想在 C 中创建一个可扩展的空树节点即一个空的树节点旁边有符号原因是因为最初它是空的但是一旦单击一个节点我想用许多子节点填充它我面临的唯一问题是空树节点不可扩展所以我不知道该怎么办有没有办法解决这个问题或者有什么解决方
AF-XDP：实现共享 Umem 套接字

我想实现 XDP SHARED UMEM https www kernel org doc html latest networking af xdp html xdp shared umem bind flag https www ker
c:out 和使用 $ 打印输出之间的区别

在 JSTL 中有两种打印输出的方法 h1 h1
hh_client 报告包错误

我正在按照中的说明进行操作入门 https docs hhvm com hack getting started starting a real project在 Hacklang 官方网站上正如它所说我运行 touch hhconfi
在包中包含一个“哈希表”

我正在整理一个我已经工作了近一年的包我有一个音节查找函数所需的哈希表哈希表实际上只是一个环境我想我不是计算机高手它是一个查找表您可以在下面看到我创建它的函数我有一个数据集DICTIONARY 约 20 000 个字将在加载包时

在包中包含一个“哈希表”

在包中包含一个“哈希表” 的相关文章

随机推荐

热门标签