ANEW 字典可以用于 Quanteda 中的情感分析吗？

2024-05-03

我正在尝试找到一种方法来实施英语单词情感规范（荷兰语），以便使用 Quanteda 进行纵向情感分析。我最终想要的是每年的“平均情绪”，以显示任何纵向趋势。

在数据集中，所有单词均由 64 名编码员按照 7 分李克特量表在四个类别上进行评分，这提供了每个单词的平均值。我想做的是采用其中一个维度，并用它来分析情绪随时间的变化。我意识到 Quanteda 有实现 LIWC 词典的功能，但如果可能的话，我更喜欢使用开源 ANEW 数据。

本质上，我需要实施方面的帮助，因为我是编码和 R 新手

ANEW 文件看起来像这样（.csv 格式）：

字数/得分：癌症：1.01，土豆：3.56，爱情：6.56

还没有，直接，但是... ANEW 与其他词典不同，因为它不使用键：值对格式，而是为每个术语分配一个数字分数。这意味着您不是对值与键的匹配进行计数，而是选择特征，然后使用加权计数对它们进行评分。

这可以在quanteda by:

将新的特征放入字符向量中。
Use dfm(yourtext, select = ANEWfeatures)创建仅具有 ANEW 功能的 dfm。
将每个计数值乘以每个 ANEW 值的化合价，逐列回收，以便每个特征计数乘以其 ANEW 值。
Use rowSums()在加权矩阵上获得文档级价分数。

或者，

File an issue https://github.com/kbenoit/quanteda/issues我们将把这个功能添加到quanteda.

另请注意tidytext如果您想将 dfm 转换为他们的对象并使用该方法（这基本上是我上面建议的版本），则使用 ANEW 进行情感评分。

Updated:

事实证明我已经将该功能内置到了quanteda你需要的，只是没有意识到！

这会起作用。首先，加载 ANEW 词典。（您必须自己提供 ANEW 文件。）

# read in the ANEW data
df_anew <- read.delim("ANEW2010All.txt", stringsAsFactors = FALSE)
# construct a vector of weights with the term as the name
vector_anew <- df_anew$ValMn
names(vector_anew) <- df_anew$Word

现在我们有了一个命名的权重向量，我们可以使用它来应用它dfm_weight()。下面，我首先通过相对频率对 dfm 进行标准化，以便文档总分不依赖于标记中的文档长度。如果您不想这样做，只需删除下面指示的行即可。

library("quanteda")
dfm_anew <- dfm(data_corpus_inaugural, select = df_anew$Word)

# weight by the ANEW weights
dfm_anew_weighted <- dfm_anew %>%
    dfm_weight(scheme = "prop") %>%   # remove if you don't want normalized scores
    dfm_weight(weights = vector_anew)
## Warning message:
## dfm_weight(): ignoring 1,427 unmatched weight features 

tail(dfm_anew_weighted)[, c("life", "day", "time")]
## Document-feature matrix of: 6 documents, 3 features (5.56% sparse).
## 6 x 3 sparse Matrix of class "dfm"
##               features
## docs                 life        day       time
##   1997-Clinton 0.07393220 0.06772881 0.21600000
##   2001-Bush    0.10004587 0.06110092 0.09743119
##   2005-Bush    0.09380645 0.12890323 0.11990323
##   2009-Obama   0.06669725 0.10183486 0.09743119
##   2013-Obama   0.08047970 0          0.19594096
##   2017-Trump   0.06826291 0.12507042 0.04985915

# total scores
tail(rowSums(dfm_anew_weighted))
## 1997-Clinton    2001-Bush    2005-Bush   2009-Obama   2013-Obama   2017-Trump 
##     5.942169     6.071918     6.300318     5.827410     6.050216     6.223944

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

ANEW 字典可以用于 Quanteda 中的情感分析吗？的相关文章

R 中的龙卷风图

我正在尝试在 R 中绘制龙卷风图又名敏感性图目标是可视化某些变量增加 10 和减少 10 的效果到目前为止我已经得到这个结果这是我正在使用的代码 Tornado plot data lt matrix c 0 02 0 02 0 0
使用 RDCOMClient 搜索 Outlook 收件箱

我尝试使用 RDCOMClient 在 Outlook 收件箱中搜索电子邮件中的特定主题然后获取附件我在一封电子邮件上进行了这项工作但由于主题包含日期元素我需要搜索成为一个类似的子句但不太清楚这适合我的下面的查询 outlook
如何在 R 中将字符串解析为层次结构或树

有没有办法将表示组的字符串解析为 R 中的层次结构假设我的小组结构如下 1 1 1 1 1 1 1 1 1 1 1 1 2 1 1 3 1 1 3 1 1 1 3 2 1 1 3 3 1 2 1 2 1 1 2 1 1 1 2 1 2 1
读取R中打开的Excel文件

有没有办法将打开的Excel文件读入R 当Excel中打开一个excel文件时 Excel会对文件加锁比如R中的read方法无法访问该文件你能绕过这个锁吗 Thanks 编辑这发生在带有原始 Excel 的 Windows 下发生错
如何定义“f_n-chi-square”函数并使用“uniroot”求置信区间？

I want to get a 95 confidence interval for the following question 我已经写了函数f n在我的 R 代码中我首先使用 Normal 随机采样 100 个样本然后定义函数h
按特定样本前缀对列名称向量进行子集化

假设我有一个如下所示的数据框 ca01 lt c 1 10 ca02 lt c 2 11 ca03 lt c 3 12 stuff 1 lt rep test 10 other lt rep 9 10 data lt data frame
R - 与 SpatialPolygonsDataFrame 对象相交的 SpatialLinesDataFrame 列表的嵌套循环

我有一系列需要完成的步骤SpatialLinesDataFrame 此处的线基于对象与多特征中各个特征的关系SpatialPolygonsDataFrame 多边形对象简而言之每个线列表元素源自单个面要素内部并且可能会也可能不会
计算互相关函数？

In R 我在用ccf or acf计算成对互相关函数以便我可以找出哪个移位给我带来最大值从它的外观来看 R给我一个标准化的值序列 Python 的 scipy 中是否有类似的东西或者我应该使用fft模块目前我正在这样做 xcor
如何绘制大时间序列（数千次给药次数/药物剂量）？

我正在尝试绘制医院中如何开出单一药物的图解在这个虚拟数据库中我在 2017 年 1 月 1 日之后遇到了 1000 名患者绘图的目的是了解该药物的给药模式在接近入院出院或患者住院期间是否更频繁高剂量给药 Get random d
删除字符串末尾的句点和数字

如何删除尾随句点后面紧跟一个数字长度为一位或两位数字例子 z lt c awe p 56 red 45 ted 5 you 88 tom 我只想删除 45和 5 你只需要一个简单的正则表达式 z new gsub 0 9 z 一些评论
获取函数的命名空间

我正在开发一个包我希望在其中向对象添加编辑历史记录该包允许其他包注册用于编辑对象的函数我正在寻找一种方法来记录注册用于编辑的函数的包的版本问题是给定一个函数如何从导出的位置获取包我的想法是调查它的搜索路径但是search 仅
如何对数字进行四舍五入并使其显示零？

R 中将数字四舍五入到小数点后 2 位的常用代码是 gt a 14 1234 gt round a digits 2 gt a gt 14 12 但是如果该数字的前两位小数位为零则 R 会在显示中抑制零 gt a 14 0034 gt
为什么数据帧上的 is.vector 不返回 TRUE？

tl dr R 中的向量到底是什么长版 R 中很多东西都是向量例如数字是长度为 1 的数值向量 is vector 1 1 TRUE 列表也是一个向量 is vector list 1 1 TRUE 好的所以列表是一个向量显然数
尝试使用 JRI 将 R 与我的 Java 应用程序集成，但出现错误。谁能解释一下原因和解决办法吗？

我需要将 Java 与 R 集成来运行一些数学命令并使用 R 的功能进行绘图以下部分代码给出了错误 public static void main String args HelloRWorld r new HelloRWorld r h
purrr::可能函数可能无法与map2_chr函数一起使用

我怀疑这是 purrr 包中的错误但想先在 StackOverflow 中检查我的逻辑在我看来 possibly功能在内部不起作用map2 chr功能我正在使用 purrr 版本 0 2 5 考虑这个例子 library dplyr
正态分布平均值的贝叶斯推理玩具 R 代码 [降雪量数据]

我有一些降雪观测 x lt c 98 044 107 696 146 050 102 870 131 318 170 434 84 836 154 686 162 814 101 854 103 378 16 256 我被告知它遵循正态分布
访问或解析 R 中的 summary() 中的元素

我运行以下 R 命令来进行 Dunnett 测试并获取摘要如何访问下面线性假设的每一行这是摘要输出的一部分基本上我不知道摘要的结构我尝试使用名称但它似乎不起作用因为我没有看到任何命名属性来提供这一点 library multco
警告消息 - 来自 dummies 包的 dummy

我正在使用 dummies 包为分类变量生成虚拟变量其中一些变量具有两个以上类别 testdf lt data frame A as factor c 1 2 2 3 3 1 B c A B A B C C C c D D E D D E
需要在R中按行绑定列表数据

我在 R 中按行绑定列表时遇到问题我的列表数据集是 id 1 data k 1 id k b c 1 1 1 3 data k 2 id k b c 1 2 1 4 id 2 data k 1 id k b c 2 1 1 6 data
如何在 Shiny 中提取动态生成的输入值？

我正在创建一个闪亮的应用程序它将根据客户的不同功能为客户生成分数在我闪亮的应用程序中我提供了 checkboxGroupInput 来选择所需的功能根据所选功能应用程序将动态地将 numericInput 添加到 Web ui 以

随机推荐

.NET 中用于个人项目的免费代码覆盖率工具 [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我需要一个免费的 NET 代码覆盖率工具用于个人项目 Ncover 对于个人使用来说有点贵 NCove
如何在 C++ 中打印变量的名称？ [复制]

这个问题在这里已经有答案了可能的重复在C中获取变量名称的编程方法 https stackoverflow com questions 1623111 programmatic way to get variable name in c
SpriteKit 中的攻击按钮

我对 Xcode 有点陌生一直在为我的班级制作 2d 游戏我已经有一段时间遇到按钮问题了我刚刚找到了为什么我的跳跃按钮不起作用的解决方案但我还有一个攻击按钮我设置了代码使按钮显示在屏幕上并在按下时更改其图像但是我不知道要放入
IIS ARR - 反向代理的 URL 重写 - 如何发送 HTTP_HOST

尝试在多个后端 IIS 服务器前面使用 AAR 作为反向代理分配给运行 IIS AAR 的服务器的一个公共 IP 地址然后出站 URL 重写规则设置为重定向到以下之一多个后端服务器具体取决于主机名有点工作但总是返回后端服务器默认
在matlab中设置图例符号的精度

我有这个 leg2 strcat Max Degree num2str adet 1 1 ch l leg3 strcat Min Degree num2str adet 1 2 ch l leg4 strcat Max Request n
gem install libv8 --version '3.11.8.17' on ruby (windows)

问题如下 Error installing libv8 ERROR Failed to build gem native extension D Ruby193 bin ruby exe extconf rb creating Makefi
如何使用 Scala 调度获取 301 重定向中返回的 URL？

我正在使用斯卡拉dispatch http dispatch databinder net Dispatch htmlHTTP 库版本 0 10 1 我向返回 HTTP 301 永久重定向的 URL 发出请求例如 http wikipe
实体框架Remove与EntityState.Deleted

这两种说法有什么区别两者都应该删除一个实体 context Entry new Schoolyear Id schoolyearId State EntityState Deleted context Schoolyears Remove
SQLite 参数 - 不允许表名作为参数

我正在通过 Flex 在 AIR 中开发一个应用程序但我没有发现 SQLite 出了什么问题我习惯了 MySQL 参数有效但仅在某些情况下有效这是内置的针对sql注入的卫生系统的一部分吗谢谢你的帮助 Works sqlite IN
隐式意图和显式意图之间的区别[重复]

这个问题在这里已经有答案了我对之间的区别感到困惑implicit and explicit意图隐式意图和显式意图的目的是什么为什么使用这些概念我是 Android 应用程序的新手所以请提供一些示例隐式活动调用使用意图过滤器您
在.Net中使用ObjectCache缓存对象并设置过期时间

我陷入了一个场景我的代码如下更新它不是关于如何使用数据缓存我已经在使用它及其工作它是关于扩展它以便该方法在到期时间和从外部源获取新数据之间不会进行调用 object string this GetDataFromCache ca
用圆形减去（遮盖掉？）路径

我正在使用 Spark Path 在 Flex 中绘制一条路径我想从这条路径中减去一个圆形如下图所示道路又黑又宽有任何想法吗我尝试使用 Shape 对象创建蒙版但无法完全创建其中有圆孔的蒙版找到了不涉及口罩我拿了Path并
有没有办法从 UTF-8 编码的文件中删除 BOM？

有没有办法从 UTF 8 编码的文件中删除 BOM 我知道我所有的 JSON 文件都是以 UTF 8 编码的但是编辑 JSON 文件的数据录入人员将其保存为带 BOM 的 UTF 8 当我运行 Ruby 脚本来解析 JSON 时它失败并
JQuery 可拖动图像并保存位置

好吧这变得很尴尬已经搜索并尝试了大约 5 个小时但我只是在兜圈子场景很简单它是用户个人资料的标题图像可以将其拖动到某个位置然后将图像的顶部位置保存到数据库中感谢 Beetroot Beetroot 的遏制父级我开始关注
JavaScript 有内置的 stringbuilder 类吗？

I see a few 代码项目解决方案 http www codeproject com KB scripting stringbuilder aspx 但是JavaScript中有常规的实现吗如果您必须为 Internet Explo
asp.net 保护图像免受其他用户的静态请求？

我在一个为每个特定用户生成动态图像的网站上工作有时这些图像包含非常敏感数据的描述最近我们开始看到对属于不同用户的图像的请求其形式为 http myapp images someuid image1 jpg http myapp im
PHP IMAP 解码消息

我有通过 Base64 编码和 8 位编码发送的电子邮件我想知道如何使用 imap fetchstruct 检查消息的编码已经这样做了大约两个小时所以丢失了然后正确解码 Gmail 和 Mailbox iOS 上的应用程序将其作为
HttpParams 在 Angular 中不起作用，出现 502 错误

我用的是角度8 我在用HttpParams通过以下方式将数据发送到服务器Post method 我正进入状态502状态码错误通过HttpPrams发送数据 ERROR HttpErrorResponse 标头 HttpHeaders 状
MongoDB 和 upsert 问题

我有两个模型 1 资源假期 Id private String resourceID private List
ANEW 字典可以用于 Quanteda 中的情感分析吗？

我正在尝试找到一种方法来实施英语单词情感规范荷兰语以便使用 Quanteda 进行纵向情感分析我最终想要的是每年的平均情绪以显示任何纵向趋势在数据集中所有单词均由 64 名编码员按照 7 分李克特量表在四个类别上进行评分这提

ANEW 字典可以用于 Quanteda 中的情感分析吗？

Updated:

ANEW 字典可以用于 Quanteda 中的情感分析吗？ 的相关文章

随机推荐

热门标签

ANEW 字典可以用于 Quanteda 中的情感分析吗？的相关文章