情感分析 - wordNet , SentiWordNet 词典

2023-11-26

我需要一个包含积极和消极词语的列表weights根据单词的强度和周数来分配单词。我有 :

1.) WordNet - 它为每个单词给出 + 或 - 分数。

2.) SentiWordNet - 给出 [0,1] 范围内的正值和负值。

我用几句话检查了这些,

love - wordNet 对名词和动词都给出 0.0,我不知道为什么我认为它至少在某些方面应该是积极的。

压制 - wordNet 给出 -9.93
- SentiWordNet 为 pos 和 neg 给出 - 0.0。 (应该是负数)

休息 - wordNet - 2.488
- SentiWordNet - { pos - 0.125,neg - 0.5 }(应该是正数)

我需要一些帮助来决定使用哪一个。

Thanks.


通常,程度和/或极性可能取决于领域和/或上下文,因此仅靠这个词并不足以做出决定。

如果您有一些带注释的数据,我建议使用这两个资源提供的分数作为特征来训练分类器。如果不这样做,一种选择是使用与相关域匹配的可用情感注释语料库之一。尽管在无监督情感分类方法上有大量工作,但在没有任何数据的情况下,整个任务变得有些棘手,我相信,例如,无监督情感分析

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

情感分析 - wordNet , SentiWordNet 词典 的相关文章

  • word2vec中单词的向量代表什么?

    word2vec https code google com p word2vec 是 Google 的开源工具 它为每个单词提供一个浮点值向量 它们到底代表什么 还有一篇论文关于段落向量 http cs stanford edu quoc
  • 在Python或Sklearn中用整数值对具有字符串值的列变量进行编码

    如何用整数值对数据表中字符串类型的列值进行编码 例如 我有两个特征变量 颜色 可能的字符串值 R G 和 B 和技能 可能的字符串值 C Java SQL 和 Python 给定数据表有两列 Color gt R G B B G R B G
  • python 中单词的动名词形式

    我想获得字符串的动名词形式 我还没有找到调用库来获取动名词的直接方法 我应用了以 ing 结尾的单词的规则 但是因为异常导致我收到了一些错误 然后 我检查 cmu 单词以确保生成的动名词单词正确 代码如下 import cmudict im
  • 如何计算两个文本文档之间的相似度?

    我正在考虑使用任何编程语言 尽管我更喜欢 Python 来从事 NLP 项目 我想获取两个文档并确定它们的相似程度 常见的方法是将文档转换为 TF IDF 向量 然后计算它们之间的余弦相似度 任何有关信息检索 IR 的教科书都涵盖了这一点
  • 这个 NLP 问题层次结构描述中的最大池化是什么类型

    我正在尝试实现这个描述以及我所做的 我生成了形状的 uni gram bi gram tri gram 15 512 使用填充 然后对于每个单词 我连接三个特征向量 3 512 然后我向他们申请 Globalmaxpooling1D 我不知
  • 如何使用 word2vec 找到与向量最接近的单词

    我刚刚开始使用 Word2vec 我想知道如何找到最接近向量的单词 我有这个向量 它是一组向量的平均向量 array 0 00449447 0 00310097 0 02421786 dtype float32 有没有一种直接的方法可以在我
  • Spark MLLib 存在问题,导致概率和预测对于所有内容都相同

    我正在学习如何将机器学习与 Spark MLLib 结合使用 目的是对推文进行情感分析 我从这里得到了一个情感分析数据集 http thinknook com wp content uploads 2012 09 Sentiment Ana
  • 如何训练斯坦福 NLP 情感分析工具

    地狱大家 我正在使用斯坦福核心 NLP 包 我的目标是对推文直播进行情感分析 按原样使用情感分析工具对文本 态度 的分析非常差 许多积极因素被标记为中性 许多消极因素被评为积极 我已经在文本文件中获取了超过一百万条推文 但我不知道如何实际获
  • 如何确保用户只提交英文文本

    我正在构建一个涉及自然语言处理的项目 由于nlp模块目前只处理英文文本 所以我必须确保用户提交的内容 不长 只有几个单词 是英文的 是否有既定的方法来实现这一目标 首选 Python 或 Javascript 方式 如果内容足够长我会推荐一
  • SpaCy 模型“en_core_web_sm”的词汇量大小

    我尝试在 SpaCy 小模型中查看词汇量 model name en core web sm nlpp spacy load model name len list nlpp vocab strings 只给了我 1185 个单词 我也在同
  • 是否可以使用 Google BERT 来计算两个文本文档之间的相似度?

    是否可以使用 Google BERT 来计算两个文本文档之间的相似度 据我了解 BERT 的输入应该是有限大小的句子 一些作品使用 BERT 来计算句子的相似度 例如 https github com AndriyMulyar semant
  • openNLP 与 Solr 集成时出现异常

    我正在尝试将 openNLP 与 Solr 6 1 0 集成 我配置了架构和 solrconfig 文件 详细信息请参见 wiki 链接 https wiki apache org solr OpenNLP https wiki apach
  • R tm 包创建 N 个最常见术语的矩阵

    我有一个termDocumentMatrix使用创建的tmR 中的包 我正在尝试创建一个包含 50 个最常出现的术语的矩阵 数据框 当我尝试转换为矩阵时 出现此错误 gt ap m lt as matrix mydata dtm Error
  • 如何在R中使用OpenNLP获取POS标签?

    这是 R 代码 library NLP library openNLP tagPOS lt function x s lt as String x word token annotator lt Maxent Word Token Anno
  • URL路径相似度/字符串相似度算法

    我的问题是我需要比较 URL 路径并推断它们是否相似 下面我提供了要处理的示例数据 GROUP 1 robots txt GROUP 2 bot html GROUP 3 phpMyAdmin 2 5 6 rc1 scripts setup
  • 使用“自然”语言编写代码更好吗?

    我最近看到一种编程语言叫做超新星 http supernova sourceforge net 他们在网页上说 超新星编程语言是 现代脚本语言和 第一个提出了概念 用直接虚构进行编程 描述使用 纯人类语言的清晰子集 你可以编写如下代码 i
  • Lucene 标准分析器与 Snowball

    刚刚开始使用 Lucene Net 我使用标准分析器索引了 100 000 行 运行了一些测试查询 并注意到如果原始术语是单数 则复数查询不会返回结果 我知道雪球分析器增加了词干支持 这听起来不错 不过 我想知道 超过标准的雪球锣是否有任何
  • 如何从 Pandas DataFrame 转换为 Tensorflow BatchDataset 以进行 NLP?

    老实说 我想弄清楚如何转换数据集 格式 pandasDataFrame或 numpy 数组 转换为简单文本分类张量流模型可以训练用于情感分析的形式 我使用的数据集类似于 IMDB 包含文本和标签 正面或负面 我看过的每个教程要么以不同的方式
  • 如何使用FeatureUnion转换PipeLine中的多个特征?

    我有一个 pandas 数据框 其中包含有关用户发送的消息的信息 对于我的模型 我感兴趣的是预测消息的缺失收件人 即给定消息的收件人 A B C 我想预测还有谁应该成为收件人的一部分 我正在使用 OneVsRestClassifier 和
  • 对产品列表进行分类的算法? [关闭]

    Closed 这个问题需要多问focused help closed questions 目前不接受答案 我有一个代表或多或少相同的产品的列表 例如 在下面的列表中 它们都是希捷硬盘 希捷硬盘 500Go 适用于笔记本电脑的希捷硬盘 120

随机推荐

  • iOS 7 的持久 UDID 等效项? [复制]

    这个问题在这里已经有答案了 首先我想说我完全清楚uniqueIdentifier已被弃用 并且有identifierForVendor advertisingIdentifier 我的问题是 是否有办法完全持久设备标识符在重启 应用程序卸载
  • 我有一个可执行文件的核心转储,该可执行文件不是使用调试符号构建的。我可以恢复 argv 内容吗?

    我有一个可执行文件的核心转储 该可执行文件不是使用调试符号构建的 我可以恢复 argv 内容以查看命令行是什么吗 如果我运行 gdb 我可以看到回溯 并且可以导航到 main 框架 一旦到达那里 有没有办法在不知道其确切地址的情况下恢复 a
  • Boost单元测试主要功能?

    我该如何定义自己main 使用 boost 进行测试时的功能 Boost 使用它自己的 main 函数 但我使用自定义内存管理器 并且需要在分配任何内存之前对其进行初始化 否则我会收到错误 我不相信你真的需要你自己的主要 我认为你的情况要好
  • 如何从 Homebrew 重新安装 python@2?

    我在使用 openssl 和 python 2 时遇到了问题 这里已经解释了 未解决 记录的重新安装 Python 和 openssl 的解决方法不起作用 因此我决定卸载并重新安装 Python 问题是 当您尝试使用brew 安装Pytho
  • java Callable FutureTask Excecuter:如何监听已完成的任务

    我对执行者服务很陌生 喜欢自己做所有事情 但我认为是时候信任这些服务了 我想手过去Executer a Runnable 执行器将其包装在一个FutureTask然后把它还给我 现在我称之为民意调查done 方法 但我希望届时得到通知don
  • 如何获取目录中的所有文件并跳过未经授权的文件?

    我需要获取 C 盘中允许的所有文件的列表writing and reading 所以我尝试这样 string files Directory GetFiles C SearchOption AllDirectories foreach st
  • 如何加快 R 中的文本搜索速度?

    我有一个很大的文本向量 我想搜索特定的字符或短语 正则表达式需要很长时间 怎样才能快速搜索到呢 样本数据 R lt 10 7 garbage lt replicate R paste0 sample c letters 1 5 10 rep
  • JSON 响应字符串中的取消转义字符

    我发出了一个 JSON 请求 它给了我一个使用的字符串Unicode 字符代码看起来像 s u003Cp u003E 我想将其转换为 s p 在 Python 中执行此操作的最佳方法是什么 请注意 这是同一个问题this one 仅适用于除
  • html 表 colspan 未按预期工作

    HTML 概念有时是如此糟糕 这是我在 html 表中使用 colspan 的代码 看起来并不像我预期的那样 table border 1 tr td a td tr tr td b td td c td tr table 我想要的是 ce
  • VBA 宏运行时错误 6:循环内编码溢出

    遇到此错误的问题 我正在创建一个 GA 循环是将我的适应度值分配给一个数组 一些变量 Dim Chromolength as integer Chromolength varchromolength aVariables Dim i as
  • OpenGL帧缓冲区:可以清除它,但不能绘制它

    在 Mac 上 我有一个 OpenGL 设置 除了帧缓冲区外 它工作得很好 纹理工作等 所以我知道纹理已启用 我有一个有效的上下文 等等 所有工作都完美无缺 直到我尝试创建一个帧缓冲区 我使用 glGenFramebuffers glBin
  • GWT 2.0 的硒测试

    如何使 selenium click 的工作方式与手动鼠标单击相同 我最近将 GWT 从 1 7 1 升级到 2 0 一些 selenium 测试 SeleniumRC v1 0 1 IE7 现在失败 看来 Selenium click 方
  • 泛型方法可以使用逆变/协变类型吗?

    我正在编写一个通用方法 以在 T4 模板的特殊任务中使用它 该方法应该允许我使用通用接口中的专用类型 我考虑了以下签名 interface IGreatInterface Object aMethodAlpha u U parameter
  • WPF 用户控件父级

    我有一个用户控件 我将其加载到MainWindow在运行时 我无法从包含窗口获取句柄UserControl 我努力了this Parent 但它始终为空 有谁知道如何从 WPF 中的用户控件获取包含窗口的句柄 以下是控件的加载方式 priv
  • 递归和记忆

    我有一个程序 通过递归传递大量数据 比如 1000 个变量 递归至少会运行 50 或 60 次 我担心的是 由于空间不足 数据是否有可能被覆盖在内存位置上 或者如果没有内存 我会得到一些异常 即程序内存已经用完了 我没有收到这样的错误 是否
  • 将对象数组从js传递到rails

    我正在尝试将对象数组从 js 传递到 Rails data test test asdas ajax url evaluate json data data success function data dataType json Rails
  • 错误:mscorlib.dll 中发生“System.UnauthorizedAccessException”类型的未处理异常

    这是当我尝试将文件复制到某个位置时崩溃并给出此错误的部分 string startupDirectory C Users Tyler AppData Roaming Microsoft Windows Start Menu Programs
  • Eclipse 标记出现次数并不标记所有出现次数

    刚刚安装了 Eclipse Juno Release 构建 ID 20120614 1722 我打开了 标记出现次数 我可以看到它确实标记了我正在编辑的 JS 文件中的一些出现次数 但是 有一个函数调用没有标记 var trackView
  • 使用python设置固定长度

    我的 str 类似于 60 或 100 我需要 str 为 00060 和 00100 我怎样才能做到这一点 代码是这样的 我使用 0 0 0 作为插头 现在需要修复 d 0006000100 a4 60 a5 100 d 0 0 0 a4
  • 情感分析 - wordNet , SentiWordNet 词典

    我需要一个包含积极和消极词语的列表weights根据单词的强度和周数来分配单词 我有 1 WordNet 它为每个单词给出 或 分数 2 SentiWordNet 给出 0 1 范围内的正值和负值 我用几句话检查了这些 love wordN