用户评论 - R 中的主题建模或意图检测

2024-01-21

我正在 R 中进行社交媒体分析 - 类似于查看特定业务的用户反馈并尝试将用户评论区分为类别/主题。 例如:查找用户评论是否谈论邻里或犯罪等。 如何找到给定文本的意图?为了训练模型,我没有任何预先确定的主题和标题。我正在进行一个未知的主题分析。 主题建模(LDA)可以为我们提供多个主题(或每个主题的高频术语),但识别评论中提到的主题很困难。我的意思是,可能有几个与某个主题相关的单词/词汇,但我如何理解用户评论正是在谈论一个名为“邻居”的主题。有什么想法吗?谢谢!


None

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

用户评论 - R 中的主题建模或意图检测 的相关文章

  • Django 中的 Rpy2 错误 - 未为“”类型的对象定义转换“py2rpy”

    我以前从未使用过 R 并且正在尝试使用 rpy2 从 python 调用 R 函数 它可以在独立的 python 终端上运行 但不能在 Django 中运行 但rpy2似乎无法将python字符串转换为r对象 我正在使用同事提供的自定义库
  • 回归时如何设置系数值;右

    我正在寻找一种指定预测变量值的方法 当我使用当前数据运行 glm 时 其中一个变量的系数接近 1 我想将其设置为 0 8 我知道这会给我一个较低的 R 2 值 但我先验地知道模型的预测能力会更大 glm 的权重组件看起来很有希望 但我还没有
  • R:如何找到向量的模式[重复]

    这个问题在这里已经有答案了 下面是我的data frame我想知道每个内存类别 1 到 8 的模式是什么 gt dput d structure list MEMORY1 c 5 5 7 1 5 6 4 5 4 5 5 4 1 5 5 2
  • 将不同的 grViz 组合成一个图

    我想结合不同的DiagrammeR绘制成一个图形 生成的图如下例所示 library DiagrammeR pDia lt grViz digraph boxes and circles a graph statement graph ov
  • 使用自定义渐变填充直方图箱

    我想在 R 和 ggplot2 中创建一个直方图 其中根据连续的 x 值填充箱 大多数教程仅通过离散值或密度 计数进行着色 下列的这个例子 https stackoverflow com questions 40284227 how to
  • 美人鱼图:调整图表周围的空白

    我在用 Rstudio 编译的 Rmd 报告中使用了美人鱼图 在 HTML PDF 输出中 图表上方和下方有大量空白 请参见下面的示例 Header Text r library DiagrammeR mermaid graph TD cl
  • 将所有分号替换为空格 pt2

    我尝试对 2000 多行关键字的列表运行文本分析 但它们的列出方式如下 战略 管理风格 组织 所以当我使用 tm 删除标点符号时 它就变成了 组织的战略管理风格 我认为这在某种程度上破坏了我常用术语的分析 我尝试过使用 vector lt
  • 如何使用autoconf重新生成配置文件?

    我使用 autoconf 重新生成配置文件 它有效 但是当我执行生成的配置文件时 configure 有一些错误消息 例如 configure line 3713 syntax error near unexpected token bla
  • R data.table 多个条件连接

    我设计了一种解决方案 用于从两个单独数据表的多个列中查找值 并添加基于新列的值计算 多个条件比较 代码如下 它涉及在计算两个表中的值时使用 data table 和联接 但是 这些表没有联接在我正在比较的列上 因此我怀疑我可能无法获得 da
  • 如何读取 R 中的每个 .csv 文件并将其导出到单个大文件中

    你好 我有以下格式的数据 101 20130826T155649 3 1 round 0 10552 180 yellow 12002 1 round 1 19502 150 yellow 22452 1 round 2 28957 130
  • dplyr 中的标准评估:全局环境中的函数出现“无法找到函数”错误

    我试图在 dplyr 中对全局环境中的函数使用标准评估 但出现 无法找到函数 错误 这是一些代码 create data frame df lt data frame x rnorm 10 y rnorm 10 define arbitra
  • 在 Lavaan 生长曲线模型中提取个体轨迹

    我已经使用 R 的 Lavaan 包中的 Growth 函数成功地对一项研究的纵向数据进行了建模 我找不到任何关于如何提取每个参与者的预测轨迹的记录 我只能找到整个组的预测轨迹 在摘要输出的 拦截 部分下给出 使用 lavPredict m
  • 按组计算连续行中的值之间的差异

    这是我的一个df 数据框 group value 1 10 1 20 1 25 2 5 2 10 2 15 我需要按组计算连续行中的值之间的差异 所以 我需要一个结果 group value diff 1 10 NA because the
  • 如何返回包含最大值标签的向量

    我有一个 4 列数组 我想获得一个向量 其中每行包含包含该行最大值的列的标签 我可以在循环中执行此操作 但我想使用矩阵函数来提高速度 我怎样才能在不编写自己的库函数的情况下做到这一点 有一个函数可以做到这一点 如果x是你的矩阵 尝试max
  • R 编程常用工具

    如果已经以不同的方式问过这个问题 我深表歉意 但我找不到任何达到我想要的东西 我真的是从其他软件包 SPSS 开始接触 R 的 当我了解真正可以做什么时 我意识到我还需要其他 工具 这让我想到了我的问题 您有哪些用于开发 R 代码的设置 我
  • 如何在 R 中绘制一列与其余列的关系图

    我有一个数据集 其中 1 是时间 接下来的 14 个是幅度 我想在一张图表上散布所有大小与时间的关系 其中每个不同的列都是网格化的 分层在另一个之上 我想使用原始数据来制作这些图表 并单独制作它们 但只想执行此过程一次 数据集A 唯一的自变
  • 当有很多列时,使用 readr::read_csv() 导入数据时覆盖列类型

    我正在尝试使用 R 中的 readr read csv 读取 csv 文件 我导入的 csv 文件大约有 150 列 我只包含示例的前几列 我希望将第二列从默认类型 我执行 read csv 时为日期 覆盖为字符或其他日期格式 GIS Jo
  • R - 与 SpatialPolygonsDataFrame 对象相交的 SpatialLinesDataFrame 列表的嵌套循环

    我有一系列需要完成的步骤SpatialLinesDataFrame 此处的 线 基于对象与多特征中各个特征的关系SpatialPolygonsDataFrame 多边形 对象 简而言之 每个线列表元素源自单个面要素内部 并且可能会也可能不会
  • RStudio 如何确定控制台宽度,为什么它似乎总是出错?

    我刚刚发现wid lt options width在 RStudio 中 它似乎是我日常控制台使用中令人烦恼的根源 或者更确切地说 更接近根源 我应该先说一下 我目前使用的是 R 3 2 2 RStudio 0 99 491 Linux M
  • 从 R 中的方差分析 (glm) 中提取残余偏差

    我在 R 中安装了一个 glm 模型并采用了方差分析表 我需要提取 残余偏差 列 但它会产生错误 以下是代码 创建数据 counts lt c 18 17 15 20 10 20 25 13 12 outcome lt gl 3 1 9 t

随机推荐

  • p:commandbutton 执行与我要求相反的操作

    我一直在尝试禁用按钮 直到操作完成 然后这应该启用该按钮 按钮的代码
  • Tomcat 7 java.lang.NoClassDefFoundError:javax / el / ELManager [重复]

    这个问题在这里已经有答案了 我想将我的应用程序部署到版本 7 中的 tomcat 但出现以下异常java lang NoClassDefFoundError javax el ELManager但如果我尝试将此应用程序部署到 tomcat
  • PHP 将 iTXt 注释添加到 PNG 图像

    我到处都在寻找这个 我知道可以使用 net 中的一些库来完成 但我真的希望我的脚本生成 标记 图像 原因是我们是论坛主办方 和主题制作公司合作 主题制作公司希望我们能够追踪任何非法分发的主题 我在 GCHQ CanYouCrackIt 练习
  • 如何通过回调从 C# 方法创建 F# 异步?

    假设我有一些需要回调的 C 代码 void DoSomething Action
  • 检查鼠标是否在元素的边界内

    javascript 有没有办法检查鼠标位置当前是否位于元素的边界内 您有什么可以建议的功能或快速的方法吗 if document mouse x gt ele offsetLeft document mouse x lt ele offs
  • 打印错误消息的正确方法

    这一行是在 Bash 中打印错误消息的最佳方法吗 echo Error banana gt 2 我需要更新数十个 Bash 脚本 这些脚本使用所有不同的方式记录错误 我不妨选择 正确 的方式来执行此操作并遵守我所做的标准 在我的 bash
  • 如何将base64编码的图像传递给Tensorflow预测?

    我有一个 google cloud ml 模型 我可以通过传递 float32 的 3 维数组来运行预测 instances input 0 0 0 5 0 8 然而 这不是传输图像的有效格式 所以我想传递 base64 编码的 png 或
  • 在Notepad++中如何找到字符串的第n次出现

    我有一个巨大的文本文件 其中的记录由字符串 MSH 标识 我需要找到第 200 条记录 我希望在 Notepad 中可以使用一个正则表达式 它可以让我找到字符串 MSH 第 200 次出现的位置 如果您的文件只是一个由字符串 MSH 分隔的
  • 从 cert 文件到 pfx 文件的转换

    是否可以将 cert 文件转换为 pfx 文件 我尝试将我的 cerf 文件导入 IE 但它从未显示在 个人 选项卡下 因此我无法在那里导出 我正在寻找是否有可用的替代方案 仅供参考 cerf 文件是通过使用 keytool 创建的 然后导
  • 模块构建失败(来自 ./node_modules/mini-css-extract-plugin/dist/loader.js):ReferenceError:文档未定义

    好的 基本上我们在部署之前使用 webpack 来捆绑我们的资源 然而 现在我们还想通过 webpack 捆绑我们的 sass 文件 因为它简化了我们的构建过程 一切进展顺利 但现在bundle js太大而无法在生产中部署 所以我想拆分bu
  • SPA(单页应用程序)是否适合针对移动设备的网站?

    我计划创建一个主要针对手机的网站 其中包含大约 20 个不同的视图 页面 如果我想专注于在页面之间切换时使用户体验非常灵敏 如快速 那么将网站创建为单页应用程序是一个好主意吗 我知道您可以采取许多技巧来提高移动网站的整体性能 http ww
  • 如何通过Axios JavaScript HTTP请求发送JSON或Form数据到FastAPI后端?

    我有一个 FastAPI 后端配置如下 app post engines completions async def read completions engine id str prompt Optional str None max t
  • 如何使用 MapStruct 将字符串转换为映射?

    I have Story我的 Spring Boot 应用程序中的实体 它有String field storyInfo其中包含 title random title description random description For m
  • Java REST 实现:Jersey 与 CXF [关闭]

    Closed 这个问题需要多问focused help closed questions 目前不接受答案 您认为这两个库之间的优点 缺点是什么 这两个哪个最适合生产环境 顺便说一句 我将使用 JSON 而不是 XML 我还想知道哪个库最受社
  • 在自定义上下文菜单中实现“粘贴”

    这是我试图解决的问题 我不确定这是否可能 我有一个网络应用程序 我需要启用从该应用程序到该应用程序的数据复制 粘贴 但我在粘贴时遇到问题 如果我使用 CTRL V 快捷键过去 我可以使用以下命令从剪贴板获取数据 e originalEven
  • OpenCV 2.4.5 中的访问冲突读取

    我尝试了有关匹配许多图像的示例代码OpenCV 2 4 5我修改了该代码 我找到了错误代码 Unhandled exception at 0x585a7090 in testing exe 0xC0000005 Access violati
  • Javascript扩展对象问题

    我有以下代码 this myObject key1 val1 key2 val2 this aMethod function newObject 这里我想要一个新对象 可能继承自this myObject 包含所有内容this myObje
  • 给定一个 nxn 邻接矩阵,如何计算图中三角形的数量(Matlab)?

    我编写了一个函数 给定 n 生成随机 nxn 邻接矩阵 我想知道是否有一种方法可以计算矩阵表示的图中三角形的数量 The i j 中的元素n 邻接矩阵的幂A计算长度路径的数量n开始于i并结束于j 三角形是一条长度为 3 起始点和终止点相同的
  • Spark读取不同版本的Parquet文件

    我使用 Version1 架构生成了一年多的镶木地板文件 随着最近的架构更改 较新的镶木地板文件具有 Version2 架构额外列 因此 当我从旧版本和新版本一起加载镶木地板文件并尝试过滤更改的列时 我得到一个异常 我希望 Spark 读取
  • 用户评论 - R 中的主题建模或意图检测

    我正在 R 中进行社交媒体分析 类似于查看特定业务的用户反馈并尝试将用户评论区分为类别 主题 例如 查找用户评论是否谈论邻里或犯罪等 如何找到给定文本的意图 为了训练模型 我没有任何预先确定的主题和标题 我正在进行一个未知的主题分析 主题建