如何在 weka 中表示用于分类的文本？

2024-02-06

您能告诉我如何在 weka 中表示文本分类的属性或类吗？我可以使用什么属性进行分类？词频还是仅词？ ARFF 格式的可能结构是什么？你能给我几行该结构的例子吗？

预先非常感谢您。

最简单的替代方法之一是从 ARFF 文件开始解决二类问题，例如：



@relation corpus 

@attribute text string
@attribute class {pos,neg}

@data
'long text with words ... ',pos

文本表示为字符串类型，类是具有两个值的标称。

然后你可以应用两个过滤器：

字符串到字向量将文本转换为词向量表示。过滤器对每个单词使用一个属性。您可以调整参数来选择二进制/频率表示、词干或停用词。最佳表示取决于问题。如果文本不长，通常二进制表示就足够了。
Reorder为了将类属性移动到最后一个位置，Weka 假设它就在那里。

您可以在此 Weka wiki 页面中找到更多信息和其他转换数据的方法：http://weka.wikispaces.com/Text+categorization+with+WEKA http://weka.wikispaces.com/Text+categorization+with+WEKA

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Java

machinelearning

Classification

Weka

arff

如何在 weka 中表示用于分类的文本？的相关文章

删除列表视图项目之间的间距

我正在尝试在 Android 中制作一个包含图像的 ListView 我希望图像在列表中彼此相对但我似乎无法消除间距这是我的 listview xml
使用递归查找数组中的最大值

对于我被要求解决的问题之一我使用 for 循环找到了数组的最大值所以我尝试使用递归来找到它这就是我想到的 public static int findMax int a int head int last int max 0 if h
Android Studio - 无法识别的 VM 选项“MaxPermSize=256m”

我刚刚在 Elementary OS 0 3 Freya 上安装了 Android Studio 并使用终端运行它然而在我第一次启动时显示一条错误消息 Gradle 测试项目刷新失败无法启动守护进程这个问题可能是由守护进程的配
JMS队列消息接收顺序

我按顺序在同一目标中添加两条 JMS 消息这两条消息的接收顺序是否与我添加它们的顺序相同或者是否有可能进行相反的排序即首先检索目的地中首先接收到的消息我将添加到目的地 producer send Msg1 producer send
Spring中需要多个相同类型的bean

将其标记为重复之前的请求我浏览了论坛但在任何地方都找不到该问题的解决方案我正在使用 Spring 3 2 编写代码一切都是纯粹基于注释的该代码接收从不同 XSD 文件派生的 XML 文件所以我们可以说有五个不同的 XSD A1
如何在 El Capitan (OS X 10.11) 中设置 Android Studio？

全新安装 El Capitan 10 11 尝试安装 Android Studio 版本 1 21 Error Android Studio was unable to find a valid JVM Please download it
如何向正在运行的 Linux 进程发送 Ctrl-Break？

我正在调试在 Sun 的 JDK 1 4 2 18 上运行的应用程序中的内存泄漏该版本似乎支持命令行参数 XX HeapDumpOnCtrlBreak 这可能会导致 JVM 在遇到控制中断时转储堆如何将其发送到 Linux 机器上的后台
Xgboost：bst.best_score、bst.best_iteration 和 bst.best_ntree_limit 有什么区别？

当我使用 xgboost 训练我的数据时2 cates classification problem 我想使用提前停止来获得最佳模型但我对在预测中使用哪一个模型感到困惑因为提前停止将返回 3 个不同的选择例如我应该使用 preds
mapFragment.getMapAsync 处的 NullPointerException

在解决了与我的标题相关的问题后我找不到问题的解决方案我有一个NullPointerException at mapFragment getMapAsync 下面是我的MapActivity code package com exampl
递归 - 与 Java 中不重复的数组相结合

所以我知道如何获取组合的大小数组大小在我的例子中除以所需数组子集大小的阶乘我遇到的问题是获取组合到目前为止我已经阅读了 stackoverflow 上的大部分问题但一无所获我认为我发现的问题是我想将创建的组合子集中的元素添加
“找不到符号”或“无法解析符号”错误是什么意思？

请解释以下有关找不到符号无法解析符号或找不到符号错误 Java 中的信息他们的意思是什么哪些因素会导致它们程序员如何修复它们这个问题旨在对 Java 中的这些常见编译错误进行全面的问答 0 这些错误之间有什么区别吗并不
Spring - 使用 new 是一种不好的做法吗？

正在创建对象by hand 即使用new操作员而不是注册Springbean 和使用依赖注入被认为是不好的做法吗我的意思是确实Spring IoC容器必须了解应用程序中的所有对象吗如果是这样为什么你希望 Spring 创建 bea
正确使用Optional.ifPresent()

我正在尝试理解ifPresent 的方法OptionalJava 8 中的 API 我有一个简单的逻辑 Optional
可以将矩形设置为显示边框吗？

以下应用 public class Temp extends Application Override public void start Stage primaryStage StackPane root new StackPane Re
在可序列化 Java 类中使用记录器的正确方法是什么？

我有以下 doctored 我正在开发的系统中的类以及Findbugs http findbugs sourceforge net 正在生成一个SE BAD FIELD http findbugs sourceforge net bugDe
Spring-WS WSDL生成问题

我正在尝试制作一个非常简单的 Web 服务但在让 spring 生成正确的 wsdl 时遇到一些困难我已尽力复制此示例春季教程 http static springsource org spring ws sites 2 0 refer
如何在jsf页面中嵌入java代码？

我有一个名为 LoginBean 的托管 bean 名为 login xhtml 的 JSF 页面在这个 jsf 页面中我有一个登录表单在managebean 内部我有一个loginCheck 函数 public void logi
有没有办法在坐标平面上动态绘制点之间的线？

我正在完成一个项目在该项目中我实现了一个暴力算法来解决凸包问题我还需要为该算法创建视觉效果我试图在 x 轴和 y 轴上创建一个范围从 100 100 的坐标平面绘制完整集中的所有点并在点之间动态绘制线条以创建凸包例如假设我有
Java 8 中接口和抽象类之间的根本区别[重复]

这个问题在这里已经有答案了考虑到接口现在可以为其提供的方法提供实现我无法正确合理地解释接口和抽象类之间的差异有谁知道如何正确解释其中的差异我还被告知从性能角度来看接口比抽象类更轻量有人可以证实这一点吗接口仍然不能有任何状态
你在实际项目中使用过Quickcheck吗[关闭]

Closed 这个问题是基于意见的 help closed questions 目前不接受答案快速检查 http www cs chalmers se rjmh QuickCheck 及其变体即使有一个Java https bitbuc

随机推荐

WPF设计问题（自定义控件或mvvm）

这是场景我有一个显示一些数据的视觉效果 The data to the visual can come in one of two ways 通过用户通过键盘或鼠标输入通过一些后端源 Both these data inputs can
WooCommerce 上的购物车总重量和运输重新计算

我正在尝试使用一个片段将我的自定义盒子重量添加到总订单重量中目前工作正常但是不会根据重新计算的片段重量重新计算运输方式有什么想法如何强制重新计算运费吗 add filter woocommerce cart contents wei
完全删除 MySQL 5.7 [关闭]

Closed 这个问题是无关 help closed questions 目前不接受答案我正在尝试从 ubuntu 12 04 中完全卸载 mysql 但没能做到我尝试了很多命令但没有任何作用任何人都可以帮忙吗 sudo apt g
用于对基于时间的值进行排序的 Redis 数据结构设计

我正在对数据流执行一些分析并将结果发布到 Redis 通道上消费者订阅这些频道并获取实时数据源所有历史数据分析结果都会丢失现在我想添加在Redis中存储历史数据的能力以便消费者可以查询这些历史数据主要是按时间由于分析结果按时间分
如何在一项任务中执行多个 gulp 命令

我很难理解如何在单个任务中处理多个 gulp 源在这样的任务中 gulp task task1 function cb gulp src src js pipe gulp dest dist gulp src src css pipe g
如何将 Linux shell 脚本编译为独立的可执行文件*二进制*（即不仅仅是 chmod 755）？

我正在寻找一个免费的开源工具集可以编译各种经典脚本语言例如Korn Shell ksh csh bash 等作为可执行文件如果脚本调用其他程序或可执行文件则将它们包含在单个可执行文件中 Reasons 混淆交付给客户的代码以免
快速修复/n 错误：MsgSeqNum 太高

我已经使用 QuickFIX n is v1 4 0 从此创建了一个修复应用程序 http www quickfixn org download http www quickfixn org download 地点当我执行应用程序时我
反序列化 xml，包括命名空间

我正在尝试反序列化一些 XML 但无法获取名称空间 xsi type Model 上班如果xsi type Model 被排除在 XML 之外它可以工作但它必须存在如果我将命名空间保留在模型之外则会收到错误如果重命名它则会得到
AngularJS 拦截并扩展控制器 $scope

我在应用程序中定义了许多可重用的功能每个控制器都与 scope 变量一起使用有没有办法扩展 scope 变量以便我可以在任何地方使用我的扩展代码而不是每次都创建共享服务就像是 I ve tested this out and it
我希望我的 Android 应用程序仅在纵向模式下运行？

我希望我的 Android 应用程序仅在纵向模式下运行我怎样才能做到这一点在清单中为您的所有活动进行设置
PyDev 的导入错误

我使用 PyDev Eclipse 已有几个月了并且在导入时遇到了相同的错误 PyDev 在导入中用红色下划线并说Unresolved import xxx Found at yyy 当我点击yyyeclipse找到并打开该模块的执行 P
安装了jSweet。怎么办？

我有一个java项目我想将其转换为Typescript 大约150个文件 As per http www jsweet org getting started http www jsweet org getting started 我查看
iPhone开发配置助手第3步公钥/私钥问题

您好我正在使用开发配置助手在第 3 步在钥匙串访问中验证您的私钥和公钥时我在钥匙串 gt 登录中有 iPhone 开发人员 XXXXXXX 证书但找不到任何密钥如果我单击类别 gt 键我什么也看不到我应该怎么做才能
Windows批处理脚本仅保留目录中的N个最新文件夹

我有一个目录我将 MySQL 数据库备份到具有当前日期的文件夹中现在 30 或 60 天后我喜欢只保留该备份目录中的 n 个最新文件夹并删除其余文件夹每个文件夹中都有 gzip 压缩的数据库为了备份我使用的 MySQL 数据库a
QWebPage多次触发loadFinished()

我正在使用 load 方法将内容加载到 QWebPage 中但我的 loadStarted loadFinished 和 loadProgress 处理程序调用了多次如何检测该页面已完全加载其所有内容在以下位置发布了相关解决方案提案
使用 $fetch 和 Pinia 的 Nuxt 3 JWT 身份验证

我正在尝试对不同的 API 进行 JWT 身份验证由于 nuxtjs auth next 似乎不是最新的而且据我所知可以在 Nuxt 3 中使用新的全局方法 fetch 而不是 nuxtjs axios 也不是最新的我认为它自己编写
例外：需要在环境或系统属性中指定类名：java.naming.factory.initial [重复]

这个问题在这里已经有答案了当我运行 JMS 相关应用程序时遇到以下异常错误 javax naming NoInitialContextException 需要在环境或系统属性中指定类名或者作为小程序参数或者在应用程序资源文件中 ja
Rails 3 中类似于 Stack Overflow 的 URL 路由

所以我希望我的应用程序生成诸如堆栈溢出之类的路由 questions id title 我怎样才能在 Rails 中做到这一点请注意 http stackoverflow com questions 4434266 stack overf
Typedoc 不会为导入的模块生成文档

使用 TypeDoc 生成时我收到一个空文档这仅适用于导入的文件当我将任何类添加到指定的文件中时entryPoints 我得到了这方面的文档但对于导入的文件我什么也得不到我有这样的 typedoc json entryPoints
如何在 weka 中表示用于分类的文本？

您能告诉我如何在 weka 中表示文本分类的属性或类吗我可以使用什么属性进行分类词频还是仅词 ARFF 格式的可能结构是什么你能给我几行该结构的例子吗预先非常感谢您最简单的替代方法之一是从 ARFF 文件开始解决二类问题例如 r

如何在 weka 中表示用于分类的文本？

如何在 weka 中表示用于分类的文本？ 的相关文章

随机推荐

热门标签

如何在 weka 中表示用于分类的文本？的相关文章