如何使用 SVM 预测多类情感分析问题中的所有类？

2024-04-16

好吧，我正在制作一个情感分析分类器，我有三个类别/标签：积极、中性和消极。我的训练数据的形状是 (14640, 15)，其中

negative    9178
neutral     3099
positive    2363

我对数据进行了预处理，使其标准化，并将词袋词向量化技术应用于 Twitter 文本，使其可馈送到模型中，模型大小为 (14640, 1000)。由于 Y 表示标签采用文本形式，因此我应用了 LabelEncoder，以便可以将其放在一行中。像这样 -

[1 2 1 ... 1 0 1]

这就是我分割数据集的方式 -

X_train, X_test, Y_train, Y_test = train_test_split(bow, Y, test_size=0.3, stratify=Y, random_state=42)
print(X_train.shape,Y_train.shape)
print(X_test.shape,Y_test.shape)

out:(10248, 1000) (10248,)
(4392, 1000) (4392,)

stratify=y将不平衡的数据转化为适当的加权形式。对于分类器部分，我使用了 SVM -

svc = svm.SVC(kernel='linear', C=1, probability=True, class_weight='balanced').fit(X_train, Y_train) 
prediction = svc.predict_proba(X_test) 
prediction_int = prediction[:,1] >= 0.3 
prediction_int = prediction_int.astype(np.int) 
print(prediction_int)
print('Precision score: ', precision_score(Y_test, prediction_int, average=None))
print('Accuracy Score: ', accuracy_score(Y_test, prediction_int))

out:[0 0 0 ... 1 0 0]
Precision score:  [0.74185137 0.50075529 0.        ]
Accuracy Score:  0.6691712204007286
/usr/local/lib/python3.6/dist-packages/sklearn/metrics/classification.py:1437: UndefinedMetricWarning: Precision is ill-defined and being set to 0.0 in labels with no predicted samples.
  'precision', 'predicted', average, warn_for)

@desertnaut 帮我决定了很多，实际问题是什么，最后，我看到分类器无法预测第三类。你可以看到我已经打印出来了prediction_int它没有显示任何2指数。而且，它与实际标签相去甚远。我担心分类过程中是否出现任何错误。这个分类器是我为二元分类而制作的，我认为我不需要为多类分类而更改它。你们中有人能帮我解决这个问题吗？

问题是您使用的 Predict_proba 方法用于二元分类。在多分类中，它给出每个类别的概率。

您不能使用此命令：

prediction_int = prediction[:,1] >= 0.3

有关更多信息，您可以查看类似的帖子：多类分类和概率预测 https://stackoverflow.com/questions/50131032/multiclass-classification-and-probability-prediction

Update

我只是在将所有预测函数更改为这一行之后才做到的 -

pred = svc.predict(X_test)

正如他所说，以前我使用的是我的二元分类预测系统。现在这个predict可以对所有 3 个标签进行分类。所以，我的精确度和召回率现在工作得很好。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

如何使用 SVM 预测多类情感分析问题中的所有类？的相关文章

API网关+Lambda+Python：处理异常

我正在非代理模式下从 API Gateway 调用基于 Python 的 AWS Lambda 方法我应该如何正确处理异常以便使用部分异常设置适当的 HTTP 状态代码以及 JSON 正文作为示例我有以下处理程序 def my ha
matplotlib：在次要标签下绘制主要刻度标签

这看起来应该很容易但我不知道该怎么做我有一个 X 轴上有时间的图我想设置两组刻度小刻度显示一天中的小时大刻度显示日月所以我这样做 set date ticks to something sensible xax ax get
如何创建毫秒粒度的 Python 时间戳？

我需要一个自纪元以来的毫秒 ms 时间戳这应该不难我确信我只是缺少一些方法datetime或类似的东西实际上微秒 s 粒度也很好我只需要亚 1 10 秒的计时例子我有一个每 750 毫秒发生一次的事件假设它检查灯是否打开或关闭
使用DockerOperator时如何同时使用xcom_push=True和auto_remove=True？

Problem 跑步时DockerOperator with xcom push True xcom all True and auto remove True 任务会引发错误就好像容器在读取其内容之前被删除一样STDOUT Exampl
可以memmap pandas系列。数据框怎么样？

看来我可以通过创建 mmap d ndarray 并使用它来初始化系列来对 python 系列的底层数据进行内存映射 def assert readonly iloc try iloc 0 999 Should be non editabl
从内存中发送图像

我正在尝试为 Discord 机器人实现一个系统该系统可以动态修改图像并将其发送给机器人用户为此我决定使用 Pillow PIL 库因为它对于我的目的来说似乎简单明了这是我的工作代码的示例它加载一个示例图像作为测试修改在其上
导入 scipy.stats 时，出现“ImportError: DLL load failed: 找不到指定的过程”

我无法导入 scipy stats 并收到以下错误但不知何故 import scipy as sp 仍然可以正常工作其他库如numpy pandas都可以毫无问题地导入我尝试在 Anaconda 中重新安装 scipy 1 2 1 降
参数太少错误，同时未使用参数占位符

我尝试使用 PYODBC 在 Access 数据库中执行 SQL 查询但出现以下错误 pyodbc Error 07002 07002 Microsoft ODBC Microsoft Access 驱动程序参数太少预期为 1 301
如何在 Django 1.4 中自定义管理过滤器

我是 Python 和 Django 开发的新手我从社区提供的易于阅读的示例中学到了很多东西但最近我想为 Django 附带的管理控制台实现一个自定义的管理过滤器我进行了很多搜索只发现了一些过时的方法来完成它例如 Django 1
Selenium 上的切换窗口

我在 Python 中使用 Selenium 和 PhantomJS 我需要打开一个新窗口并控制它出于测试目的我这样做 from selenium import webdriver driver webdriver PhantomJS
Django - 该进程无法访问该文件，因为该文件正在被另一个进程使用

我正在尝试在 Windows 10 上运行 Django 我是 Django 的新手我正在使用 Compressor Toolkit 我的问题是我可以运行 manage py 但本地主机说 base html 第 9 行出错该进程无法访
如何避免在matplotlib中调用latex（输出到pgf）

我使用 matplotlib 及其 pgf 后端来生成包含在 LaTeX 投影仪文档中的绘图当我使用未定义的乳胶命令时我遇到了麻烦但对于我的应用程序我不需要 matplotlib 来使用 Latex 生成标签或注释我只想要正确的
如何更改Python使用的SQLite版本？

我在 Debian 9 12 上安装了 Python 3 8 和 SQLite 3 16 2 并且需要升级到较新版本的 SQLite 我已经下载并编译了 SQLite 网站上提供的合并并将其放入 usr bin 所以当我这样做时 sqli
Pandas 使用什么规则来生成视图和副本？

我对 Pandas 在决定数据帧中的选择是原始数据帧的副本或原始数据帧的视图时使用的规则感到困惑例如如果我有 df pd DataFrame np random randn 8 8 columns list ABCDEFGH index
Google App Engine self.redirect() POST 方法

在 GAE Python 中使用 webApp 框架调用 self redirect some url 通过 GET 方法将用户重定向到该 URL 是否也可以通过带有一些参数的 POST 方法进行重定向如果可以的话怎样做 Than
出于安全目的，您是否有理由不执行自己的算法来打乱 ID？

我计划实现我自己的非常简单的哈希公式为具有多个用户的应用程序添加一层安全性我目前的计划如下用户创建一个帐户此时后端会生成一个 ID ID 通过公式运行假设 ID 57 8926 36 7 或同样随机的东西然后我将新的用户
(venv) (base) 都在 python 项目上活跃，我如何只进入 venv？

所以我将 vscode 与 conda 对于 django 项目一起使用并尝试激活名为 venv 的虚拟环境它来自 base C Users User Desktop pfa master pfa master venv Script
有没有比 Python 内置 == 运算符更快的方法来测试两个列表是否具有完全相同的元素？

如果我有两个列表每个列表有 800 个元素长并填充整数有没有比使用内置元件更快的方法来比较它们具有完全相同的元件如果没有则短路操作员 a 6 2 3 88 54 486 b 6 2 3 88 54 486 a b gt gt gt
为什么我可以使用 tsql 连接到 Azure MS SQL，但不能使用 pymssql？

我今天在哪里 TDSVER 7 3 tsql H example database windows net U me D ExampleDB p 1433 P notreallymypassword 这不会 gt gt gt import
matplotlib imshow() 和像素强度

我试图了解矩阵的值是如何输入到 matplotlib 的imshow 函数确定灰度模式下像素的强度考虑示例代码 import random import matplotlib pyplot as plt import matplotlib

随机推荐

RCTBatchedBridge.m 错误：无效数据消息 - 全部长度必须为：%zd。 React Native，iOS 模拟器

我在用着react native oauth并在尝试授权时收到此错误请参见底部的红色图像我搜索过并只找到这个类似的未回答的问题 https stackoverflow com questions 40905638 error inval
为什么 WebBrowser Document Completed() 会触发两次？

嗯我正在使用一个简单的网络浏览器控件来浏览页面因此我需要在执行此操作时更改表单的文本我在用着 private void webBrowser1 DocumentCompleted object sender WebBrowserDoc
用于基于 window.location.href 的条件 URL 附加或重定向的 Javascript

我正在尝试制作一个书签单击该书签时将检查当前选项卡窗口的 URL 以查看它是否包含 char1 和或 char2 给定字符如果两个字符都存在它将重定向到另一个 URL 对于另外两个字符它将分别附加当前 URL 我相信一定有一种比
安装到 {sys} 的文件/DLL 未出现在 C:\Windows\system32 中

我不知道为什么但是当我尝试将文件从安装目录复制到system32 尽管在 Inno Setup 中显示安装成功但它未能执行此操作这是我的代码 Files specifies what files will be included in
theta 表示法称为平均情况吗？

有些书指出 theta 表示法称为平均情况而另一些书则指出 theta 不是平均情况如果 theta 不是平均情况那么什么是算法的平均情况 O 和符号实际上与算法的最佳平均最差情况无关它们是表达函数渐近行为的方法无论函数是什
AIR/Actionscript 中没有这样的表 SQLITE_SEQUENCE

我正在尝试使用 AIR ActionScript Flex 4 5 重置 SQLITE 中自动增量字段的种子我正在做通常应该有效的事情 DELETE FROM SQLITE SEQUENCE WHERE NAME myTable 我已经检
从 C# 中的服务器下载后，Zip 文件被损坏

request MakeConnection uri WebRequestMethods Ftp DownloadFile username password response FtpWebResponse request GetRespo
具有 DOM 操作的自定义插件 CKEditor 4.x

我正在为 CKEditor 4 7 开发一个自定义插件它做了一个简单的思考以防用户选择一些东西它会将其放入具有特定类的 div 中否则它将放入一个具有相同类的 div 其中包含文本例如在此处添加内容我尝试根据 CKEditor
AVX 中的分散内在函数

我在 Intel Intrinsic Guide v2 7 中找不到它们您知道 AVX 或 AVX2 指令集是否支持它们吗原始AVX指令集中没有分散或聚集指令 AVX2 添加了聚集指令但没有添加分散指令 AVX512F 包括分散和聚集
Zend 调试器 Eclipse 启动错误：eclipse.php.debug.core 无法加载类 debug.core.model.PHPConditionalBreakpoint

我在 Mac OSX Lion 上工作自从安装了 Zend Debugger 并让它能够调试 php Web 应用程序后我经常遇到这个 Eclipse 启动错误扩展点创建扩展时出错 org eclipse php internal d
交叉连接 2 个向量的元素以生成第三个向量

我有 2 个向量想要将一个向量分布到另一个向量上以形成第三个向量例如 V1 a b c V2 d e f Result V3 ad ae af bd be bf cf nine total elements 我知道如何做到这一点的唯一方
如何使用 .NET 2.0 捕获 using 块中的异常？

这些天当我有一个实现 IDisposable 的对象时我尝试越来越多地利用 using 块但我还没有弄清楚的一件事是如何像在正常的 try catch finally 中一样捕获异常有任何代码示例可以为我指明正确的方向吗编辑阅读
如何更改JavaFX中ListView的字体大小？

我尝试了这个建议http forums sun com thread jspa threadID 5421037 http forums sun com thread jspa threadID 5421037但找不到风格还有其他办法吗
使用多次调用函数的 Angular @Input 绑定

我在用着角8 我有一个子组件 Input 财产必须在绑定之前修改此输入因此使用方法返回用于绑定的数据例如
联系表 7 - 自定义验证

我只需要验证一个字段称为实例以仅接受小写 ASCII 字母和数字第一个字符也必须是字母而不是数字它会接受大写字符但我们需要它在输入时将它们小写因此如果有人使用实例名称 McDonalds 它将小写为 mcdonalds 不仅
django 中的实时通知/聊天

我现在正在用 django 制作一个网站我想实现一个实时通知功能就像 facebook 或 SE 上的那样我做了一些研究似乎虽然有两种选择 ajax 长轮询和 websockets 但后者是最佳选择然而正如你所知 websock
onEdit 简单触发器似乎永远不会被触发

我一直在使用OnEdit一段时间以来它一直工作得很好但是现在我遇到了一个问题基本上当编辑第 6 列 f 时我希望它检查该值如果它是正在进行我希望它然后运行一个函数发送电子邮件当我调试它时它完全按照我想要的方式工作但是当我
我的 Qt5 可执行文件无法在 Visual Studio 2010 之外运行

我用 Qt5 和 Visual Studio 2010 完成了一个大项目使用运行按钮一切都在 Visual Studio 内部但我的目标当然是在没有视觉工作室的情况下将其发布给其他人我的问题是我无法在 Visual Studio
Vue.js 中的 $t 是什么

第一次与Vue js并且不知道是什么 t 例如我有一个人的代码是这样的 li class category filter back li
如何使用 SVM 预测多类情感分析问题中的所有类？

好吧我正在制作一个情感分析分类器我有三个类别标签积极中性和消极我的训练数据的形状是 14640 15 其中 negative 9178 neutral 3099 positive 2363 我对数据进行了预处理使其标准化并将

如何使用 SVM 预测多类情感分析问题中的所有类？

如何使用 SVM 预测多类情感分析问题中的所有类？ 的相关文章

随机推荐

热门标签

如何使用 SVM 预测多类情感分析问题中的所有类？的相关文章