显示 NLTK 中的标签概率/置信度

2024-03-19

我正在使用 Python NLTK 库中的 MaxEnt 分类器。对于我的数据集，我有许多可能的标签，并且正如预期的那样，MaxEnt 仅返回一个标签。我已经训练了我的数据集并获得了大约 80% 的准确率。我还在未知数据项上测试了我的模型，结果很好。然而，对于任何给定的未知输入，我希望能够根据用于选择标签的一些内部标准 MaxEnt（例如置信度/概率）打印/显示所有可能标签的排名。例如，假设我有a,b,c尽可能的标签，我用MaxEnt.classify(input)，我目前得到一个标签，比方说c。但是，我希望能够看到类似的东西a (0.9), b(0.7), c(0.92)，所以我明白为什么c被选择，并可能根据这些参数选择多个标签。对于我的模糊术语表示歉意，我对 NLP 和机器学习相当陌生。

Solution

根据已接受的答案，这里有一个框架代码示例，用于演示我想要什么以及如何实现它。更多分类器示例NLTK网站 http://www.nltk.org/book/ch06.html.

import nltk

contents = read_data('mydataset.csv')
data_set = [(feature_sets(input), label) for (label, input) in contents] # User-defined feature_sets() function
train_set, test_set = data_set[:1000], data_set[1000:]
labels = [label for (input, label) in train_set]
maxent = nltk.MaxentClassifier.train(train_set)
maxent.classify(feature_sets(new_input)) # Returns one label
multi_label = maxent.prob_classify(feature_sets(new_input)) # Returns a DictionaryProbDist object
for label in labels:
    multi_label.prob(label)

Try prob_classify(input)

它返回带有每个标签概率的字典，请参阅docs http://www.nltk.org/_modules/nltk/classify/maxent.html.

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

显示 NLTK 中的标签概率/置信度的相关文章

Tensorflow conv2d_transpose 大小错误“out_backprop 的行数与计算的不匹配”

我正在张量流中创建一个卷积自动编码器我得到了这个确切的错误 tensorflow python framework errors InvalidArgumentError Conv2DBackpropInput Number of row
LibreOffice 并行将 .docx 转换为 .pdf 效果不佳

我有很多 docx 文件需要转换为 pdf 将它们一一转换需要很长时间所以我编写了一个 python 脚本来并行转换它们 from subprocess import Popen import time import os os chdi
将 yerr/xerr 绘制为阴影区域而不是误差线

在 matplotlib 中如何将误差绘制为阴影区域而不是误差条例如而不是忽略示例图中各点之间的平滑插值这需要进行一些手动插值或者只是获得更高分辨率的数据您可以使用pyplot fill between https matpl
如何调整 matplotlib 单选按钮的大小和纵横比？

我已经尝试了几个小时来使简单的单选按钮列表的大小和纵横比正确但没有成功首先导入模块 import matplotlib pyplot as plt from matplotlib widgets import RadioButtons
Python re无限执行

我正在尝试执行这段代码 import re pattern r w w s re compiled re compile pattern results re compiled search COPRO HORIZON 2000 HOR p
指示电子邮件的类型

我有以下自动化程序它将电子邮件发送给我自己并添加了特定的链接 import win32com client as win32 import easygui import tkinter as to from tkinter import
使用 Python 3 动态插入到 sqlite

我想使用 sqlite 写入多个表但我不想提前手动指定查询有数十种可能的排列例如 def insert sqlite tablename data list global dbc dbc execute insert into tab
如何使用 Homebrew 在 Mac 上安装 Python 2 和 3？

我需要能够在 Python 2 和 3 之间来回切换我如何使用 Homebrew 来做到这一点因为我不想弄乱路径并陷入麻烦现在我已经通过 Homebrew 安装了 2 7 我会用pyenv https github com yyuu
仅当某些值相等时，如何才能将一个文本文件中的值替换为另一个文本文件中的其他值？

我有一个名为finalscores txt我想创建一个 python 脚本它将打开它并从两个单独的列中读取值这是我的finalscores txt file Atom nVa predppm avgppm stdev delta QPr
更改QLineEdit的ClearButton图标

我想在Windows 10 1909 64位上的Python 3 8和PyQt5 5 15 0 上更改我的QLineEdit的ClearButton图标稍后我想在Linux上运行代码我尝试应用此处找到的代码如何在 QLineEdit
PIL.Image.open和tf.image.decode_jpeg返回值的区别

我使用 PIL Image open 和 tf image decode jpeg 将图像文件解析为数组但发现PIL Image open 中的像素值与tf image decode jpeg不一样为什么会出现这种情况 Thanks 代
NumPy 相当于 Keras 函数 utils.to_categorical

我有一个使用 Keras 进行机器学习的 Python 脚本我正在构建 X 和 Y 它们分别是特征和标签标签的构建方式如下 def main depth 10 nclass 101 skip True output True video
Flask 应用程序路由中的多个参数

烧瓶怎么写app route如果我在 URL 调用中有多个参数这是我从 AJax 调用的 URL http 0 0 0 0 8888 createcm summary VVV change Feauure 我试图写我的烧瓶app rout
pygame：使用 sprite.RenderPlain 绘制精灵组的顺序

我有一个精灵组需要按一定的顺序绘制以便其精灵按应有的方式重叠然而即使使用运算符模块函数 sorted self sprites key attrgetter y x 对组进行排序顺序也是错误的我该如何解决这个问题直截了当地说
无法在 PyCharm 版本 9.3.3 中安装 NumPy。 Python版本3.8.2

在 PyCharm 中安装 NumPy 时出错尝试安装 Microsoft Visual C 14 0 还是行不通 NumPy 正在通过命令安装pip3 install numpy在 cmd 终端中但是当尝试将其安装在 PyCharm
基于值而不是类型的单次调度

我在 Django 上构建 SPA 并且有一个庞大的功能其中包含许多功能if用于检查我的对象字段的状态名称的语句像这样 if self state new do some logic if self state archive do s
如何通过函数注释指示函数需要函数作为参数，或返回函数？

您可以使用函数注释 http www python org dev peps pep 3107 在python 3中指示参数和返回值的类型如下所示 def myfunction name str age int gt str return
根据多个阈值将 SciPy 分层树状图切割成簇

我想将 SciPy 的树状图切割成多个具有多个阈值的簇我尝试过使用 fcluster 但它只能削减一个阈值例如这是我从另一个问题中摘取的一段代码 import pandas data pandas DataFrame total ru
仅允许正小数

在我的 Django 模型中我创建了一个如下所示的小数字段 price models DecimalField u Price decimal places 2 max digits 12 显然价格为负或零是没有意义的有没有办法将小数
描述符“join”需要“unicode”对象，但收到“str”

代码改编自here http wiki geany org howtos convert camelcase from foo bar to Foo Bar def lower case underscore to camel case s

随机推荐

如何*快速*将许多 .txt 文件转换为 .xls 文件

更新我刚刚发现拥有更强大服务器的人将完成分配给我的任务所以我没有让这个程序足够快也没关系然而下面的答案自动化 Excel 有助于使程序速度提高三倍因此我将其推荐给文件较少但仍然较多的人我正在尝试将许多超过 300 000
Java泛型通配符及其局限性

我有一个由两部分组成的问题我的书指出如果指定通配符时没有大写字母绑定那么只能调用 Object 类型的方法通配符类型的值我不知道这意味着什么这是什么意思另外通配符类型无界和有界有哪些限制例如如果我有一个参考MyCl
来自相机的原始图像数据

我一直在这个论坛上上下搜索但找不到我真正需要的东西我想从相机获取原始图像数据到目前为止我尝试通过该方法从 imageDataSampleBuffer 中获取数据captureStillImageAsynchronouslyFromC
如何组合多个 TypeScript 类装饰器？

我有一个类装饰器家族我在很多类中重复使用它们与此类似的东西 foo bar baz export class MyClass 由于我在多个类中使用这三个装饰器我真的很想将其分解为一个装饰器如下所示 standard export c
如何获取 C# 中所有已加载类型的列表？

我需要检索从给定的程序集加载的所有枚举 List
导入错误？（Python 3.2）

我有自己的名为 v systems 的模块并且我正在尝试将该模块导入到另一个 python 文件中该文件也保存在与保存文件 v systems 相同的目录中我需要将其导入为import v systems as vs或者即使我尝试导入
以概率打乱 JS 数组

假设我有一个像这样的数组 const alphabet a b c d 这代表 4 名政治候选人和一次等级选择投票其中候选人a是首选 b是第二选择等等我想将其打乱为一堆随机顺序但在这种情况下我想要a大概以 60 的比例最先出现 b第二
Android Studio - 没有可调试的应用程序

我尝试调试 Android 应用程序的发布版本但 Android Studio 无法附加调试器它找不到我正在运行的应用程序的 Android 进程在设备控制台下只有一条消息没有可调试的应用程序您还应该激活工具 gt Andro
CMake 中的第三方库

我在我的项目中使用 cmake 但我在子目录例如 lib 中有另一个库它使用普通的 Makefile 作为构建过程的一部分如何指示 CMake 运行 lib 中的 Makefile 解决方案是使用 execute process CO
安装后将 Javacard 小程序标记为隐式可选（默认小程序）

我正在寻找一种方法将小程序标记为隐式可选默认选择小程序然后将其上传并安装在全球平台 http www globalplatform org JCOP 2 4 2 R1 http www nxp com products identi
使用 JAVA 在 S3 存储桶上放置/读取文件

我试图将文件放在 S3 上并使用 JAVA 从 S3 存储桶读取文件但遇到无法执行 HTTP 请求当我尝试列出存储桶时它工作正常对我来说似乎只有 listBuckets 方法在工作而所有其他方法如 putObject list
Spring Reactive xml有效负载异常java.lang.IllegalStateException：无法解析类型为“reactor.core.publisher.Mono”的参数0

我有一个春季启动应用程序尝试通过邮递员将 xml 有效负载发送到 Post 请求我得到以下内容例外 java lang IllegalStateException Failed to resolve argument 0 of type
Marathon 上的临时任务

在此之前我要说的是我是 Mesosphere 堆栈的新手我正在尝试将现有的 Rails 应用程序部署迁移到 Mesos 到目前为止我已经成功但目前我正在运行迁移和种子通过 Rake 任务我没有看到一个很好的方法来实现它因为这些任
Linux 操作系统：/proc/[pid]/smaps 与 /proc/[pid]/statm

我想计算单个进程的内存使用情况经过一些研究后我发现了 smaps 和 statm 首先什么是smaps和statm 有什么不同 statm 有一个 RSS 字段在 smaps 中我总结了所有 RSS 值但对于同一过程这些值是不同的
如何在 Vim 上将 inoremap/nnoremap 设置为“命令键”？

我想将操作分配给 Vim 中的命令键难道就没有什么方法吗假设你使用的是 Mac 你无法在 vim 中映射命令键当它在终端模拟器中运行时仅在 MacVim 中GUI 如果您使用 MacVim GUI 您的映射应该使用
Memcache获取密钥过期时间

使用 memcached 和 php memcached 库有没有办法在执行操作时获取当前密钥到期时间get http www php net manual en memcache get php 使用这个例子它显示所有服务器密钥及其过
需要在 python 测试用例中模拟一些基类行为

我的标题相当具有描述性但就这样吧假设我有这个设置 class BaseClass object def init self pass def base function self param Hello World print para
Angular 控制台仅从 main.js:1 和 polyfills.js:1 记录日志

我正在构建一个新的角度应用程序在我执行 console log 的任何地方它都来自 main js 1 或 polyfills js 1 而不是来自正确的组件我尝试将 main js 和 polyfills js 添加到开发工具设置中
如何从 Excel 获取输入并使用该值在 as400 中运行宏

今天我正在研究as400宏我需要对3000 条记录一一运行相同的宏 Excel 工作表在 A 列中以数字格式包含 3000 多行每次我需要运行宏时在此之前我需要使用 Excel A 列中的值更改 AS400 宏代码下面是 AS400
显示 NLTK 中的标签概率/置信度

我正在使用 Python NLTK 库中的 MaxEnt 分类器对于我的数据集我有许多可能的标签并且正如预期的那样 MaxEnt 仅返回一个标签我已经训练了我的数据集并获得了大约 80 的准确率我还在未知数据项上测试了我的模型结

显示 NLTK 中的标签概率/置信度

显示 NLTK 中的标签概率/置信度 的相关文章

随机推荐

热门标签

显示 NLTK 中的标签概率/置信度的相关文章