将朴素贝叶斯训练分类器保存在 NLTK 中

2024-03-15

我对如何保存经过训练的分类器有点困惑。例如，每次我想使用分类器时重新训练它显然非常糟糕且缓慢，我如何保存它并在需要时再次加载它？代码如下，提前感谢您的帮助。我正在使用 Python 和 NLTK 朴素贝叶斯分类器。

classifier = nltk.NaiveBayesClassifier.train(training_set)
# look inside the classifier train method in the source code of the NLTK library

def train(labeled_featuresets, estimator=nltk.probability.ELEProbDist):
    # Create the P(label) distribution
    label_probdist = estimator(label_freqdist)
    # Create the P(fval|label, fname) distribution
    feature_probdist = {}
    return NaiveBayesClassifier(label_probdist, feature_probdist)

To save:

import pickle
f = open('my_classifier.pickle', 'wb')
pickle.dump(classifier, f)
f.close()

稍后加载：

import pickle
f = open('my_classifier.pickle', 'rb')
classifier = pickle.load(f)
f.close()

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

machinelearning

Classification

NLTK

naivebayes

将朴素贝叶斯训练分类器保存在 NLTK 中的相关文章

将 yerr/xerr 绘制为阴影区域而不是误差线

在 matplotlib 中如何将误差绘制为阴影区域而不是误差条例如而不是忽略示例图中各点之间的平滑插值这需要进行一些手动插值或者只是获得更高分辨率的数据您可以使用pyplot fill between https matpl
如何删除 PyCharm 中的项目？

如果我关闭一个项目然后删除该项目文件夹则在 PyCharm 重新启动后会再次创建一个空的项目文件夹只需按顺序执行以下步骤即可他们假设您当前在 PyCharm 窗口中打开了该项目单击文件 gt 关闭项目关闭项目在 PyCha
从字典的元素创建 Pandas 数据框

我正在尝试从字典创建一个 pandas 数据框字典设置为 nvalues y1 1 2 3 4 y2 5 6 7 8 y3 a b c d 我希望数据框仅包含 y1 and y2 到目前为止我可以使用 df pd DataFrame fr
McNemar 在 Python 中的测试以及分类机器学习模型的比较 [关闭]

Closed 此问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案有没有用 Python 实现的好的 McNemar 测试我在 Scipy stats 或 Scikit
如何在python中附加两个字节？

说你有b x04 and b x00 你如何将它们组合起来b x0400 使用Python 3 gt gt gt a b x04 gt gt gt b b x00 gt gt gt a b b x04 x00
指示电子邮件的类型

我有以下自动化程序它将电子邮件发送给我自己并添加了特定的链接 import win32com client as win32 import easygui import tkinter as to from tkinter import
使用 Python 3 动态插入到 sqlite

我想使用 sqlite 写入多个表但我不想提前手动指定查询有数十种可能的排列例如 def insert sqlite tablename data list global dbc dbc execute insert into tab
为什么第二个 request.session cookies 返回空？

我想使用 requests Session post 登录网站但是当我已经登录主页然后进入帐户页面时看来cookies还没有保存因为cookies是空的而且我无法进入正确的帐户页面 import requests from bs4
如何获取numpy.random.choice的索引？ - Python

是否可以修改 numpy random choice 函数以使其返回所选元素的索引基本上我想创建一个列表并随机选择元素而不进行替换 import numpy as np gt gt gt a 1 4 1 3 3 2 1 4 gt gt
将 pandas 剪切操作转换为常规字符串

我明白了 pandas cut 操作的输出 0 0 20 1 0 20 2 0 20 3 0 20 4 0 20 5 0 20 6 0 20 7 0 20 8 0 20 9 0 20 如何将 0 20 转换为 0 20 我正在这样做 str
如何将 sql 数据输出到 QCalendarWidget

我希望能够在日历小部件上突出显示 SQL 数据库中的一天就像启动程序时突出显示当前日期一样在我的示例中它是红色突出显示我想要发生的是当用户按下突出显示的日期时数据库中日期旁边的文本将显示在日历下方的标签上这是我使用 QT De
Python MySQL 操作错误：1045，“用户 root@'localhost' 的访问被拒绝

我试图通过以下方式从我的 python 程序访问数据库 db mysql connect host localhost user Max passwd maxkim db TESTDB cursor db cursor 但是我在第一行代码
如何在 Django Rest 框架中编写“删除”操作的测试

我正在为 Django Rest Framework API 编写测试我一直在测试删除我对创建的测试工作正常这是我的测试代码 import json from django urls import reverse from re
为什么在Python解释器中输入_会返回True？ [复制]

这个问题在这里已经有答案了我的翻译行为非常奇怪 gt gt gt True gt gt gt type True
检索 geodjango 多边形对象的边界框

如何在 geodjango 中获取 MultiPolygon 对象的边界框在 API 中找不到任何内容http geodjango org docs geos html http geodjango org docs geos html
使用seaborn绘制简单线图

我正在尝试使用seaborn python 绘制ROC曲线对于 matplotlib 我只需使用该函数plot plt plot one minus specificity sensitivity bs where one minus s
如何通过函数注释指示函数需要函数作为参数，或返回函数？

您可以使用函数注释 http www python org dev peps pep 3107 在python 3中指示参数和返回值的类型如下所示 def myfunction name str age int gt str return
在 numpy 中连接维度

我有x 1 2 3 4 5 6 7 8 9 10 11 12 shape 2 2 3 I want 1 2 3 4 5 6 7 8 9 10 11 12 shape 2 6 也就是说我想连接中间维度的所有项目在这种特殊情况下我可以得到这
在matlab中，如何读取python pickle文件？

在 python 中我生成了一个 p 数据文件 pickle dump allData open myallData p wb 现在我想在Matlab中读取myallData p 我的Matlab安装在Windows 8下其中没有Pyt
描述符“join”需要“unicode”对象，但收到“str”

代码改编自here http wiki geany org howtos convert camelcase from foo bar to Foo Bar def lower case underscore to camel case s

随机推荐

如何记录作为参数的闭包的参数

我尝试记录函数的闭包参数 sends the request out Parameter pzurl request description including url method formdata Parameter responseP
Java正则表达式提取带或不带引号的字段

我正在尝试以两种基本形式从长字符串中提取键值对一种带引号一种不带引号例如 a First Field b SecondField 使用Java正则表达式 b a b s s b 但是运行以下测试代码 public static vo
如何确保特征等距保持等距？

我目前正在调查Eigen Isometry3f 定义为typedef Transform
不使用 EOF 位作为我们的流提取条件的真正原因是什么？

Inspired by my previous question https stackoverflow com q 14591203 150634 新 C 程序员的一个常见错误是从文件中读取以下内容 std ifstream file f
Jquery中的asp标签文本更改事件

当asp标签的值发生变化时如何触发jquery方法我已经尝试过这个但它不起作用 lbladdsupplier change function alert Changed The change仅当表单元素值更改时才会触发事件在这种情况下
用于编码 RGB 值的位移位和按位运算

我想将 RGB 颜色编码为单个整数值假设编码算法如下 int code blue 256 256 green 256 red 如何使用位移位和或按位运算符对 RGB 分量进行编码解码 int blueMask 0xFF0000 gre
使用 pandas 从每组中随机选择一行

我有一个熊猫数据框df显示如下 Month Day mnthShape 1 1 1 016754224 1 1 1 099451003 1 1 0 963911929 1 2 1 016754224 1 1 1 099451003 1 2
将 SPSS 元数据变量标签、值标签、数据类型等导出到自定义文本文件

我们有一个很大的 SPSS 文件大小为 5MB 包含大约 1400 个变量我们正在将所有内容迁移到数据库为了配置表格和表单等我们需要 SPSS 文件中的元数据但采用特定的自定义格式所以如果变量视图是这样的 Name Label
如何配置 Sphinx 有条件地排除某些页面？

使用 Sphinx 生成文档时我希望能够生成文档的两个版本一个包含所有内容另一个仅包含一组特定的页面实现这一目标的最佳方法是什么我可以编写一个构建脚本来移动文件来实现此目的但如果有一种方法可以告诉 sphinx 在特定构建期间排
更改密码后显示消息吗？

我正在使用默认更改密码机制 https docs djangoproject com en dev topics auth django contrib auth views password change由 django 提供我在用着p
结账开始观察者

Magento 中是否有观察者来检测结帐过程的开始这将包括点击页面checkout onepage or checkout onestepcheckout 如果可能的话我想避免覆盖控制器每个控制器操作都会导致多个目标事件被触发Mage
ajax 问题 - firebug 中的 200 OK 但没有响应正文的红色消息

据我所知我有与跨域相关的 ajax 小问题在本地机器上我用一些ajax创建了html示例在注册文本字段中用户输入用户名每次击键时 ajax 都会将其发送到本地 Tomcat servlet 检查该用户名是否已被使用并发回已
TypeError;Article.find() 不是 Sails.js 中的函数

我正在使用 sails js 并收到错误 Articles find is not a function 以下是datastore js mongodb adapter require sails mongo url mongodb loc
如何对没有分支文件夹的 TFS Team 项目进行分支

我有一个这样的团队项目 DefaultCollection Project 1 Project 2 Project 3 Somefile txt Somefile2 doc 所有文件和项目都位于团队项目的根目录中我没有主干和分支文
使用 WordPress 高级自定义字段时“url”的字符串偏移量非法

我正在将 Bootstrap 模板转换为 WordPress 主题对于自定义字段我正在使用该插件高级自定义字段 https wordpress org plugins advanced custom fields 问题是当我尝试在以下命
使用多个 OR || 简化 IF 语句相同变量的条件

这是我的代码 var something four if something one something two something three something five something six something seven do
使用@staticmethod 有什么好处吗？

我想知道您是否在代码中使用 staticmethod 装饰器就我个人而言我不使用它因为写 staticmethod 比写 self 需要更多的字母使用它的唯一好处对我来说可能是代码更加清晰但由于我通常为 sphinx 编写方法
C++ 程序无法使用 Clang 和 Visual Studio 2010 Express 进行编译

我正在尝试使用 Visual C 2010 Express 编译本教程中所述的源代码 http kevinaboos wordpress com 2013 07 23 clang tutorial part ii libtooling ex
如何以编程方式找出机器的上次登录时间？

我想 a 以编程方式和 b 远程查找用户成功登录 Windows 计算机的最后日期时间通过远程桌面或控制台我愿意采用任何典型的 Windows 语言 C C VB 批处理文件 JScript 等但任何解决方案都很好尝试这个 pub
将朴素贝叶斯训练分类器保存在 NLTK 中

我对如何保存经过训练的分类器有点困惑例如每次我想使用分类器时重新训练它显然非常糟糕且缓慢我如何保存它并在需要时再次加载它代码如下提前感谢您的帮助我正在使用 Python 和 NLTK 朴素贝叶斯分类器 classifier nl

将朴素贝叶斯训练分类器保存在 NLTK 中

将朴素贝叶斯训练分类器保存在 NLTK 中 的相关文章

随机推荐

热门标签

将朴素贝叶斯训练分类器保存在 NLTK 中的相关文章