伯努利朴素贝叶斯在 NLTK 和 scikit-learn 中的结果不同

2023-12-01

使用 NLTK 中的伯努利朴素贝叶斯算法和 scikit-learn 模块中的伯努利朴素贝叶斯算法对文本进行分类（仅分为两类）时，我得到了完全不同的结果。尽管两者的总体准确度相当（尽管远非相同），但 I 类和 II 类错误的差异很大。特别是，NLTK 朴素贝叶斯分类器给出的 I 类错误多于 II 类错误，而 scikit-learn 则相反。这种“异常”似乎在不同的特征和不同的训练样本中是一致的。是否有一个原因？这两者哪个更值得信赖呢？

NLTK 不实现伯努利朴素贝叶斯。它实现了多项式朴素贝叶斯，但只允许二进制特征。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

伯努利朴素贝叶斯在 NLTK 和 scikit-learn 中的结果不同的相关文章

词干函数错误：词干需要一个位置参数

这里的stem函数显示错误指出stem需要循环中的一个位置参数如所讨论的 from nltk stem import PorterStemmer as ps text my name is pythonly and looking fo
Python Sci-Kit 学习：多标签分类 ValueError：无法将字符串转换为浮点数：

我正在尝试使用 scikit learn 0 17 进行多标签分类我的数据看起来像 training Col1 Col2 asd dfgfg 1 2 3 poioi oiopiop 4 test Col1 asdas gwergwger
每次使用 scikit 运行线性回归时都会得到不同的结果

您好我有一个正在尝试优化的线性回归模型我正在优化指数移动平均线的跨度以及回归中使用的滞后变量的数量然而我不断发现结果和计算的均方误差不断得出不同的最终结果不知道为什么有人可以帮忙启动循环后的流程 1 使用三个变量创建新的数据框
Python：UnicodeDecodeError：“utf8”编解码器无法解码字节

我正在将一堆 RTF 文件读入 python 字符串中在某些文本上我收到此错误 Traceback most recent call last File 11 08 py line 47 in
如何在 nltk 中使用 hunpos 标记文本文件？

有人可以帮我解决在 nltk 中标记语料库的 hunpos 语法吗我要导入什么hunpos HunPosTagger module http nltk googlecode com svn trunk doc api nltk tag h
将 python NLTK 解析树保存到图像文件[重复]

这个问题在这里已经有答案了这可能会复制这个 stackoverflowquestion https stackoverflow com questions 23429117 saving nltk drawn parse tree to
ImageDataGenerator 预测类 - 为什么预测未正确从概率转换为预测类？

我有一个这样设置的目录 images val class1 class2 test all classes train class1 class2 每个目录中都有一组图像我想预测测试中的每个图像是否属于 1 类或 2 类我写这个是为了读
将 python scikit learn 模型导出到 pmml

我想将 python scikit learn 模型导出到 PMML 中什么 python 包最适合我读到Augustus https github com opendatagroup augustus 但我找不到任何使用 scikit
如何下载 NLTK 数据？

更新的答案 NLTK 适用于 2 7 我有3 2 我卸载了3 2并安装了2 7 现在可以了我已经安装了 NLTK 并尝试下载 NLTK 数据我所做的是按照该网站上的说明进行操作 http www nltk org data html h
是否可以使用 Google BERT 来计算两个文本文档之间的相似度？

是否可以使用 Google BERT 来计算两个文本文档之间的相似度据我了解 BERT 的输入应该是有限大小的句子一些作品使用 BERT 来计算句子的相似度例如 https github com AndriyMulyar semant
NLTK 中的 wordnet lemmatizer 不适用于副词 [重复]

这个问题在这里已经有答案了 from nltk stem import WordNetLemmatizer x WordNetLemmatizer x lemmatize angrily pos r Out 41 angrily 这是 nl
导入错误：无法导入名称“_print_elapsed_time”

你好我正在尝试使用 sklearn 中的 make pipeline 模块但是当我尝试使用以下命令导入它时 from sklearn pipeline import make pipeline 我收到此错误 ImportError ca
如何使用sklearn Pipeline和FeatureUnion选择多个（数字和文本）列进行文本分类？

我开发了一个用于多标签分类的文本模型这OneVsRest分类器 http scikit learn org stable modules generated sklearn multiclass OneVsRestClassifier h
R.scale() 和 sklearn.preprocessing.scale() 之间的区别

我目前正在将数据分析从 R 转移到 Python 当在 R 中缩放数据集时我将使用 R scale 根据我的理解它将执行以下操作 x mean x sd x 为了替换该函数我尝试使用 sklearn preprocessing sca
使用 scikit 包在 Python 中绘制集群区域的边界

这是我处理 3 个属性 x y 值中的数据聚类的简单示例每个样本代表其位置 x y 及其所属变量我的代码发布在这里 x np arange 100 200 1 y np arange 100 200 1 value np random
scikit-learn 和tensorflow 有什么区别？可以一起使用它们吗？

对于这个问题我无法得到满意的答案据我了解 TensorFlow是一个数值计算库经常用于深度学习应用而Scikit learn是一个通用机器学习框架但它们之间的确切区别是什么 TensorFlow 的目的和功能是什么我可以一起使用它
使用 NLTK 在 Python 中获取大量名词（或形容词）；或 Python Mad Libs

Like 这个问题 https stackoverflow com questions 7439555 noun adjective etc word lists or dictionaries common words 我有兴趣按词性获取
如何在sklearn管道中通过特征消除选择特征名称？

我在 sklearn 管道中使用递归特征消除管道看起来像这样 from sklearn pipeline import FeatureUnion Pipeline from sklearn import feature selection
pydev 调试器：严重警告：此版本的 python 似乎编译不正确（内部生成的文件名不是绝对的）[重复]

这个问题在这里已经有答案了通过运行 from sklearn datasets import fetch california housing import pandas as pd pd set option precision 4 m
具有定制损失函数的随机森林

我是机器学习领域的初学者对于一个项目我必须在随机森林分类中使用自定义损失函数到目前为止我一直使用 scikit 通过 scikit 实现这一点的建议会更有帮助损失函数分类树中的基尼杂质和熵在 scikit 的 tree pyx

随机推荐

如何从通过 XMLHttpRequest 接收的 html 页面创建 DOM 对象？

我正在开发一个 chromium 扩展因此我对我请求权限的域具有 XMLHttpRequests 的跨主机权限我使用了 XMLHttpRequest 并获得了一个 HTML 网页 txt html 我想使用 XPath document
Angular UI-Router 模式删除父状态

我正在开发一个具有 ui router 模块的角度应用程序当进入路由器的某种状态时我会显示一个模式对话框然后它会替换我的父视图我想保留父视图并将模式显示为叠加有没有办法用 ui router 做到这一点举个例子 statePro
iOS (FMX) 上的“保存到文件”

我想将电子邮件附件保存到我的应用程序的文档文件夹适用于 iOS 和 Android 的 C FMX 应用程序如何将我的应用程序注册为目标下面的屏幕截图显示我手机上名为 Termius 的应用程序是保存文件的目标我希望我的应用程序成为
有没有办法在chrome自定义选项卡中加载html内容

是否可以使用 android 中的 chrome 自定义选项卡加载本地 html 内容网上查了没找到解决办法谁能帮忙啊无法使用 Chrome 自定义选项卡直接加载 HTML 内容但您可以尝试将内容保存到本地文件并提供 file UR
无法在 Mac OS X 上安装 MySQL

我遇到了这个问题中描述的确切问题 MYSQL安装问题不幸的是没有一个答案对我有帮助并且它已关闭我尝试学习 Ruby on Rails 但没有让 MySQL 工作所以它与编程相关我输入 rake db create并得到 The
如何在android中方向改变时继续视频播放

我使用 videoview 在 android 默认播放器中播放视频当我改变它的方向时它从头开始播放我怎样才能让它从方向改变的那一点继续下去 Add
代码隐藏检查以查看控件是否已设置为显示：无？

我目前有一个隐藏在我的服务器端的控件dropdown hide hide 是我创建的用于隐藏我的方法的服务器端方法例如 control Style display none 在服务器端如何判断我的控件是否隐藏我猜你的意思不仅仅是做 if
无法使用preparedStatement创建表

我无法使用以下命令在数据库 mySQL 中创建表preparedStatement并尝试输入未来表的名称preparedStatement setInteger static String queryCreateTable CREATE T
在 ReportNG 中未获取 TestNG 的报告

我正在 eclipse 中执行 testng 我想在 reportNG 中生成报告为此我已经包含了 guice 3 0 reportng 1 1 3 velocity dep 1 4 jar 文件并在 xml 文件中添加了侦听器此外
jQuery 通过按钮 onclick 跳转或滚动到页面上的特定位置、div 或目标 [重复]

这个问题在这里已经有答案了当我单击按钮时我希望能够向下跳转或滚动到页面上的特定 div 或目标 clickMe click function jump to certain position or div or target on th
如何定义实例？

我在面试中被问到一个问题但我无法回答这是问题您将如何定义实例 c 我的回答是它是另一个名字object 这个问题的正确答案是什么实例之于类就像蛋糕之于菜谱一样每当您使用构造函数创建对象时您都在创建一个实例
用于 WSDL 和 BasicHttpBinding 的 F# 类型提供程序

当我在 C 中使用 WSDL 服务时我可以将两个参数传递给构造函数 BasicHttpBinding 和 EndpointAddress BasicHttpBinding basicHttpBinding new BasicHttpBin
PHP Artisan Tinker 无法与 Laravel 5.5.16 一起使用

我运行 php artisantinker 但它不起作用它只显示这样的消息 c xampp htdocs app tpa gt php artisan tinker 错误异常 rmdir C Users KIMUNG 1 AppData L
如何使用 JavaScript Regex 提取字符串？

我正在尝试使用 JavaScript 正则表达式从文件中提取子字符串这是文件中的一个片段 DATE 20091201T220000 SUMMARY Dad s birthday 我要提取的字段是摘要方法如下 extractSummar
Mac Lion 10.8 的 XAMPP 上的 Php-intl 安装

大家好我正在尝试在 Mac 版 xampp 上安装 intl 库我已经安装了 php 5 3 所以我只是将 intl so 文件从 php 5 3 位置复制到 Xampp bin 文件夹之后我取消注释 extension intl s
Java 中的静态泛型字段

我将通过传递通用字段演示者来实现片段的初始化然后将此演示者连接到创建的视图 public class BaseViewFragment p extends Fragment implements BaseView static pri
在 Access 查询中调用 VBA 函数

我正在尝试将 8 个不同查询的结果合并回一个查询中所有要使用的查询都是查询的查询的查询的查询的查询 8 个系列的 4 个查询根据玩家打了多少轮高尔夫球将他们分开每个系列中的最后一个查询计算每个玩家的确切让分我正在使用的代码可能无法实现
Python 脚本在运行过程中速度变慢？

我正在运行一个具有以下基本结构的模拟 from time import time def CSV args write args to CSV file return def timeleft a L period print detail
3D 游戏对象的级联效果（Tango、Unity、Android）

我正在开始使用 Unity 为 Android 构建 Tango 应用程序我以前有过 Unity 和 Android 经验但对 Tango 还很陌生我遵循了这些指南 https developers google com tango
伯努利朴素贝叶斯在 NLTK 和 scikit-learn 中的结果不同

使用 NLTK 中的伯努利朴素贝叶斯算法和 scikit learn 模块中的伯努利朴素贝叶斯算法对文本进行分类仅分为两类时我得到了完全不同的结果尽管两者的总体准确度相当尽管远非相同但 I 类和 II 类错误的差异很大特别是

伯努利朴素贝叶斯在 NLTK 和 scikit-learn 中的结果不同

伯努利朴素贝叶斯在 NLTK 和 scikit-learn 中的结果不同 的相关文章

随机推荐

热门标签

伯努利朴素贝叶斯在 NLTK 和 scikit-learn 中的结果不同的相关文章