使用NaiveBayes算法的同时如何使用One-hot Encode？

2024-02-27

我正在尝试使用朴素贝叶斯算法来满足我的要求之一。在此，我计划对超平面使用“One-hot Encode”。我使用以下代码来运行我的算法。但是，我不确定如何使用“One-hot Encode”。

请找到下面的代码：

from sklearn.preprocessing import MultiLabelBinarizer
from sklearn.model_selection import train_test_split
from sklearn.naive_bayes import BernoulliNB
from sklearn.metrics import confusion_matrix

def load_data(filename):

    x = list()
    y = list()
    with open(filename) as file:
        file.readline()
        for line in file:
            line = line.strip().split(',')
            y.append(line[1])
            x.append(line[0].split())

    return x, y

X_train, y_train = load_data('/Users/Desktop/abc/train.csv')
X_test, y_test = load_data('/Users/Desktop/abc/test.csv')

onehot_enc = MultiLabelBinarizer()
onehot_enc.fit(X_train)


bnbc = BernoulliNB(binarize=None)
bnbc.fit(onehot_enc.transform(X_train), y_train)

score = bnbc.score(onehot_enc.transform(X_test), y_test)
print("score of Naive Bayes algo is :" , score)

谁能建议我上面编写的代码是否正确？

尝试使用计数向量化器 http://scikit-learn.org/stable/modules/generated/sklearn.feature_extraction.text.CountVectorizer.html

from sklearn.feature_extraction.text import CountVectorizer

clf = CountVectorizer()
X_train_one_hot =  clf.fit(X_train)
X_test_one_hot = clf.transform(X_test)

bnbc = BernoulliNB(binarize=None)
bnbc.fit(X_train_one_hot, y_train)

score = bnbc.score(X_test_one_hot, y_test)
print("score of Naive Bayes algo is :" , score)

您也可以尝试使用Tfidf向量化器 http://scikit-learn.org/stable/modules/generated/sklearn.feature_extraction.text.TfidfVectorizer.html如果您要使用文本的 TfIdf 特征化。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

scikitlearn

使用NaiveBayes算法的同时如何使用One-hot Encode？的相关文章

使用 Python Multiprocessing Pool.map() 的问题在 Python 3.7.2 中变得棘手，但在 3.6.2 中很快完成

我刚刚将Python从3 6 2 gt 3 7 2并且遇到了问题multiprocessing图书馆我在 Django 应用程序中使用它该应用程序在工作函数中使用 Django 特定的函数见下文在我的代码中我有以下内容 impor
为什么 Python 在导入脚本时只保存脚本的字节码？

既然执行Python字节码会比运行原始源代码更快因为Python不需要重新编译为什么Python在导入脚本时只保存编译后的字节码呢为每个执行的脚本保存 pyc 文件不是更好吗无论如何 Python 解释器的启动时间都需要时间即使您
为什么需要在 Python 方法中显式使用“self”参数？ [复制]

这个问题在这里已经有答案了当在 Python 中的类上定义方法时它看起来像这样 class MyClass object def init self x y self x x self y y 但在其他一些语言中例如 C 您可以使用
如果 Excel 文件是由程序创建的，Pandas read_excel 对于具有简单公式的单元格返回 nan [重复]

这个问题在这里已经有答案了 I use pd read excel读取由以下命令创建的 excel 文件openpyxl并从一个网址下载解析后的数据框将给出nan如果单元格值是公式 which formula is simply 100
Python 转换矩阵

我有一个如下所示的列表 2 1 3 1 2 3 1 2 2 2 我想要的是一个转换矩阵它向我显示如下序列 1 后跟 1 的频率是多少 1 后面跟着 2 的频率是多少 1 后跟 3 的频率是多少 2 后跟 1 的频率是多少 2 后跟 2 的
查找正在导入哪些 python 模块

从应用程序中使用的特定包中查找所有 python 模块的简单方法是什么 sys modules是将模块名称映射到模块的字典您可以检查其键以查看导入的模块 See http docs python org library sys html
ValueError：数据必须为正（boxcox scipy）

我正在尝试将我的数据集转换为正态分布 0 8 298511e 03 1 3 055319e 01 2 6 938647e 02 3 2 904091e 02 4 7 422441e 02 5 6 074046e 02 6 9 265747e
正在使用 PIL 保存损坏的图像

我遇到一个问题操作图像像素导致保存损坏的图像因此我使用 PIL 打开图像然后将其转换为 NumPy 数组 image Image open myimage png np image np asarray image 然后我转置图像
高级描述熊猫

有没有像 pandas 那样更高级的功能通常我会继续这样 r pd DataFrame np random randn 1000 columns A r describe 我会得到一份很好的总结就像这样 A count 1000 000
为什么将模块级代码放入函数中然后调用该函数在Python中速度更快？

在亚历克斯马尔泰利的回应中使 Python 脚本面向对象 https stackoverflow com questions 1813117 making a python script object oriented 他提到在 Pyth
Seaborn 中没有线性拟合的散点图

我想知道是否有办法关闭seaborn中的线性拟合lmplot或者是否有一个等效函数可以生成散点图当然我也可以使用 matplotlib 但是我发现 seaborn 中的语法和美学非常吸引人例如我想绘制以下情节 import sea
如何按 pandas 中的值对系列进行分组？

我现在有一只熊猫Series与数据类型Timestamp 我想按日期对其进行分组并且每组中有许多行具有不同的时间看似显而易见的方法类似于 grouped s groupby lambda x x date 然而熊猫的groupby按索
从 wxPython 事件处理程序中调用函数

我正在努力寻找一种在 wxPython 事件处理函数中使用函数的方法假设我有一个按钮单击该按钮时它会使用事件处理程序运行一个名为 OnRun 的函数但是用户忘记单击 OnRun 按钮之前的 RadionButton 我想弹出一个
Python 2.7 缩进错误[关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案这个问题是由拼写错误或无法再重现的问题引起的虽然类似的问题可能是on topic help on topic在这里这个问题的解决方式不
Django 将 JSON 数据传递给静态 getJSON/Javascript

我正在尝试从 models py 中获取数据并将其序列化为views py 中的 JSON 对象模型 py class Platform models Model platformtype models CharField max len
python中有没有一种方法可以将存储在列表中的正则表达式模式列表应用到单个字符串？

我有一个正则表达式模式列表存储在列表类型中我想将其应用于字符串有谁知道一个好方法将列表中的每个正则表达式模式应用于字符串和如果匹配则调用与列表中该模式关联的不同函数如果可能的话我想用 python 来做这件事提前致谢 im
Python 相当于 Scala 案例类

Python 中是否有与 Scala 的 Case Class 等效的东西就像自动生成分配给字段而无需编写样板的构造函数一样当前执行此操作的现代方法从 Python 3 7 开始是使用数据类 https www python org
pandas.read_fwf 忽略提供的数据类型

我正在从文本文件导入数据框我想指定列的数据类型但 pandas 似乎忽略了dtype input 一个工作示例 from io import StringIO import pandas as pd string USAF WBAN S
为boost python编译的.so找不到模块

我正在尝试将 C 代码包装到 python 中只需一个类即可导出两个函数我编译为map so 当我尝试时import map得到像噪音一样的错误 Traceback most recent call last File
基于值的 matplotlib 条形图颜色

有没有一种方法可以根据条形图的值对条形图的条形进行着色例如 values below 0 5 red values between 0 5 to 0 green values between 0 to 08 blue etc 我找到了一些

随机推荐

[in .vbs][3in1] 创建多个文件夹 180 => 在所有 180 个文件夹中创建子文件夹 => 移动文件并重命名创建的子文件夹中的文件 [3in1] "x, y, z"

x y z 垂直水平移动和重命名文件我想组合 3in1 x y z vbs 在 vbs中摘要首先在这里阅读 x 尝试使用 VBScript 创建多个文件夹 https stackoverflow com questions 382
PHP strptime 格式错误？

我正在解决 php 5 2 6 问题我们使用的 API 以 DDMMYYYYHHMM 格式返回日期正是这种格式固定长度没有分隔符然而在我的实验中这种格式似乎破坏了 strptime 当我以这种格式向它提供日期时它会返回 fa
nginx.conf 重定向多个条件

我想使用 Nginx 在两个条件下重定向请求这不起作用 if host domain example host domain2 example rewrite http www domain example 1 permanent 这样做
处理应用程序：openURL：sourceApplication：在iOS应用程序中打开文件

我有一个应用程序它使用一些已知的大文件格式并且自 iOS4 时代起就支持 iOS 的打开方式功能直到最近某些应用程序例如 iOS 内置的邮件应用程序都运行良好可以通过在我的应用程序内的 Documents Inbox 目录
为什么在限定的从属名称之前需要关键字“typename”，而不是在限定的独立名称之前？

class A static int iterator class iterator 我想我明白原因typename这里需要 template
用 matplotlib 表示体素

在Python中给定一个N 1 x N 2 x N 3包含 0 或 1 的矩阵我会寻找一种方法将 3D 数据显示为N 1 x N 2 x N 3体积与 1s 位置处的体积像素体素例如如果 1s 的坐标是 1 1 1 4 1 2 3
如何检测IE11？

当我想检测 IE 时我使用以下代码 function getInternetExplorerVersion var rv 1 if navigator appName Microsoft Internet Explorer var ua
编辑 Excel 工作表的特定单元格

我有一个 Excel 工作簿我想使用 R 编辑填充其中的一些特定单元格而不更改任何格式到目前为止我已经尝试过XL连接包看起来它可以做我正在寻找的事情我只是没有找到办法做到这一点 My 直截了当解决问题的方法 wb lt load
使 C++ 类成为监视器（并发意义上）

我想确保一次只有一个线程可以运行我的 C 类的方法换句话说让班级表现得像Monitor http en wikipedia org wiki Monitor 28synchronization 29 是否有一种模式模板化方法可以做到这
带过滤器的 Spring data ElasticSearch 聚合

我正在尝试对按某些条件过滤的值执行聚合我也使用 Spring Data 的 ElasticSearchTemplate query 方法执行查询并在结果提取器中获取结果我正确地获得了命中即应用了过滤器并且仅检索与这些值匹配的文档但是
如何开始编写 Gnome Shell 扩展

我发现很难找到有关 Gnome Shell 扩展的文档我在 Gnome Wiki 上找到了一些内容而且是一级链接但并不多 http live gnome org GnomeShell Extensions http live gnom
我可以将 required 属性应用于 HTML 中的

使用NaiveBayes算法的同时如何使用One-hot Encode？

使用NaiveBayes算法的同时如何使用One-hot Encode？ 的相关文章

随机推荐

使用NaiveBayes算法的同时如何使用One-hot Encode？的相关文章