python机器学习相关的操作 numpy，GridSearchCV（网格搜索）等

2023-11-16

numpy切片操作
 视频讲解
 numpy 简单入门
 GridSearchCV的简单使用视频讲解
 SVM参数优化
 metrics中的precision_score,recall_score,accuracy_score

import numpy as np
# genfromtxt是一种导入数据的方式，数据加载的时候能够处理丢失数据
data = np.genfromtxt("./data/spam.data",delimiter=" ")
# numpy的切片操作！！！
# 取行
# numpy的切片操作根普x通的列表不同，例如data[0,1]取的是第0行，1列的数据
# 而data[0:2:1]表示从第0行取到第1行,间隔为1
# data[[1,3,5]] 取 1 3 5 索引行
# 取列
# data[行,列]
# data[:,1]取第一列
# data[:,[1,2,3]]取1，2，3列
x = data[:,:-1] # 取除最后一列的所有数据
y = data[:,-1] # 取最后一列数据

关于GridSearch的使用和SVM交叉验证

if __name__ == '__main__':
    test_classifiers = ['NB', 'KNN', 'LR', 'RF', 'DT', 'SVM', 'GBDT']
    # 这里测试了朴素贝叶斯，k近邻，逻辑回归，随机森林，支持向量机等五种方法
    classifiers = {'NB': naive_bayes_classifier,
                   'KNN': knn_classifier,
                   'LR': logistic_regression_classifier,
                   'RF': random_forest_classifier,
                   'SVM': svm_classifier,
                   }
    print("训练集的规模：",x_train.shape)
    print("测试集的规模",x_test.shape)
    print("*"*28+"下面开始测试"+"*"*28)
    for classifier in classifiers:
        print("*"*28+classifier+"*"*28)
        time1 = time.time()
        test_model = classifiers[classifier](x_train,y_train)
        timeAll = time.time() - time1
        print("training time: %.4fs"%(timeAll))
        # 预测的数据
        predict = test_model.predict(x_test)
        '''
        精确率是针对我们预测结果而言的，它表示的是预测为正的样本中有多少是真正的正样本。
        那么预测为正就有两种可能了，一种就是把正类预测为正类(TP)，另一种就是把负类预测为正类(FP)
        也就是而召回率是针对我们原来的样本而言的，它表示的是样本中的正例有多少被预测正确了。
        那也有两种可能，一种是把原来的正类预测成正类(TP)，另一种就是把原来的正类预测为负类(FN)。
        其实就是分母不同，一个分母是预测为正的样本数，另一个是原来样本中所有的正样本数。
        讲解网站：https://www.zhihu.com/question/19645541
        '''
        # 可以用metrics来对测试数据的准确度等进行判断，其中 accuracy = model.score
        precision = metrics.precision_score(y_test,predict)
        recalll = metrics.recall_score(y_test,predict)
        print("精确率为：%.2f%% 召回率为：%.2f%%"%(precision*100,recalll*100))
        accuracy = metrics.accuracy_score(y_test,predict)
        print("准确率：%.2f%%  %.2f%%"%(accuracy*100,100*test_model.score(x_test,y_test))) # accuracy就是跟正确率一样

    # 这里是对SVM的交叉验证方法进行学习测试
    from sklearn.svm import SVC
    from sklearn.model_selection import GridSearchCV
    from sklearn.preprocessing import StandardScaler

    # 创建svm模型
    model = SVC(kernel='rbf',probability=True)
    # 进行标准化处理
    transfer = StandardScaler()
    x_train = transfer.fit_transform(x_train)
    x_test = transfer.transform(x_test)
    '''  !!!!注意这里是用网格搜索找出最优参数!!!!!   '''
    # 1.找出参数有可能的值，并写在param_grid字典当中
    C = []
    for i in range(-5,15+1,2):
        C.append(2**i)
    gama = []
    for i in range(-15,3+1,2):
        gama.append(2**i)
    param_grid = { 'C':C , 'gamma':gama}
    # 2.进行网格搜索,需要调用GridSearchCV
    grid_search = GridSearchCV(model,param_grid,cv=5,n_jobs=1,verbose=1) # 输出训练过程
    # 3.训练数据
    grid_search.fit(x_train, y_train)
    best_parameters = grid_search.best_params_
    # 4.可以输出最优参数下模型评分，最优模型，最优模型在第几个
    print("best_index",grid_search.best_index_)
    print("best_score",grid_search.best_score_)
    print("best_params", grid_search.best_params_)
    print("best_estimator",grid_search.best_estimator_)
    # 5.将最优参数写入模型当中
    model = SVC(kernel='rbf',probability=True,C=best_parameters['C'],gama = best_parameters['gama'])
    model.fit(x_train,y_train)
    predict = model.predict(x_test)
    # 当分类的y不止0 1的时候，也就是多任务分类。
    #可在添加 metrics.precision_score(x_test,predict,,average= 'macro')
    precision = metrics.precision_score(x_test,predict)
    recalll = metrics.recall_score(x_test,predict)
    accuracy = metrics.accuracy_score(x_test,predict)
    print("*"*28+"svm_cross_validation"+"8"*28)
    print("精确度：%.2f%%  召回率： %.2f%%"%(precision*100,recalll*100))
    print("准确度：%.2f%%"%(accuracy*100))

numpy.unique

在这里插入图片描述

pandas获取列名

获取pandas列名的几种方法

import pandas as pd

row = ["a","b","c"]
cols = ["琼楼","玉宇","飞天"]
df = pd.DataFrame(index=row,columns=cols)
print(type(df.columns.values))
print(df.columns.values)
if "琼楼" in df.columns.values:
    print("Yes")

pandas让内容全部显示

#显示所有列
pd.set_option('display.max_columns', None)

#显示所有行
pd.set_option('display.max_rows', None)

#设置value的显示长度为100，默认为50
pd.set_option('max_colwidth',100)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

python机器学习相关的操作 numpy，GridSearchCV（网格搜索）等的相关文章

由于“环境错误：[错误 13]：权限被拒绝：'usr/local/bin/f2py'”而无法安装软件包

我正在尝试在 macOS X 上安装 numpy 但执行命令后pip install numpy我收到错误环境错误错误13 权限被拒绝 usr local bin f2py 我如何解决它这对我有用 pip3 install user
相当于 java PBKDF2WithHmacSHA1 的 Python

我的任务是构建一个 API 的使用者该 API 需要带有 UNIX 时间种子值的加密令牌我看到的示例是使用我不熟悉的 Java 实现的在阅读文档和其他堆栈文章后一直无法找到解决方案使用javax crypto SecretKey j
使用 Python 或 Django 处理收到的电子邮件？

我了解如何通过 Django 发送电子邮件但我希望用户能够回复电子邮件如果他们发送以及我收到的电子邮件包含与某个字符串匹配的消息我将调用一个函数我已经做了一些谷歌搜索但除了自己制作脚本之外似乎没有什么好的解决方案如果有什么东
Python BS4 Scraper 仅返回每个页面的前 9 个结果

我让这段代码按预期工作只是它并没有完全按预期工作一切似乎都很顺利直到我检查了我的 csv 输出文件并注意到我每页只得到前 9 个结果每页应该有 40 个结果因此我得到的结果少于预期的 25 有什么想法吗 import reques
为什么 python 允许没有“pass”语句的空函数（带有文档字符串）主体？

class SomeThing object Represents something def method one self This is the first method will do something useful one da
如何计算总和的平方和？

我有一笔款项需要加快处理速度在一种情况下是 S x y k l Fu ku Fv lv Fx kx Fy ly 另一种情况是 S x y S k l Fu ku Fv lv Fx kx Fy ly 2 注意 S indices 是这些索引
无法在 python 中导入名称 GoogleMaps

我使用下面的代码来获取地址的纬度和经度 from googlemaps import GoogleMaps gmaps GoogleMaps api key address Constitution Ave NW 10th St NW Wa
防止脚本目录被添加到Python 3中的sys.path

有没有办法阻止脚本的目录被添加到python3中的sys path 由于导入在 python 中是相对的因此我遇到了导入冲突我正在处理的一个遗留项目有一个名为logger py在与内置冲突的脚本的根目录中logger 我使用的自定义构建
动态添加jinja模板

我有一个 jinja 模板它是一组 div 标签内的唯一内容 div include temppage html div 当我按下按钮时我想用其他内容替换标签之间的所有内容我希望用另一个 jinja 模板 include realpa
在 pandas 数据框中按列应用 Seaborn 热图

我试图在枢轴熊猫数据帧上使用seaborn的热图就像在超链接中一样有效 df pd DataFrame np random randint 1 100 size 3 2 df columns A B df sns heatmap df a
使用 Python-AppKit-Objective C 转换为预组合 Unicode 字符串

苹果公司的这份文件技术问答 QA1235 http developer apple com qa qa2001 qa1235 html描述了一种将 unicode 字符串从组合版本转换为分解版本的方法由于我对包含某些字符例如重音符号的
python 中的子进程调用以使用 JAVA_OPTS 调用 java jar 文件

示例代码 import subprocess subprocess call java jar temp jar 如何在上面的命令中指定JAVA OPTS 当我使用上述命令时我收到 java lang OutOfMemoryError 无
Flask-Mail - 基于 Flask-Cookiecutter 异步发送电子邮件

我的烧瓶项目基于烧瓶饼干切割机 https github com sloria cookiecutter flask我需要异步发送电子邮件发送电子邮件的功能由以下配置米格尔的教程 https blog miguelgrinberg com
构建一个简单的解析器，能够使用 PyParse 解析不同的日期格式

我正在构建一个简单的解析器它接受如下查询显示 fizi 从 2010 年 1 月 1 日到 2006 年 2 月 11 日的提交到目前为止我有 class QueryParser object def parser self stmn
通过Python通过蓝牙发送消息或数据

如何通过 python 通过蓝牙发送消息而无需输入数字等密钥身份验证我用过 pybluez 但我收到了这个错误 File send line 12 in
如何编辑 QProgressBar 的样式表

我无法在我的应用程序中编辑进度条的颜色仅编辑文本颜色 pyhton 3 9 PySide6 QT Creator 7 0 2 Python应用程序 https i stack imgur com 6hKFI png import sys
在 Python 中进行模糊键查找的最佳方法？

我遇到一个问题我需要在哈希映射中进行模糊查找即返回与最接近查询的键相对应的值在我的例子中是通过 Levenshtein 距离测量的我目前的方法是子类化dict使用特殊的查找方法计算所有键的编辑距离然后返回得分最低的键的值基本上是
用于 OAuth 身份验证的 WSGI 中间件

我使用构建了一个非常小的网络应用程序Flask http flask pocoo org 现在我想向网站添加非常基本的身份验证我不需要授权由于 Flask 不支持开箱即用的 auth auth 我想插入 WSGI 中间件来完成这项工作
如何在 Python 中将 .docx 转换为 .txt

我想将大量 MS Word 文件转换为纯文本格式我不知道如何在 Python 中做到这一点我在网上找到了以下代码我的路径是本地路径所有文件名都类似于 cx xxx 即 c1 000 c1 001 c2 000 c2 001 等 fr
使 flake8 区分未定义函数和星型导入

我有一个相当大的项目我试图在发布之前清理它但是当我运行 flake8 时我得到了大量的 F405

随机推荐

Linux和Windows下使用Syslog库

本文档描述如何在Windows和Linux下使用Syslog库在Linux下GNU库中已经自带有syslog库但是在Windows下的标准库中没有syslog库从网上可以找到syslog的开源代码实现接口函数基本上与Linux一致
高精度运算c++

高精度运算c 前言加法减法乘法除法求余全部代码完前言采用c 的stl库实现高精度的加减乘除以及求余运算希望可以帮助到大家加法 string add big string a string b string 加 str
String和基本数据类型的比较方式

package com test author xlj 简单的比较方式 public class Test public static void main String args System out println 192 168 101
springboot项目启动时:Failed to retrieve application JMX service URL

application properties配置有问题检查即可
Cannot find any provider supporting AES/CBC/PKCS5Padding

1 出现的问题 java lang RuntimeException java security NoSuchAlgorithmException Cannot find any provider supporting AES CBC PK
Elastic Search 安装部署最全教程（Docker）

一部署单点ES 1 首先创建网络因为我们还需要部署kibana容器因此需要让es和kibana容器互联这里先创建一个网络 docker network create es net 2 加载镜像 docker pull elastic
刀片服务器如何增加硬盘,IBM为刀片服务器添加新SAS及固态硬盘

在调整过X64产品线后我们又收到IBM将为服务器产品线添加新SAS硬盘及固态硬盘的消息上周IBM刚发布了一款小尺寸的SAS硬盘它只有2 5英寸而之前的硬盘基本上都是3 5英寸的SCSI硬盘因为IBM拥有世界上最好的硬盘研究和生产工
疯壳4900、7072心率血压血氧心电四合一智能手表&模组电容触摸实现

触摸该手表的触摸是由RH6015C触摸IC完成的该IC是一款内置稳压模块的单通道电容式触摸感应控制开关 IC 可以替代传统的机械式开关 RH6015可在有介质如玻璃亚克力塑料陶瓷等隔离保护的情况下实现触摸功能安全性高 RH6
delete 和 delete []的真正区别

c 中对new申请的内存的释放方式有delete和delete 两种方式到底这两者有什么区别呢 1 我们通常从教科书上看到这样的说明 delete 释放new分配的单个对象指针指向的内存 delete 释放new分配的对象数组指针指向的内
ubuntu下解决wps2019缺少字体问题

准备字体包链接 https pan baidu com s 1rsqn3CY SWS KWaKc0w83g 提取码 h9cs 复制解压后的wps symbol fonts zip到 home usr share fonts下 sudo
西门子PLC—用 SCL 编写你的第一个 TIA 代码

前言使用梯形图编写程序时博途编辑器是通过网络段把程序分成一段一段的编辑器可以插入若干个网络段每一个网络段可以有各自的注释而SCL是文本语言不分网络段在LAD FBD语言内增加SCL的除外这就需要需要用其他的方法来解决程序
面试总结大全

预定义变量 0 脚本名所有的参数所有的参数参数的个数当前进程的PID 上一个后台进程的PID 上一个命令的返回值 0表示成功 for 循环次数是固定的 for i in 取值范围 1 20 zhangsan lisi wanger
牛客网——华为题库(41~50)

华为题库 41 称砝码 42 学英语 43 迷宫问题 44 Sudoku 45 名字的漂亮度 46 截取字符串 48 从单向链表中删除指定值的节点 50 四则运算 41 称砝码 include
C++通过回车结束循环输入

试想一个案例假设需要你输入n行数字而每一行输入的数字数量都未知不定如何通过C 来实现这一操作本贴笔者给出一个具体案例首先规定输入的行数而后在每一行输入不定量的数字最后将每一个数字对应的值以及与其匹配的行数输出例如输入
实战07- 模型融合：利用AdaBoost元算法提高分类性能

元算法 meta algorithm 是对其他算法进行组合的一种方式即模型融合模型融合主要分为三种 Bagging Boosting和Stacking 思想将弱分类器融合成强分类器融合后比最强的弱分类器更好视频导学 https w
什么是高防CDN,高防CDN是如何防御网络攻击的呢?

高防CDN是一种新型的网络构建法式 N是构建在现有网络基础之上的智能虚拟网络依靠部署在各地的边缘服务器通过中心平台的负载均衡内容分发调度等功能模块使用户就近获取所需内容降低网络拥塞提高用户访问响应速度和命中率 CDN的关键技术
tensorflow2.1.0安装

原来一直用1 x的tf 最近安装2 初始源error无法安装下载本地包后换清华源之类的 channels defaults show channel urls true default channels https mirrors tu
机器学习(一)

文章目录人工智能人工智能的诞生人工智能的发展历程人工智能与机器学习的关系机器学习机器学习的发展历程讨论机器学习的必要性机器学习的定义机器学习的三要素机器学习的基本概念作业人工智能人工智能的诞生人工智能诞生于一群
Spring Boot项目中使用 TrueLicense 生成和验证License（服务器许可）

一简介 License 即版权许可证一般用于收费软件给付费用户提供的访问许可证明根据应用部署位置的不同一般可以分为以下两种情况讨论应用部署在开发者自己的云服务器上这种情况下用户通过账号登录的形式远程访问因此只需要在账号登录的时
python机器学习相关的操作 numpy，GridSearchCV（网格搜索）等

numpy切片操作视频讲解 numpy 简单入门 GridSearchCV的简单使用视频讲解 SVM参数优化 metrics中的precision score recall score accuracy score import nump

python机器学习相关的操作 numpy，GridSearchCV（网格搜索）等

关于GridSearch的使用和SVM交叉验证

numpy.unique

pandas获取列名

pandas让内容全部显示

python机器学习相关的操作 numpy，GridSearchCV（网格搜索）等 的相关文章

随机推荐

热门标签

python机器学习相关的操作 numpy，GridSearchCV（网格搜索）等的相关文章