【模型评估与选择】sklearn.model_selection.train_test_split

2023-11-16

1. 描述
Split arrays or matrices into random train and test subsets

2. 语法
train_test_split(*arrays, **options)

3. 参数
1.*arrays:(sequence of indexables with same length / shape[0])
Allowed inputs are lists, numpy arrays, scipy-sparse matrices or pandas dataframes.
2.test_size :(float, int, or None, default None)
If float, should be between 0.0 and 1.0 and represent the proportion of the dataset to include in the train split.
If int, represents the absolute number of train samples.
If None, the value is automatically set to the complement of the test size.
3.random_state :(int, RandomState instance or None, optional (default=None))
If int, random_state is the seed used by the random number generator;
If None, the random number generator is the RandomState instance used by np.random.
4.shuffle :(boolean, optional (default=True))
Whether or not to shuffle the data before splitting.
If shuffle=False then stratify must be None.
5.stratify 分层:(array-like or None (default is None))
If not None, data is split in a stratified fashion, using this as the class labels.

4. 返回
splitting : list, length=2 * len(arrays)
List containing train-test split of inputs.
New in version 0.16: If the input is sparse, the output will be a scipy.sparse.csr_matrix. Else, output type is the same as the input type.

5. 实例

import numpy as np
from sklearn.model_selection import train_test_split
X = np.arange(10).reshape((5,2))
y = range(5)
X_train,X_test,y_train,y_test = train_test_split(X,y,test_size=0.33,random_state=1)#返回的是含有四个元素的列表
print('X_train:\n',X_train,'\nX_test:\n',X_test,'\ny_train:\n',y_train,'\ny_test:\n',y_test)

X_train:
[[8 9]
[0 1]
[6 7]]
X_test:
[[4 5]
[2 3]]
y_train:
[4, 0, 3]
y_test:
[2, 1]

import numpy as np
from sklearn.model_selection import train_test_split
from sklearn import datasets
from sklearn import svm
iris = datasets.load_iris()
X = iris.data
y = iris.target
X_train,X_test,y_train,y_test = train_test_split(X,y,test_size = .3,random_state = 0)
clf = svm.SVC(kernel='linear',C=1)
clf.fit(X_train, y_train)
#y_predict = clf.predict(X_test)
#accuracy_score(y_test,y_predict)
clf.score(X_test,y_test)

0.97777777777777775

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

【模型评估与选择】sklearn.model_selection.train_test_split 的相关文章

  • LearnOpenGL - 绘制三角形完整代码

    include
  • Linux下安装Python3.9(orangepi Zero2)

    1 查看当前Linux下自带的Python版本 python version 2 更新Linux源 sudo apt update 3 安装Python所需要的环境 代码如下 通用代码 树莓派 全志 Linux均适用 sudo apt in
  • Octave常用函数

    矩阵生成 eye n 生成n行n列的单位矩阵 rand n m 随机生成n行m列大小范围在0 1之间的随机数 randn n m 按高斯分布生成n行m列的随机数 ones n m 生成n行m列元素均为1的矩阵 zeros n m 生成n行m
  • kaggle:泰坦尼克生存预测( R语言机器学习分类算法)

    本文在基本的多元统计分析技术理论基础上 结合机器学习基本模型 选择Kaggle 数据建模竞赛网站 的入门赛 Titanic生存预测作为实战演练 较为完整地呈现了数据建模的基本流程和思路 采用的模型有逻辑回归 决策树 SVM支持向量机以及进阶
  • 爬虫代码(TJ)

    getip py来自https mp csdn net postedit 99288836 import getip import re import cx Oracle import urllib request from bs4 imp
  • 统计学:方差分析和相关分析的区别和联系

    区别 方差分析目的是检验因素是否对总体起作用 方法是不同的分组施加不同的因素水平 然后看组间差距是否明显大于组内差距 若明显大于则认为因素对总体起作用 具体过程中 方差分析只读取因变量数据 而不读取自变量数值 相关分析是检验变量之间是否有依
  • Redis学习(二)---常用命令、数据类型

    文章目录 常用命令 五大基本数据类型 1 String 2 List 3 Set 4 Hash 5 Zset 三种特殊数据类型 1 geospatial 2 Hyperloglog 3 Bitmaps 小结 常用命令 set key val
  • 05LinuxC线程学习之练习循环创建多个子线程和线程传参大坑(可以对比之前循环创建多个子进程)

    注 1 之前循环创建多个子进程的文章 https blog csdn net weixin 44517656 article details 109433060 2 wait回收子进程并且获取正常退出的返回值和异常退出的信号值的文章 htt
  • ESP32开发—文件系统spiffs

    文件系统有很多种 不同的操作的系统或者存储介质会选择不一样的文件系统 对于spiffs来说就是为了嵌入式设备而定制的精简版文件系统 优点是占用的内存非常小 而已不使用malloc分配内存 系统使用的内存由用户传入静态内存 缺点就是能存储的文
  • matlab傅里叶级数展开

    傅里叶级数 傅里叶级数展开 傅里叶级数展开原理 源码 方波 方波 三角波 matalb 傅里叶级数展开结果图片 傅里叶级数展开 傅里叶级数展开原理 周期函数可以通过一系列的三角函数的线性组合来逼近 傅里叶技术展开可以找到这些三角函数 首先我
  • ELK企业级日志分析系统

    ELK概述 为什么要使用 ELK 日志主要包括系统日志 应用程序日志和安全日志 系统运维和开发人员可以通过日志了解服务器软硬件信息 检查配置过程中的错误及错误发生的原因 经常分析日志可以了解服务器的负荷 性能安全性 从而及时采取措施纠正错误
  • 【Alist + Teracloud】WebDAV免费畅游互联网个人方案总结,一些支持WebDAV的应用推荐

    文章目录 1 介绍 废话 支持略过 1 1 WebDAV 是啥 1 2 支持开通 WebDAV 服务的东西 1 2 1 网盘类 公有云 1 2 2 私有云 1 2 3 本地部署 1 2 4 Alist 1 3 支持连接 WebDAV 的应用
  • 计算机网络【java面试题】

    1 计算机网络中的七层模型以及每一层的作用 OSI七层模型 功能 对应的网络协议 应用层 应用层是网络体系中最高的一层 也是唯一面向用户的一层 也可视为为用户提供常用的应用程序 每个网络应用都对应着不同的协议 HTTP TFTP FTP N
  • 开心档-软件开发入门之MongoDB 覆盖索引查询

    作者简介 每天分享MongoDB教程的学习经验 和学习笔记 座右铭 有自制力 做事有始有终 学习能力强 愿意不断地接触学习新知识 个人主页 iOS开发上架的主页 前言 本章将会讲解MongoDB 覆盖索引查询 目录 MongoDB 覆盖索引
  • Linux 查看属于某个组(例如docker组)的所有用户

    要查看属于某个组 例如docker组 的所有用户 可以使用getent命令 getent命令用于从Name Service Switch库中获取条目 要列出docker组下的所有用户 可以执行 getent group docker 这会返
  • Xilinx-Z7&K7启动模式

    Xilinx Z7 K7启动模式设置 Xilinx Z7 Xilinx K7 Xilinx Z7 UG585 P167 Xilinx K7 UG470 P21
  • Win7服务器没及时响应,主编练习win7系统服务没有及时响应启动或控制请求的修复方案...

    许多win7系统电脑的时候 常常会遇到win7系统服务没有及时响应启动或控制请求的情况 比如近日有用户到本站反映说win7系统服务没有及时响应启动或控制请求的问题 但是却不知道要怎么解决win7系统服务没有及时响应启动或控制请求 我们依照在

随机推荐

  • IDEA-找不到Code Coverage

    问题描述 今天做白盒测试的实验 需要代码覆盖率 但是始终找不到 在Junit中也找不到Code Coverage选项卡 问题解决 查询了之后 才知道是在初始化配置时 在插件那边未选择Coverage 没准备重装 就去欢迎界面去恢复到默认设置
  • Invoking "cmake" failed报错处理

    运行 pip install U rosdep rosinstall generator wstool rosinstall six vcstools运行完成后再重新编译 转载于 https www cnblogs com long5683
  • vue中的动态keyframes参数

    最近在负责项目中大屏模块 遇到了点小问题 现在来记录下先来讲下项目是基于Vue现要在keyframes中动态的传递高度 top 最后的效果如下图 主要涉及到动画效果 中间部分左右两边不说 主要思路 使用animation配合 keyfram
  • 源码 QT

    如何查找QT源码 相信很多人跟我一样 对QT源码很着迷 一次偶然间 我尽然发现了QT查找源码的网站 下面给大家贴一个链接qt查源码网址 然后给大家分享一下差源码的方法 查到的源码如图所示 下面展示QRandomGenerator源码 Cop
  • Android 把枪/PDA 扫描头自回车没用 处理方法

    XML 控件加上属性 android imeOptions actionNone 转载于 https www cnblogs com LuoEast p 11597878 html
  • 大数据面试题Spark篇(1)

    目录 1 spark数据倾斜 2 Spark为什么比mapreduce快 3 hadoop和spark使用场景 4 spark宕机怎么迅速恢复 5 RDD持久化原理 6 checkpoint检查点机制 7 checkpoint和持久化的区别
  • NOIP题目解析之取石子问题

    题目 现有5堆石子 石子数依次为3 5 7 19 50 甲乙两人轮流从任一堆中取石子 取最后一颗石子的一方获胜 甲先取 请问甲有没有获胜策略 如果有 甲第一步应在哪一堆里取多少 解析 在解这一道题之前 我们可以先来把问题简化 把五堆石子转化
  • Linux系统之使用cmatrix实现数字雨效果

    Linux系统之使用cmatrix实现数字雨效果 一 cmatrix介绍 二 本地环境介绍 2 1 本地环境规划 2 2 本次实践介绍 三 环境准备工作 3 1 安装开发环境 3 2 安装基本软件 3 3 安装 ImageMagick等工具
  • Unity shader系列:好用的IDE--JetBrain Rider

    官方描述 Rider 还添加了对 shader 文件的支持 提供语法高亮显示 代码折叠 括号匹配等功能 高亮显示 ShaderLab 部分的语法错误 todo 注释加入 To Do Explorer 并高亮显示颜色属性 且提供选色笔用于编辑
  • 学习HTML:iframe用法总结收藏

    原文地址 http blog csdn net andycode article details 6899775 分类 html js css 8 Html代码 p 是框架的一种形式 也比较常用到 p
  • Open3d之计算源点云与目标云的距离

    核心函数介绍 compute point cloud distance 提供了计算从源点云到目标点云的距离的方法 即 它计算源点云中的每个点到目标点云中最近点的距离 在下面的例子中 展示了使用该函数来计算两点云之间的差值 请注意 此方法也可
  • Shiro反序列化漏洞利用——2、Shiro_exploit漏洞检测

    使用Shiro exploit工具 检查是否存在默认的key 1 Github项目地址 下载利用工具 https github com insightglacier Shiro exploit 2 1使用示例 python shiro ex
  • C语言学习之assert

    C语言学习之assert C语言学习之assert assert 编程术语 编写代码时 我们总是会做出一些假设 断言就是用于在代码中捕捉这些假设 可以将断言看作是异常处理的一种高级形式 断言表示为一些布尔表达式 程序员相信在程序中的某个特定
  • 【C】变量

    目录 变量的命名 局部变量 全局变量 作用域 生命周期 变量的命名 变量名必须是由字母 数字 下划线组成 不能以数字开头 变量名不能是关键字 局部变量 全局变量
  • 斗地主2.0

    案例介绍 按照斗地主的规则 完成洗牌发牌的动作 具体规则 组装54张扑克牌将 54张牌顺序打乱 三个玩家参与游戏 三人交替摸牌 每人17张牌 最后三张留作底牌 查看三人各自手中的牌 按照牌的大小排序 底牌 规则 手中扑克牌从大到小的摆放顺序
  • git 主干master分支回滚到历史版本

    先切换到主分支 然后执行以下两点 1 回滚到指定版本 本地分支回滚到指定版本 git reset hard
  • 【漏洞复现】CVE-2022-44268 ImageMagick任意文件读取漏洞

    启动环境 sudo docker compose up d 查看端口号 服务启动后 访问http your ip 8080可以看到图片上传框 利用这个漏洞 需要先准备一个恶意PNG文件 文件内容中包含我们准备读取的文件路径 可以使用poc
  • 计算机网络--第三章思维导图

  • document.referrer的用法

    在JavaScript中 document对象有很多属性 其中有3个与对网页的请求有关的属性 它们分别是URL domain和referrer URL属性包含页面完整的URL domain属性中只包含页面的域名 而referrer属性中则保
  • 【模型评估与选择】sklearn.model_selection.train_test_split

    1 描述 Split arrays or matrices into random train and test subsets 2 语法 train test split arrays options 3 参数 1 arrays sequ