python实现smote处理正负样本失衡问题

2023-05-16

机器学习中难免遇到正负样本不平衡问题，处理办法通常有梁总，一：过采样，增加正样本数据；二：欠采样，减少负样本数据，缺点是会丢失一些重要信息。smote属于过采样。

代码

# from imblearn.over_sampling import BorderlineSMOTE
# from imblearn.over_sampling import SMOTENC
# from imblearn.over_sampling import SVMSMOTE
# from imblearn.over_sampling import KMeansSMOTE
# from imblearn.over_sampling import ADASYN
# from imblearn.over_sampling import RandomOverSampler
import pandas as pd 
import numpy as np
from collections import Counter
from imblearn.over_sampling import SMOTE# 使用imlbearn库中上采样方法中的SMOTE接口
import matplotlib.pyplot as plt

# 生成一组0和1比例为9比1的样本，X为特征，y为对应的标签
x1=[np.random.randint(1,31) for i in range(90)]+[np.random.randint(50,81) for i in range(10)]
x2=[np.random.randint(1,31) for i in range(90)]+[np.random.randint(50,81) for i in range(10)]
y=[0 for i in range(90)]+[1 for i in range(10)]
x=pd.DataFrame({'x1':x1,'x2':x2})
y=pd.DataFrame(y)

# 查看所生成的样本类别分布，0和1样本比例9比1，属于类别不平衡数据
print(Counter(list(y[0])))
fig1=plt.figure(1)
plt.scatter(x['x1'],x['x2'])
plt.show

# 定义SMOTE模型，random_state相当于随机数种子的作用
smo = SMOTE(sampling_strategy='auto',random_state=10)
x_smo, y_smo = smo.fit_sample(x, y)
print(Counter(list(y_smo[0])))
fig2=plt.figure(2)
plt.scatter(x_smo['x1'],x_smo['x2'])
plt.show

结果

处理前

处理后

如果对你有帮助，请点下赞，予人玫瑰手有余香！

时时仰望天空，理想就会离现实越来越近！

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python实现smote处理正负样本失衡问题的相关文章

Ubuntu设置屏幕分辨率及屏幕翻转

首发于 xff1a yuany3721的WordPress Version Ubuntu 18 04 6 LTS 使用xrandr查看屏幕信息 xrandr Screen 0 minimum 320 x 200 current 1920 x
用美图秀秀换证件照背景颜色

xff08 JDD KK 原创 xff09 问题描述 xff1a 不会PS xff0c 也没有各种会员 xff0c 怎么为了应急去换证件照背景 xff1f xff08 此方法有局限 xff0c 且质量一般 xff0c 只为应急 xff09
让自己写的程序也有api

当我们在学习的时候 xff0c 有时候看到别人的api会感觉到蛮高大上的其实他们的api并不是他们在写完程序之后 xff0c 通过键盘录入的 xff0c 而是通过工具来生生成的因此我们完全有机会打造属于自己的api api的作用 1 便
记录使用gitlab实现Docker自动化部署

目录前言一 gitlab runner docker安装二 gitlab runner的注册与使用 1 注册 2 gitlab ci yml 脚本编写总结前言前面搭建了gitlab与harbor xff0c 现在就使用它们来实现
ros::ok()

ros ok 在以下几种情况下会返回false xff1a 按下Ctrl C时我们被一个同名同姓的节点从网络中踢出 ros shutdown 被应用程序的另一部分调用所有的ros NodeHandles都被销毁了一旦ros ok 返回
小觅深度相机标准版 ROS使用

只写运行起来 xff0c 具体实例运行方法在对应的实例中系统 xff1a ubuntu16 04 1 安装SDK 下载SDK驱动并解压 xff1a https github com slightech MYNT EYE S SDK 看RE
移动机器人（四）四轴飞行器

四轴飞行控制原理四轴飞行器在空间上有6个自由度 xff0c 分别是沿3个坐标轴进行平动和转动 xff0c 通过对四个旋翼的转速控制来实现 xff0c 6个自由度方向的运动姿态分别为 xff1a 垂直升降俯仰角度前后飞行横滚角度左右
(二) 使用vscode

1 在拉代码过程中 xff0c 使用代码对比工具左侧有个分支工具 xff0c 点击左侧栏中某个文件 xff0c 右侧出现两栏以102行为例 xff0c 红色部分为代码改动之前显示 xff0c 右侧绿色部分为代码改动之后显示 2 文件工具
30个实用VSCode 插件，让你的开发效率倍增！

1 Image preview 通过此插件 xff0c 当鼠标悬浮在图片的链接上时 xff0c 可以实时预览该图片 xff0c 除此之外 xff0c 还可以看到图片的大小和分辨率 2 Auto Rename Tag 使用该插件 xff0c
OpenCV 4.5.0+conrtrib 已编译完成（附下载链接）

OpenCV 4 5 0 43 conrtrib 已编译完成 xff0c 包含编译源码平台 Windows 43 VS2015 百度网盘链接提取密码 xff1a rdgh 源码下载 OpenCV源码下载链接推荐 xff08 包含匹配的c
第一篇综述-无人车简介

综述无人车简介 xff08 1 xff09 1 1无人车的定义以及分级 1 2无人车的发展历程参考链接原文链接 xff1a https blog csdn net thomashtq article details 81161018
在C#中使用Intptr究竟需不需要释放？

只有是用Marshal 申请的 xff08 AllocHGlobal xff09 这种需要释放 xff1b 对于使用PInvoke 返回的IntPtr不用释放 xff1b 简单来说 xff0c 这个东西是你创建出来的你就得负责回收 xff0
.NET中Invoke和BeginInvoke

在 NET中 xff0c 固定必须主线程才能操作UI界面 xff0c 如果在非主线程中强行对UI界面赋值 xff0c 则会报错 xff0c 跨线程操作UI 是不允许的 xff0c 需要使用Invoke或BeginInvoke xff0c 关
php 跨域解决方案

设置允许访问的域名 xff1a 1 允许全部的域名访问 span class token function header span span class token punctuation span span class token str
WPF之转换器

WPF是一个数据驱动模式 xff0c 开发中都是以数据为中心 xff0c WPF具有数据绑定机制 xff0c 数据有变化时 xff0c 会通知UI进行更新 WPF用的是MVVM模式 MVVM是Model View ViewModel xff
CS程序自动更新和手动更新的技术实现

1 程序启动时检查更新 xff0c 如果可以更新 xff0c 则判断是否为强制性更新 xff0c 如果是则直接强制更新 xff0c 不是则不处理 xff0c 转为到程序更新模块中手动处理 xff0c 这是更新最基本的原理检查更新 priv
用MATLAB将矩阵数据写入txt文件中，打开乱码原因

MATLAB将数据写入txt文件中乱码的原因 xff0c 是将数据按照二进制文件写入txt文件 xff0c 所以打开会出现乱码的情况 xff0c 只需要把 fid1 61 fopen 39 piture txt 39 39 w 39 换成
boost C++知识点（一）

1 boost总览 xff1a Boost Any Boost Any 提供了一个名为 boost any 的数据类型 xff0c 可以存放任意的类型例如 xff0c 一个类型为 boost any 的变量可以先存放一个 int 类型的值
python 函数里面直接修改函数外部的全局变量

python函数内部对全局变量进行修改全局变量为immutable 不可变的全局变量为mutable 可变的全局变量为immutable 不可变的 a span class token operator 61 span span cl
ubuntu20.04中安装ROS系统

自从在自己的电脑上安装了ubuntu20 04 43 window10双系统之后 xff0c 为了下一步开展研究 xff0c 所以安装ROS系统把安装过程记录下来 xff0c 方便以后学习亲测有效 xff01 xff01 xff01 x

随机推荐

Linux编程的第三方库引用------gcc、pkg-config与CMake一文讲解

众所周知 linux 下库文件编译三部曲 config make makeinstall configure过程中可能会遇到无法找到某些头文件和动态库 xff1b 原因有两个 xff1a xff08 1 xff09 系统没有这些头文件和动态
论文阅读 Global Localization with Object-Level Semantics and Topology

摘要全局定位是SLAM的核心要素基于外观的方法虽然很成功 xff0c 但是在视觉条件随时间变化很大的环境中仍然面临许多开放的挑战 xff0c 随着时间的变化 xff0c 外观会发生巨大的变化在本文中 xff0c 我们提出了一种集成解决
DOCKER VNC

reference https www bilibili com video av882822967 以及泡泡机器人公众号文章泡泡机器人创建了docker镜像 xff0c 极大的提升了环境配置的效率 docker 简介准备安装dock
GTSAM:使用gtsam的C++

GTSAM 是一个在机器人领域和计算机视觉领域用于平滑 xff08 smoothing xff09 和建图 xff08 mapping xff09 的C 43 43 库它与g2og2o不同的是 xff0c g2og2o采用稀疏矩阵的方式求
ROS - 用POSE展示方向或向量 vector - pose

昨天想在rviz里用pose表示一个vector xff0c 搞了半天 Pose的属性 xff0c point是起点 xff0c orientation是表示由坐标系原点将 1 0 0 这个向量旋转到想要显示的方向所需的旋转的四元数表示假
目录导读

SLAM基础 xff1a SLAM基础 xff1a 计算相机运动 SLAM基础 xff1a 单目初始化问题 SLAM基础 xff1a 计算相机运动 3D 2D SLAM基础 xff1a 计算相机运动 3D 3D SLAM基础 xff1a I
特定标志检测算法流程-棋盘格

ROS标定工具是采用棋盘格 xff0c 具体实现是OPENCV 将输入图像降采样到大约VGA分辨率 xff0c 并在全尺寸图像中检测校准目标角点结合这些明显正交的职责作为一个优化棋盘式检测在大图像上太昂贵 xff0c 所以最好在较小的显
无人驾驶——激光雷达篇

激光雷达技术简介无人驾驶技术是多项技术的集成 xff0c 包括传感器定位与深度学习高精地图路径规划障碍物检测与规避机械控制系统集成与优化能耗与散热管理等无人车系统的感知端由不同的传感器组成 xff0c 其中包括GPS xf
simulink搭建简单的陷波滤波器

simulink搭建简单的陷波滤波器陷波滤波器的设计模型的搭建通过matlab自带软件设计的滤波器与simulink自带滤波器模块对比陷波滤波器的设计具体设计方法可参见这篇 xff1a 算法学习笔记之50HZ陷波滤波器设计下面给出各
docker——常用指令

docker pull url 从url拉取容器 docker run d url 后台运行镜像 xff0c 如果不存在该镜像 xff0c 则会自动下载 docker exec it 容器id bash 进入镜像容器 xff0c 容器的id
Realsense、kinect在ROS环境下的骨骼识别（基于NuiTrack）

ps 出售我购买的nuitrack liecense xff0c 支持月付在弄不明白ROS Kinectic之后的openNI之后终于还是向Nuitrack骨骼识别屈服了 xff1a 那么先看看NuiTrack是啥 xff1a https
深度图像帧差法处理以及CV16UC1深度图像的存储方式

最近为了拾取桌面上的任务目标 xff0c 采用了实时图像与背景图像相减的方法来进行 xff0c 因为采用彩色图像相减会有影子的干扰 xff0c 所以采用了深度图像但是深度图像的Mat是CV16UC1格式的矩阵内部数据采用uint 16格
Couldn't find executable named joy_node below /opt/ros/kinetic/share/joy解决方法

最近想用joy node这个节点 xff0c 然后就通过 sudo apt get install ros kinetic joy 去安装 xff0c 然后运行rosrun joy joy node时候一直错误显示Segmentation
ros修改map_server地图发布的map关联的坐标系frame_id(多机器人联合建图用)

帮师弟做多机器人联合建图的时候遇到了map的坐标系问题如下 map server发布的 map话题包含了frame坐标系关联想要正确的让多个机器人共同建图导航需要修改 map话题以及其绑定的frame坐标系防止机器人之间的相互冲突下
ROS传输图像带宽不够用的解决方法（realsenseD415压缩图像）

最近在做图像的深度学习识别 xff0c 但是移动机器人上的电脑配置不够 xff0c 只能用我的电脑远程的去处理图像 xff0c 但是遇到了严重的带宽瓶颈 xff0c 按照我的电脑150Mbps的无线网卡来算 xff0c 每秒的极限传输速度就
dockerfile配置运行
气压计高度融合—卡尔曼滤波

实验平台 xff1a 自制飞控板 xff0c STM32F407主控 xff0c 传感器 xff1a MPU6050 MS5611 正文 xff1a 前几天看了这篇文章 xff0c 做了气压计的高度融合 http www zxiazai c
GD32F303移植FreeRTOS

GD32F303移植FreeRTOS 一移植环境系统 xff1a WIN7 MDK xff1a keil v5 26 开发板 xff1a GD32F303C EVAL 固件库 xff1a V1 0 2 FreeRTOS版本 xff1a
FreeRTOS静态创建任务

一静态方式创建任务和删除任务 1 gt 测试环境系统 xff1a WIN7 MDK xff1a keil v5 26 开发板 xff1a GD32F303C EVAL 固件库 xff1a V1 0 2 FreeRTOS版本 xff1a
python实现smote处理正负样本失衡问题

机器学习中难免遇到正负样本不平衡问题 xff0c 处理办法通常有梁总 xff0c 一 xff1a 过采样 xff0c 增加正样本数据 xff1b 二 xff1a 欠采样 xff0c 减少负样本数据 xff0c 缺点是会丢失一些重要信息 sm

python实现smote处理正负样本失衡问题

代码

结果

python实现smote处理正负样本失衡问题 的相关文章

随机推荐

热门标签

python实现smote处理正负样本失衡问题的相关文章