随机森林（RF）

2023-11-11

RF概念

RF算法流程

RF算法的优缺点

RF算法使用实现

RF应用

RF概念

随机森林指的是利用多棵树对样本进行训练并预测的一种分类器 决策树的详解见链接决策树---ID3算法、C4.5算法、CART算法_xiaoming1999的博客-CSDN博客

RF = 决策树+bagging+随机属性选择

RF算法流程

样本的随机：从样本集中用bagging的方式，随机选择n个样本。
特征的随机：从所有属性d中随机选择k个属性（k<d），然后从k个属性中选择最佳分割属性作为节点建立CART决策树。
重复以上两个步骤m次，建立m棵CART决策树。
这m棵CART决策树形成随机森林，通过投票表决结果，决定数据属于哪一类。

RF算法的优缺点

优点：

不用做特征选择

它可以判断特征的重要程度

可以判断出不同特征之间的相互影响

对于不平衡的数据集来说，它可以平衡误差。

如果有很大一部分的特征遗失，仍可以维持准确度。

缺点：

随机森林已经被证明在某些噪音较大的分类或回归问题上会过拟合。

对于有不同取值的属性的数据，取值划分较多的属性会对随机森林产生更大的影响，所以随机森林在这种数据上产出的属性权值是不可信的

RF算法使用实现

from sklearn import tree
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier
import numpy as np
import matplotlib.pyplot as plt
%matplotlib inline


#载入数据
data = np.genfromtxt("LR-testSet2.txt",delimiter=',')
x_data = data[:,:-1]
y_data = data[:,-1]

plt.scatter(x_data[:,0],x_data[:,1],c=y_data)
plt.show()

#划分数据
x_train,x_test,y_train,y_test = train_test_split(x_data,y_data,test_size = 0.5)

#画图函数
def plot(model):
    #获取数据值所在的范围
    x_min,x_max = x_data[:,0].min()-1,x_data[:,0].max()+1
    y_min,y_max = x_data[:,1].min()-1,x_data[:,1].max()+1
    
    #生成网格矩阵
    xx,yy = np.meshgrid(np.arange(x_min,x_max,0.02),
                       np.arange(y_min,y_max,0.02))
    
    z = model.predict(np.c_[xx.ravel(),yy.ravel()])
    z = z.reshape(xx.shape)
    
    #等高线图
    cs = plt.contourf(xx,yy,z)
    #画散点图
    plt.scatter(x_test[:,0],x_test[:,1],c=y_test)
    plt.show()
#只用决策树
dtree = tree.DecisionTreeClassifier()
dtree.fit(x_train,y_train)
plot(dtree)

#用随机森林
RF = RandomForestClassifier(n_estimators = 100)
RF.fit(x_train,y_train)
plot(RF)
RF.score(x_test,y_test)
dtree.score(x_test,y_test)

结果显示如下

决策树结果：随机森林结果：

在一般情况下随机森林一般准确性比较高一些，但也不排除其他情况，随机森林的结果可能很差。

RF应用

对离散值的分类
对连续值的回归
无监督学习聚类
异常点检测

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

机器学习

随机森林

决策树

算法

随机森林（RF）的相关文章

自动驾驶轨迹预测

目录神经网络轨迹预测综述比较新的轨迹预测网络 Uber LaneRCNN 5 Google VectorNet 6 Huawei HOME 7 Waymo TNT 8 Aptive Covernet 9 NEC R2P2 10 商汤 T
MIT_线性代数笔记：复习二

目录第二单元主要内容例题第二单元主要内容正交矩阵 Q 用矩阵形式描述正交性质投影矩阵 P 最小二乘法在方程无解时求最优解 Gram Schmidt 正交化从任意一组基得到标准正交基策略是从向量中减去投影到其它向量方向的分
基于机器学习的贷中风险预测模型-江苏银行“随e融”杯-二等奖

文章目录源码下载地址项目介绍界面预览项目备注毕设定制咨询源码下载地址源码下载地址点击这里下载源码项目介绍基于机器学习的贷中风险预测模型江苏银行
如何用GPT制作PPT和写代码？

详情点击链接如何用GPT制作PPT和写模型代码一OpenAI 1 最新大模型GPT 4 Turbo 2 最新发布的高级数据分析 AI画图图像识别文档API 3 GPT Store 4 从0到1创建自己的GPT应用 5 模型Gemin
【需求响应】改进连续时间控制方法用于分散式需求响应的恒温负荷研究（Python代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Python代码及文章
关于整型提升与截断的一道题目

关于整型提升与截断可以看我的博客 C语言整型提升 c语言整形提升 CSDN博客 C语言截断整型提升算数转换练习 c语言unsigned CSDN博客一题目二题解 char a 101截断由于101是整型数据需要32比特
【C++入门】C++ STL中string常用函数用法总结

目录前言 1 string使用 2 string的常见构造 3 string类对象的访问及遍历迭代器遍历访问 4 string类对象的容量操作 4 1 size和length 4 2 clear empty和capacity 4 3
【卡尔曼滤波】具有梯度流的一类系统的扩散映射卡尔曼滤波器研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码数据文章
【EI复现】基于深度强化学习的微能源网能量管理与优化策略研究（Python代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 2 1 有无策略奖励 2 2 训练结果1
2024年华为OD机试真题-小明找位置-Java-OD统一考试（C卷）

题目描述小朋友出操按学号从小到大排成一列小明来迟了请你给小明出个主意让他尽快找到他应该排的位置算法复杂度要求不高于nLog n 学号为整数类型队列规模 lt 10000 输入描述 1 第一行输入已排成队列的小朋友的学号正整
2024年华为OD机试真题-手机App防沉迷系统-Java-OD统一考试（C卷）

题目描述智能手机方便了我们生活的同时也侵占了我们不少的时间手机App防沉迷系统能够让我们每天合理的规划手机App使用时间在正确的时间做正确的事它的大概原理是这样的 1 在一天24小时内可注册每个App的允许使用时段 2 一个时
基于卡尔曼的混合预编码技术用于多用户毫米波大规模MIMO系统研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码及文章
【自适应滤波】一种接近最佳的自适应滤波器，用于突发系统变化研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码及文章
机器学习算法实战案例：Informer实现多变量负荷预测

文章目录机器学习算法实战案例系列答疑技术交流 1 实验数据集 2 如何运行自己的数据集 3 报错分析机器学习算法实战案例系
AI在广告中的应用——预测性定位和调整

营销人员的工作就是在恰当的时间将适合的产品呈现在消费者面前从而增加他们购买的可能性随着时间的推移营销人员能够深入挖掘越来越精准的客户细分市场他们不仅具备了实现上述目标的能力而且这种能力还在呈指数级提升在AI技术帮助下现在的营销
【卡尔曼滤波】具有梯度流的一类系统的扩散映射卡尔曼滤波器研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码数据文章
「优选算法刷题」：移动零

嗨这个假期罗根开始接触了算法在为今年的蓝桥杯做准备所以开个新专栏记录记录自己做算法题时的心得一题目给定一个数组 nums 编写一个函数将所有 0 移动到数组的末尾同时保持非零元素的相对顺序请注意必须在不复制数组的情况下
基于卡尔曼的混合预编码技术用于多用户毫米波大规模MIMO系统研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码及文章
2024年华为OD机试真题-虚拟游戏理财-Python-OD统一考试（C卷）

题目描述在一款虚拟游戏中生活你必须进行投资以增强在虚拟游戏中的资产以免被淘汰出局现有一家Bank 它提供有若干理财产品m 风险及投资回报不同你有N 元进行投资能接受的总风险值为X 你要在可接受范围内选择最优的投资方式获得最大回报
【算法】使用BFS算法（队列、哈希等）解决最短路径问题（C++）

文章目录 1 前言 1 1 什么是最短路问题 1 1 1 什么是权值 1 2 如何解决此类最短路径 1 3 BFS解最短路径前提 FloodFill 洪流问题 2 算法题

随机推荐

[AHK]新浪实时股票数据接口

2022年1月发现新浪接口反馈 Kinsoku jikou desu 已有新的方法如需获取实时股票价格当前价格涨停价跌停价等请联系weixin sunwind1576157 AHK 腾讯实时股票数据接口 AHK 腾讯实时股票
GO语言常用标准库 fmt

GO语言常用标准库 fmt 1 fmt fmt包实现了类似C语言printf和scanf的格式化I O 主要分为向外输出内容和获取输入内容两大部分 1 1 1 向外输出标准库fmt提供了以下几种输出相关函数 Print Print系列函数
1024Byte(字节)=1KB

二进制数系统中每个0或1就是一个位 bit 位是数据存储的最小单位计算机中的CPU位数指的是CPU一次能处理的最大位数例如32位计算机的CPU一次最多能处理32位数据字节 Byte 是通过网络传输信息或在硬盘或内存中存储信息的单
【转】本地jar 上传到maven仓库

Maven环境准备下载maven安装包解压后配置好path环境变量具体配置请参考百度注意一般maven仓库有两个目录可以上传 maven snapshots 和 maven releases 一般快照也就是jar的后缀名为snap
Python：安装paddlepaddle后运行代码报错ImportError: core_avx.so: undefined symbol: _dl_sym, version GLIBC_PRIVA

是paddlepaddle版本导致的出现问题时我安装的版本是 python m pip install paddlepaddle 2 3 1 i https pypi tuna tsinghua edu cn simple 改成下面这个版
Spring(做项目常用的网址)

目录 1 后端maven中央仓库 2 jquery官网下载 3 mybatis文档中文版 4 mybatis英文文档 5 mybatis生成逆向工程代码及网址 6 Spring网址附注常用到的代码 7 使用 Controller注解为什么
【数据库原理复习题】

文章目录一单选题二填空题三判断题四简答题五综合题 5 1 属性集合的闭包计算 5 2 确定候选码并进行范式级别的判断 5 2 1 确定候选码讲解 5 2 2 范式级别的判断讲解 5 3 根据要求写SQL语句 5 3 1数
canvas绘制小树阴影-transform

绘制小路可用quadraticCurveTo 二次贝塞尔曲线来绘制复杂曲线也可以用bezierCurveTo 三次贝塞尔曲线效果图代码如下 demo html
深度学习环境配置8——（30系显卡）windows下的torch==1.7.1环境配置

深度学习环境配置8 30系显卡 windows下的torch 1 7 1环境配置注意事项一 2021 10 8更新学习前言各个版本pytorch的配置教程环境内容环境配置一 Anaconda安装 1 Anaconda的下载 2
计算机毕业设计Node.js+Vue会议管理系统(程序+源码+LW+部署)

该项目含有源码文档程序数据库配套开发软件软件安装教程欢迎交流项目运行环境配置 Node js Vscode Mysql5 7 HBuilderX Navicat11 Vue Express 项目技术 Express框架 No
java socket tcp 长连接_java socket长连接

package com paic umap tcp import java io IOException import java io InputStream import java io ObjectInputStream import
LeetCode 182. Duplicate Emails

SQL Schema Write a SQL query to find all duplicate emails in a table named Person Id Email 1 a b com 2 c d com 3 a b com
Ubuntu 下配置protobuf

首先得到 protobuf 相应的包文件在终端上输入如下 wget http protobuf googlecode com files protobuf 2 5 0 tar gz 由于现在 protobuf 2 5 0 tar gz已
Python Serial串口的简单数据收发

导入模块注意这里模块名是pyserial pip install pyserial 1 打开串口 import serial com serial Serial COM3 9600 print com 2 发送数据 import seri
unityhub登录不上，登录界面刷新不出来

如果是登录界面白屏的话可以尝试 1 关闭hub 右下角也要退出找不到的可以直接任务管理器退出 2 删除 UserProfile AppData Roaming 里面的 UnityHub Cache和 Unity Caches 文件夹 3
javascript的null、undefined和布尔数据类型

javascript中有null undefined 在使用typeof 时候 console log typeof null object console log typeof undefined undefined null与unde
C++ gbk与utf8互转

本文代码已在vs2017上验证 gbk转utf8容易出现中文乱码有的时候在x86 32位编译环境下中文显示正常但切换到x64 64位编译环境下会乱码本文所示的代码在32位和64位编译环境下均不会出现乱码使用例子见 C 调用pytho
在windows下使用Vscode用CMake..命令编译源代码时候遇到的问题之解决办法

由于我在windows下用Vscode总是不记得如何deal这个错误因此今天就用这篇博客记录下来在windows的Vscode这个IDE下打开终端输入命令行 C Users 11602 Desktop test build gt c
【互联网有记忆】爬取微博热搜榜并存入数据库（python爬虫+存储过程后端实现）

一爬虫代码 import random time import requests re import datetime import mysql connector 定义爬取间隔 minutes interval time 15 clas
随机森林（RF）

目录 RF概念 RF算法流程 RF算法的优缺点 RF算法使用实现 RF应用 RF概念随机森林指的是利用多棵树对样本进行训练并预测的一种分类器决策树的详解见链接决策树 ID3算法 C4 5算法 CART算法 xiaoming1999的博客

随机森林（RF）

RF概念

RF算法流程

RF算法的优缺点

RF算法使用实现

RF应用

随机森林（RF） 的相关文章

随机推荐

热门标签

随机森林（RF）的相关文章