作业一（part1）：使用威斯康辛大学关于乳腺癌诊断数据集的相关数据，采用决策树算法（或随机森林）分析乳腺癌诊断数据集，推断肿瘤发病可能情况，然后用5分类

2023-05-16

仅供自己学习使用！！！

这篇博客先对数据集做一些介绍

参考链接：http://docode.techyoung.cn/breast_cancer_wisconsin.html

乳腺癌的早期诊断意义重大！

数据集：威斯康辛大学关于乳腺癌诊断数据集

链接：https://archive.ics.uci.edu/ml/datasets/Breast+Cancer+Wisconsin+%28Diagnostic%29

数据集共有30个特征，前10个特征是样本图像中细胞核特征值的平均值：

第11到第20个特征为样本图像中细胞核特征值的标准差，反映的是在一个样本图像中不同细胞核在各个特征数值上的波动情况：

第21到30个特征为样本图像中细胞核特征值的最大值，这个最大值并非是整个样本最大值，而是特征值前三名的平均值，这样可以减弱计算和测算过程中误差所带来的影响：

为数据集作一个整体总结：

均值可以看出样本中细胞核总体形态特征；标准差反映各个细胞核中的差异程度，是一个良好的分类特征；恶性与良性有些细胞核面积差异较大，用最大值能够较好反映特征。

特征讲解

半径

纹理

周长和面积

平滑度

凹点

凹度

对称性

分形维数

前十个均值特征之间的关系

小结

代码

1.数据加载

原数据集中有30个特征，样本数量为569

import numpy as np
import pandas as pd
dataset = pd.read_csv(r'D:\Documents\myProject\dadaists\wdbc.csv', header=0,
                      usecols = range(0,32,1))
dataset
print(dataset)

上面尝试失败，下面用导包的方式：

from sklearn.datasets import load_breast_cancer
from sklearn.ensemble import RandomForestClassifier
from sklearn.model_selection import GridSearchCV
from sklearn.model_selection import cross_val_score
import matplotlib.pyplot as plt
import pandas as pd
import numpy as np
data = load_breast_cancer()#导入数据集，探索数据
data.data.shape
print(data.data.shape)#输出乳腺癌数据集中的数据情况，从输出结果可以看出乳腺癌数据集有569条数据，30个特征

正式开始：

1.若使用sklearn库，则代码实现如下：

从sklearn库中导入该乳腺癌数据集，主体代码中，首先load，第三行中的cv=5是指实现五折交叉验证

2.不使用sklearn库，而是自己定义：

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

作业一（part1）：使用威斯康辛大学关于乳腺癌诊断数据集的相关数据，采用决策树算法（或随机森林）分析乳腺癌诊断数据集，推断肿瘤发病可能情况，然后用5分类的相关文章

Linux DRM Graphic 显示简单介绍

好久没有写过博客了 xff0c 工作之后平时都没有总结 xff0c 感觉像做了学到很多东西 xff0c 但是又感觉什么都没有学到 xff0c 似懂非懂 xff08 真尼玛纠结 xff09 突然别人说的一句话 xff0c 学东西不仅仅是自己学
Linux DRM KMS 驱动简介

Whoops xff0c 上次写完 Linux DRM Graphic 显示简单介绍博文后 xff0c 心情还是蛮愉悦的 xff0c 来来 xff0c 这次在说说具体的显卡驱动 1 DRM 框架分解 DRM 框架提供了一系列的 IOCTL
Vim 自动补全插件 YouCompleteMe 安装与配置

本文系转载文章 xff0c 原文链接 http howiefh github io 2015 05 22 vim install youcompleteme plugin Contents 1 概述 2 安装 2 1 完全安装 2 2 Ub
Linux 中的各种栈：进程栈线程栈内核栈中断栈

转载请注明出处 xff1a http kyang cc 栈是什么 xff1f 栈有什么作用 xff1f 首先 xff0c 栈 stack 是一种串列形式的数据结构这种数据结构的特点是后入先出 LIFO Last In First Ou
SD-WAN 到底是什么？

转载请注明出处 xff1a http kyang cc In a nutshell SD WAN Virtualizes the networkEnables a secure overlaySimplifies services deli
SDN, SD-WAN, NFV, VNF: What Is All This?

本文转载至 xff1a http www velocloud com sd wan blog sdn sd wan nfv vnf Inscrutable alphabet soup Even the fully expanded term
Top-down Design简介

自顶向下 xff0c 逐步求精的方法在英文中称作Top down Design xff0c 是一种计算机编程使用的算法思想 xff0c 顾名思义 xff0c 这种方法的思想就是对现在遇到的复杂或者抽象化的问题 xff0c 进行纵向深入分解
The Advantages of SD‐WAN over Traditional WAN

转载请注明出处 xff1a http kyang cc An SD WAN has several advantages over a traditional WAN 重点内容 Simplified WAN Rapid deployment
玩转 SSL 证书

Introduction Openssl 是一个很牛逼的工具 xff0c 基本能搞定 PKI amp HTTPS 证书相关的事情这篇博文归类了一堆常用的命令 xff0c 全部都是关于 key amp csr amp crt 本文分成两部分
linux简易书单

1 Linux程序设计 xff08 第4版 xff09 万千读者推荐的Linux经典入门书程序设计实战型图书 xff0c 以简单易懂内容全面和示例丰富而受到广泛好评如果你没有Linux基础 xff0c 可以先读这本话说回来 xff0
数字图像处理的技术方法和应用

所谓数字图像处理 xff0c 是指将图像信号转换成数字信号并利用计算机对其进行处理的过程 20 世纪 50 年代 xff0c 电子计算机已经发展到一定水平 xff0c 人们开始利用计算机来处理图形和图像信息 xff0c 这便是早期的图像处理
hadoop安装完后打开网页http://localhost:50070/ 没反应

在hadoop安装完后 xff0c 依次执行hadoop namenode format xff0c start dfs sh xff0c start yarn sh 之后打开浏览器输入 http localhost 50070 无反应
关于CSDN代码段的背景颜色修改

当我第一次去在CSDN中写代码时会发现自己的是用的代码段是如图下所示这种黑色的背景那么自己想要去修改因该如何设置 1 鼠标悬停到头像上 2 点击内容管理标签 3 点击博客设置 4 在代码片样式中选择自己喜欢的样式就可以了
利用VSPD、串口调试助手、Keil做串口调试

下面详细介绍下如何用虚拟串口调试串口发送接收程序需要用到三个软件 xff1a KEIL VSPD XP5 xff08 virtual serial ports driver xp5 1虚拟串口软件 xff09 串口调试助手 xff08 个
基于机器学习的雷达信号分选和目标识别（论文阅读学习记录—持续记录）

机器学习在雷达信号分选技术上的应用包括信号分离确定脉冲参数形成单部雷达脉冲序列 xff0c 然后针对雷达目标识别进行分类并划分威胁程度等在一维距离像识别过程中包括去噪和雷达目标型号识别该论文 xff08 学习内容 xff09 重点研
CMake Error: The following variables...set to NOTFOUND

今天在编译开源OpenVslam时 xff0c 在最后阶段出现如下问题说是DBOW2的库招不到查看了dbow2都是正常安装的 xff0c 但是就是出问题然后我就找到了对应的cmakelist txt文件 xff0c 将LIBS地址打印
PCL库调试过程中，显示当前不会命中断点，还没有为该文档加载任何符合

最近在读PCL库中NDT源码 xff0c 搞了一个vs2019的工程将NDT部分跑了起来 xff0c 想通过打断点的方式进入源码中一步步走读代码但是有些部分的源码可以通过断点的方式进 hpp文件 xff0c 有些确不能比如kdtree
相机矩阵（camera matrix）

本博文主要介绍camera的参数矩阵目录相机小孔模型相机矩阵 xff08 内参 xff09 相机矩阵 xff08 Intrinsic matrix xff09 图像坐标系相机的外参矩阵 xff08 extrinsic matrix
Pytorch模型转ONNX

参考https blog csdn net qq 37546267 article details 106767640 利用下面代码将pth模型转换为onnx import torch from torch autograd import
File already exists in database google/protobuf/descriptor.proto

以加载静态库的方式加载protobuf库时出现如下问题 xff1a libprotobuf ERROR google protobuf descriptor database cc 57 File already exists in dat

随机推荐

assign()测试

assign 应该属于赋值 std deque lt int gt di 1 2 3 4 5 std cout lt lt 34 at first 34 lt lt std endl std cout lt lt 34 di 61 34 f
解析力评测（1） MTF和SFR

成像系统的解析力一直是摄像头最关键的指标之一所有用户拿到一张照片的时候首先看到的是照片清楚不清楚 xff0c 图像的清楚说得就是解析力但是如何评价一个成像系统的解析力也是大家一直在探讨的问题目前主流的办法主要有三种TV line检测
MTF的倾斜边缘计算方法

简介光学系统性能的衡量方法有很多 xff0c 常见的有点扩散函数法瑞利判断法点列图法光学传递函数 MTF 法等 xff0c 其中MTF法在光学系统和镜头加工制造中使用最为广泛 MTF曲线真实的反映了成像系统将物方信息传递到像方的能力
机器人学中旋转矩阵与欧拉角之间互换公式及程序

弧度角度 define PAI 3 141592653589793 define RADIAN PAI 180 0 弧度 61 角度 180 define ANGLE 180 0 PAI 角度 61 弧度 180 2 旋转矩阵转换为欧拉角
opencv 读取图片并提取Mat中data数据

uchar pImageData 61 uchar malloc width height 3 sizeof uchar Mat MyImage 61 imread file name IMREAD COLOR if MyImage dat
如何理解矩阵相乘的几何意义或现实意义？

作者 xff1a deng will 链接 xff1a https www zhihu com question 28623194 answer 135658852 来源 xff1a 知乎著作权归作者所有商业转载请联系作者获得授权 xf
范数对于数学的意义？1范数、2范数、无穷范数

作者 xff1a JI Weiwei 链接 xff1a https www zhihu com question 21868680 answer 25599956 来源 xff1a 知乎著作权归作者所有商业转载请联系作者获得授权 xff
鱼眼图像的经纬度展开，经纬度图转鱼眼

鱼眼图像由视场角接近180度甚至大于180度的镜头拍摄得到 xff0c 图像周围畸变严重 xff0c 通过经纬法将鱼眼图像展开是一个不错的方法鱼眼镜头可以视为一个半球 xff0c 经纬法按照球面贴图的类似思想将图像以球面形式展开以下面这
感知机（Perceptron）无法解决异或（XOR）问题的原因

目录 1 异或问题 2 感知机 xff08 Perceptron xff09 感知机 xff08 Perceptron xff09 为什么无法解决异或 xff08 XOR xff09 问题呢 xff1f 1 异或问题首先我们来分析一下什么
'list' object has no attribute 'astype'.

在使用python处理数据程序运行出现 39 list 39 object has no attribute 39 astype 39 的问题 xff0c 代码如下 xff1a x data y data 61 pickle load o
用Kazam软件在Ubuntu系统下获取的截图、录屏在Windows系统下无法打开、播放问题：用格式工厂、Handbrake来解决

解决步骤如下 xff1a 1 xff0c 用kazam在Ubuntu系统下获取的截图录屏以windows下能够读取的名字来修改保存的文件名 2 xff0c 在windows系统下可直接打开截图并复制删除等操作 3 xff0c 在Wind
MPU9250调试笔记（融合磁力计计算Yaw）

底部附源码 2022 10 5 61 61 61 61 61 61 61 61 61 61 61 61 61 61 61 61 61 61 61 产品需要一个姿态传感器 xff0c 使用了MPU9250 xff0c 主要是算法库不太好找
ROS环境下大疆tello无人机源码安装&驱动代码解读

大疆tello无人机是一款微小型无人机 xff0c 可以支持多种开发模式这里用的是ROS1的kinetic版本进行开发参考文档来自http wiki ros org tello driver 1 xff09 kinetic下tello源
Gazebo仿真--无人机添加传感器并且在rviz中显示数据

近来为了实现更加接近真实的仿真 xff0c 准备给无人机添加传感器这里以激光雷达rplidar为例 xff0c 其他传感器如深度相机D435i也是类似的首先打开无人机模型文件 xff08 我这里是用了amovlab的p450 uav1
http文件服务器（Ubuntu）

apache文件服务器 xff08 Ubuntu xff09 环境 xff1a Ubuntu18 4 需求 xff1a 搭建一个资源共享的文件下载站 xff0c 支持多用户长这样 xff1a 传输文件的协议有很多 xff0c 例如 xff
pytorch DataParallel理解及易犯错误（逻辑上感觉没问题，但是返回时候却出错）

本文只针对单机多GPU使用dataparallel进行加速运算写在前边 xff1a dataparallel只存在于继承了nn Modules类的forward 计算中大致流程如下 xff1a span class token keyw
Python 中补码表示

剑指offer 中有一道题 xff1a 输入一个整数 xff0c 输出该数二进制表示中 span class token number 1 span 的个数其中负数用补码表示如果不是负数很好解决 xff0c 用到如下技巧即可 n spa
ali笔试

题目描述 xff1a 输入两个字符串s1 span class token punctuation span s2 span class token punctuation span 只能对s1进行一种操作 xff0c 即可以将字符串中任意
edas上传过程中的一些错误

关于latex使用的一些教训总结 xff1a failed 1 paper has an average line spacing of 8 97 pt but should have 10 You may need to increase
作业一（part1）：使用威斯康辛大学关于乳腺癌诊断数据集的相关数据，采用决策树算法（或随机森林）分析乳腺癌诊断数据集，推断肿瘤发病可能情况，然后用5分类

仅供自己学习使用 xff01 xff01 xff01 这篇博客先对数据集做一些介绍参考链接 xff1a http docode techyoung cn breast cancer wisconsin html 乳腺癌的早期诊断意义重大

作业一（part1）：使用威斯康辛大学关于乳腺癌诊断数据集的相关数据， 采用决策树算法（或随机森林）分析乳腺癌诊断数据集，推断肿瘤发病可能情况，然后用5分类

作业一（part1）：使用威斯康辛大学关于乳腺癌诊断数据集的相关数据， 采用决策树算法（或随机森林）分析乳腺癌诊断数据集，推断肿瘤发病可能情况，然后用5分类 的相关文章

随机推荐

热门标签

作业一（part1）：使用威斯康辛大学关于乳腺癌诊断数据集的相关数据，采用决策树算法（或随机森林）分析乳腺癌诊断数据集，推断肿瘤发病可能情况，然后用5分类

作业一（part1）：使用威斯康辛大学关于乳腺癌诊断数据集的相关数据，采用决策树算法（或随机森林）分析乳腺癌诊断数据集，推断肿瘤发病可能情况，然后用5分类的相关文章