学习科大讯飞的StatQuest机器学习课笔记(2)

2023-05-16

#Day2学习笔记07/20
ROC和AUC
1.假设一个逻辑回归曲线可以推测出一个结果的概率,然后选取某个概率作为分类的阈值。由于使用不同概率作为分类的阈值会计算出不同的敏感性和特异性,因此为了评价哪个概率会得出最佳分类结果,便需要对所有概率选择得出的分类结果的特异性和敏感性做统计,由此得出Receiver Operator Characteristic(受试者工作特征)的一条曲线汇总这些信息。
2.纵坐标为真阳性率也就是敏感性(真阳性/(真阳性+假阴性)),它用来表示正确归类正向样本的比例。
3.横坐标为假阳性率也就是(1-特异性)(假阳性/(真阴性+假阳性)),它是一个错误率,用来表示反向样本中误判为正向的比例。
4.对角线上的点表示正确分类正向样本的比例等于错误分类反向样本的比例。
5.ROC图代表了不同阈值产生的所有混淆矩阵。
6.AUC(Area under the curve)是roc的面积,面积越大的分类方法效果越好。
7.除了使用真阳性率和假阳性率来绘制图以外,还可以用精确度来替换假阳性率绘制混淆矩阵信息图。精确度等于真阳性/(真阳性+假阳性),用来描述正确分类为阳性结果的比例。当样本中存在很多的反向样本时,精确度比假阳性率更有用。
8.ROC曲线可以轻易确定决策时的最佳阈值,AUC可以帮助确定哪种分类方法更好。

 

R语言实现

>library(pROC)
>library(randomForest)
>set.seed(420)
>num.samples <- 100
>weight <- sort(rnorm(n=num.samples,mean=172,sd=29))
>obese <- ifelse(test=(runif(n=num.samples) < (rank(weight)/100)), yes=1,no=0)
>obese
>plot(x=weight, y=obese)
>glm.fit=glm(weight ~ obese, family=binomial)
>lines(weight,glm.fit$fitted.values)
>par(pty="s")
>roc(obese, glm.fit$fitted.values, plot=TRUE, legacy.axes=TRUE, percent=TRUE, xlab="False Positive Percentage", ylab="True Positive Percentage", col="#377eb8", lwd=4, print.auc=TRUE, print.auc.x=45, partial.auc=c(100,90), auc.polygon=TRUE, auc.polygon.col="377eb822")
>roc.info <- roc(obese, glm.fit$fitted.value, legacy.axes=TRUE)
>roc.df <- data.frame(tpp=roc.info$sensitivities*100, fpp=(1-roc.info$specificities)*100, thresholds=roc.info$thresholds)
>head(roc.df)
>tail(roc.df)
>roc.df[roc.df$tpp>60, roc.df$fpp<80]


>rf.model <- randomForest(factor(obese)~weight)
>roc(obese, glm.fit$fitted.values, plot=TRUE, legacy.axes=TRUE, percent=TRUE, xlab="False Positive Percentage", ylab="True Positive Percentage", col="#377eb8", lwd=4, print.auc=TRUE)
>plot.roc(obese, rf.model$votes[,1], percent=TRUE, col="#4daf4a", lwd=4, print.auc=TRUE, add=TRUE, print.auc.y=40)
>legend("bottomright", legend=c("Logistic Regression", "Random Forest"), col=c("#377eb8","#4daf4a"), lwd=4)
>par(pty="m")

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

学习科大讯飞的StatQuest机器学习课笔记(2) 的相关文章

  • [ WARN:0] global C:\projects\opencv-python\opencv\modules\videoio\src\cap_msmf.cpp (674) SourceReade

    capture 61 cv2 VideoCapture 0 出现警告 xff1a WARN 0 global C projects opencv python opencv modules videoio src cap msmf cpp
  • 租用游艇问题(动态规划)

    问题描述 xff1a 长江游艇俱乐部在长江上设置了n个游艇出租战1 xff0c 2 xff0c xff0c n 游客可以在这些游艇出租站租用游艇 xff0c 并在下游的任何一个游艇出租站归还游艇 游艇出租站 i 到游艇出租站 j 之间的租金
  • 对照JAVA学习Rust(07)--类和结构体

    1 Java类和Rust结构体 对象体结构 xff0c Java的类定义可包括属性和函数 xff0c 或常量 而Rust 结构体里只有属性字段 xff0c 函数需要在关联到架构体使用impl 结构体名如以下例子 JavaRust publi
  • HDU 3700 Cat

    Cat Time Limit 2000 1000 MS Java Others Memory Limit 32768 32768 K Java Others Total Submission s 451 Accepted Submissio
  • 解决supervisorctl引起的java进程oom一启动就被killed

    使用 supervisor 管理进程 当发现 某一个java进程 已启动就被killed 一直以为是程序哪里或者docker的内存有问题 原来是supervisor的一个命令 我的启动 java jar 放在了 某个 bash脚本中 sup
  • 以太网的帧间隙、前导码、帧开始定界符

    每个以太帧之间都要有帧间隙 xff08 Interframe Gap xff09 xff0c 即每发完一个帧后要等待一段时间才能再发 另外一个帧 xff0c 以便让帧接收者对接收的帧作必要的处理 xff08 如调整缓存的指针 更新计数 通知
  • Error: L6218E: Undefined symbol LED_Init (referred from main.o).

    在使用Keil软件的过程中 xff0c 经常会出现这种报错 xff0c undefined symbol xxxx referred from xxx o 这个时候大多是 c文件没有被包含在相应的路径中 xff0c o文件在我们的工程中没有
  • 让老照片重现光彩:Bringing Old Photos Back to Life(实战)

    Bringing Old Photos Back to Life 香港城市大学和微软亚洲研究院的 让老照片重现光彩 xff08 Bringing Old Photos Back to Life xff09 项目侧重于对老照片进行划痕修复和人
  • GitLab配置ssh key:gitlab add an ssh key

    一 检查 创建SSH Key 在用户主目录下 xff0c 看看有没有 ssh目录 xff0c 如果有 xff0c 再看看这个目录下有没有id rsa和id rsa pub这两个文件 xff0c 如果已经有了 xff0c 可直接跳到下一步 如
  • 请求头(request headers)和响应头(response headers)解析

    请求头 xff08 request headers xff09 POST user signin HTTP 1 1 请求方式 文件名 http版本号 Host passport cnblogs com 请求地址 Connection kee
  • Tableau基础操作——连接数据源

    Tableau基础操作 连接数据源 Tableau基础操作 连接数据源 前言 随着大数据时代的到来 xff0c 借助于数据分析工具深入分析并可视化呈现变得越来越重要 而Tableau以其低功能强大且学习成本低被越来越多的企业所使用 一 Ta
  • linux下休眠/待机命令

    if you cat sys power state mem disk you can echo mem gt sys power state 这相当于待机 echo disk gt sys power state 这相当于休眠 from
  • 从零开始离线安装k8s集群

    本文主要用于在内网 xff08 离线 xff09 环境安装k8s集群 xff1b linux环境 centos7 6 主要步骤有 xff1a 安装docker创建dokcer 私有镜像库 registry安装kubernetes安装flan
  • 虚拟机中的Linux系统无法识别U盘

    问题描述 xff1a 将U盘插入到电脑USB接口 xff0c 然后在虚拟机的右下角选择让U盘从Windows上断开 xff0c 链接到虚拟机上来 链接上虚拟机后 xff0c 在Linux系统中输入命令fdisk l命令 xff0c 却只有
  • C语言丨关键字enum用法详解,看这篇就够了

    一 关键字enum的定义 enum是C语言中的一个关键字 xff0c enum叫枚举数据类型 xff0c 枚举数据类型描述的是一组整型值的集合 xff08 这句话其实不太妥当 xff09 xff0c 枚举型是预处理指令 define的替代
  • CCF CSP 201512-3 画图

    字符串基础题 问题描述 用 ASCII 字符来画图是一件有趣的事情 xff0c 并形成了一门被称为 ASCII Art 的艺术 例如 xff0c 下图是用 ASCII 字符画出来的 CSPRO 字样 lt 本题要求编程实现一个用 ASCII
  • fails sanity check错误的解决方法

    fails sanity check的解决方法 问题原因 xff1a 编译器缺乏必要的package xff1a 解决办法 xff1a 运行yum install glibc headers gcc c 43 43 即可解决
  • Rust tokio::select学习杂记

    Rust tokio select学习杂记 前言 Linux系统有select poll epoll等 xff0c 主要用于监控各种fd上发生的各种event 从而识别派发处理 golang语言中也有一个select xff0c 作用相似
  • IntelliJ IDEA2020【插件推荐】

    1 推荐动画效果插件 xff1a activate power mode 注 xff1a 需要消耗一定的系统资源 第一步 xff1a 在插件中心在线安装activate power mode插件 xff0c 安装好之后 xff0c 重启ID
  • k8s: 使node不参与调度

    可以通过命令 xff1a kubectl patch node k8s span class token operator span master span class token operator span p 39 span class

随机推荐