机器学习历程——人工智能基础与应用导论 专题篇(statsmodel)(3)

2023-11-13

目录

一、介绍

1、官网

2、主要功能

3、安装

二、t检验

1、概念

2、假设条件

3、单样本t检验

 4、配对样本t检验

三、McNemar检验与Nemenyi检验

四、Friedman检验

一、介绍

1、官网

Introduction — statsmodels

是一个Python库,用 于拟合多种统计模型,执行统计测试以及数据探索和可视化。

2、主要功能

3、安装

方法一:pip install statsmodels

方法二:conda install –c conda-forge statsmodels

二、t检验

1、概念

通过比较不同数据之间的差值,以观察数据之间有没有显著差异。适用于小样本(30个以下)、总体方差未知的情况。

2、假设条件

(1)总体分布服从正态或近似服从正态分布

(2)检验定量数据,即数据大小是有意义的,对于分类数据的检验请移步卡方检验


# 区别:样本标准差和总体标准差
# 样1本标准差=(x-均值)/(n-1)
# 总体标准差=(x-均值)/n

# 用scipy计算出的是:双尾检验
# 单(1samp)样本t检验(ttest_1samp)
# 相关(related)样本t检验(ttest_rel)
# 双独立(independent)样本t检验(ttest_ind)
    # 当不确定两总体方差是否相等时,应先利用levene检验,检验两总体是否具有方差齐性。
    # stats.levene(data1,data2)
    # 如果返回结果的p值远大于0.05,那么我们认为两总体具有方差齐性。
    # 如果两总体不具有方差齐性,需要加上参数equal_val并设定为False。如下。
    # stats.ttest_ind(data1,data2,equal_var=False)

# 判断标准(显著水平)alpha=5%,1%,10%
# 左尾判断条件:t < 0 and p_one < 判断标准(显著水平)alpha
# 右尾判断条件:t > 0 and p_one < 判断标准(显著水平)alpha
# p值:假定原假设成立的前提下,得到样本平均值的概率是多少。p值越小,则拒绝原假设

# 效应量:在判断某个调查研究的结果,是否有意义或者重要时,要考虑的另一项指标是效应量。
# 效应量太小,意味着处理即使达到了显著水平,也缺乏实用价值。
# .20 小的效应,.50中等效应,.80高的效应(d绝对值)

3、单样本t检验

假定我们得到了k个测试错误率,, 则平均测试错误率

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

机器学习历程——人工智能基础与应用导论 专题篇(statsmodel)(3) 的相关文章

随机推荐

  • linux 启动盘zhi,Linux制作启动盘之dd命令详解

    1 dd命令简介 dd在linux中是 一个非常强大的工具 常用于复制大量数据 测试读写性能 清空硬盘数据 不可恢复 由于dd 命令允许以二进制方式读写 所以特别适合在原始设备上输入 输出 dd命令用于复制文件并对原文件的内容进行转换和格式
  • Windows 通过CMD窗口利用mybatis-generator连接Oracle快速生成代码

    环境说明 Windows10 JDK8 ojdbc6 11 2 0 4 jar mybatis generator core 1 3 7 jar 1 在C盘新建autoMybatis文件夹 文件夹中新建generator xml文件 并将o
  • bzoj3309 DZY Loves Math

    题目链接 bzoj3309 题目大意 对于正整数n 定义f n 为n所含质因子的最大幂指数 给定正整数a b 求 ai 1 bj 1f gcd i j sum i 1 a sum j 1 b f gcd i j T lt 10000 1 l
  • Android系统中设置TextView的行间距

    Android系统中TextView默认显示中文时会比较紧凑 不是很美观 为了让每行保持一定的行间距 可以设置属性android lineSpacingExtra或android lineSpacingMultiplier 1 设置行间距
  • Echarts中X轴label间隔显示=>interval

    项目中我们经常都会遇到大量数据 需要我们的echarts来展示 但是我们的X轴的label是长度是有限的 在大量数据的传递下必然出现label重叠 这个时候我们就要用到interval如图 通过设置xAxis中的axisLabel inte
  • OpenMP和OpenACC

    OpenMP OpenMP是CPU的并行编程模型 它使用编译器指令来识别并行区域 omp set num threads n streams 用来指定要用到的CPU线程数 类似于设置环境变量 pragma omp parrallel 标记代
  • 使用openMVS对样例数据进行重建

    openMVS根据github上的步骤进行编译 注意 如果没有GPU 用不了CUDA的话 那么需要在openMVS目录下找到CmakeLists txt文件 把CUDA设置为OFF SET OpenMVS USE CUDA OFF CACH
  • linux系统之字符设备驱动——IIC驱动mma8451q

    linux系统之字符设备驱动 IIC子系统驱动mma8451q 1 原理图 2 驱动程序 mma8451q c Author your name Date 2021 02 23 22 16 37 LastEditTime 2021 02 2
  • The POM for is missing no dependency information available

    环境 win7 64 MyEclipse 10 5 java version 1 8 0 91 报错 1 导入报错 No marketplace entries found to handle maven compiler plugin 3
  • 求一个数阶乘末尾有几个零

    昨天校赛有一道题 是求一个数的阶乘 末尾有几个零 当时是没有做出来的 今天网上看了下 明白了原理 其实很多人都写过了 自己之所以再写 一是为了加强自己的理解 二是有的地方或许可以写得更详细 也写出自己思考的一些误区 回到题目本身 求一个数的
  • VTK库的编译和安装

    一 准备工具 CMake工具 Visual Studio 2013 VTK 8 1 0 The Visualization Toolkit 最新版源码 或者其他版本 二 使用CMake生成VTK的MS VS工程文件 打开CMake 设置源码
  • 基于CUDA的GPU优化建议

    l GPU硬件特性 n 存储层次 u Global memory l 大小一般为几GB l chip off的DRAM介质存储器 l 访问速度慢 是shared memory的上百倍 l 对于是否对齐和连续访问敏感 由DRAM的性质决定 l
  • 非常适合金融人的副业,不用坐班,时间自由!

    最近在论坛上看到一个测试 特扎心 以下三种情况 哪个让你最绝望 月薪4500 花呗欠了10000 被领导骂到哭 因为没钱不敢裸职 租房子的中介公司突然倒闭 房东逼你搬出去 你却拿不出押一付三的费用 说实话 我真的选不出 每一个都让我崩溃 0
  • 什么是白盒测试?什么是黑盒测试?两者的主要区别

    从测试方法上分 软件测试可分为白盒测试和黑盒测试 1 白盒测试 白盒测试 又称结构测试 主要用于单元测试阶段 它的前提是可以把程序看成装在一个透明的白箱子里 测试者完全知道程序的结构和处理算法 这种方法按照程序内部逻辑设计测试用例 检测程序
  • R语言—数据框

    文章目录 数据框 Dataframe 创建数据框 数据框的访问 通过组件的索引值来访问组件 通过组件的组件名来访问组件 通过访问矩阵的方式来访问组件 数据筛选 扩展数据框 添加列 添加行 使用apply 函数 数据框 Dataframe 数
  • 机器学习路径

    文章目录 前言 1 课前准备 2 主流的学习过程 3 具体内容 4 主要方向 体系 自然语言处理 知识图谱 计算机视觉 人机交互 参考资料 前言 1 机器学习到底应该怎么去学 机器学习的学习没有想象中的那么困难 当然也没有外面宣传的那么容易
  • R语言中的参数估计

    R语言中的参数估计 一直想要写博客来着 一直没有实现 昨天看室友写了 借着复习R语言考试 来开启我的第一篇博客叭 以下我将从点估计 区间估计来介绍区间估计 本文主要介绍R代码 具体的统计知识 详情可参考相关数理统计的专业书嗷 参数估计 R语
  • Day2 剑指offer

    30题 栈 定义栈的数据结构 请在该类型中实现一个能够得到栈的最小元素的 min 函数在该栈中 调用 min push 及 pop 的时间复杂度都是 O 1 示例 MinStack minStack new MinStack minStac
  • 【0007】由于找不到MSVCR100.dll,无法继续执行代码

    下载安装Microsoft Visual C 2010 VC2010运行库 程序语言编译环境就能解决 官网下载地址 https www microsoft com zh CN download details aspx id 14632
  • 机器学习历程——人工智能基础与应用导论 专题篇(statsmodel)(3)

    目录 一 介绍 1 官网 2 主要功能 3 安装 二 t检验 1 概念 2 假设条件 3 单样本t检验 4 配对样本t检验 三 McNemar检验与Nemenyi检验 四 Friedman检验 一 介绍 1 官网 Introduction