Python
Java
PHP
IOS
Android
Nodejs
JavaScript
Html5
Windows
Ubuntu
Linux
数据分析——工作中遇到的“辛普森悖论”
一 辛普森悖论定义 辛普森悖论 Simpson s Paradox 是英国统计学家 E H 辛普森 E H Simpson 于1951年提出的悖论 即在某个条件下的两组数据 在分别讨论时都会满足某种性质 可是一旦合并起来进行考虑 却可能导致
统计学
数据分析
统计学——卡方检验和卡方分布
什么是卡方检验 卡方检验是一种用途很广的计数资料的假设检验方法 它属于非参数检验的范畴 主要是比较两个及两个以上样本率 构成比 以及两个分类变量的关联性分析 其根本思想就是在于比较理论频数和实际频数的吻合程度或拟合优度问题 它在分类资料统计
统计学
卡方检验
统计学第七周 python验证正态分布/卡方分布/T
统计学第七周 一 知识回顾 上周已经学习过正态分布 卡方分布 T分布等知识 但是如何选择那 正态分布 卡方分布 T分布 二 实践 1 场景 泰坦尼克号数据 主要是age年龄 Fare价格即船票价格 Embark登船的港口 需要验证数据是否服
统计学
python
python数据挖掘
在数据集上计算连续随机变量的信息熵和互信息--k-近邻估计方法
写在前面 信息熵 entropy 的原始定义是离散 discrete 的 后来发展了在连续域上的微分熵 differential entropy 然而 通常在给定的数据集上 无法知道连续变量的概率分布 其概率密度函数也就无法获得 不能够用微
数据分析
信息熵
概率论
统计学
机器学习之交叉验证(cross-validation,CV)
机器学习之交叉验证 cross validation CV 人和计算机的主要区别在于人可以对问题进行思考 而计算机只会计算 从AI角度来看 人们将大量无序嘈杂的数据简单清洗之后喂 feed 给计算机 训练使其得出含参数的模型 在模型的基础上
机器学习
算法
统计学
«
1
2
3
4
5
6