Python
Java
PHP
IOS
Android
Nodejs
JavaScript
Html5
Windows
Ubuntu
Linux
Python数据分析与机器学习----收入的预测分析
一 题目 利用age workclass native country等13个特征预测收入是否超过50k 是一个二分类问题 二 训练集 32561个样本 每个样本14个特征 其中6个连续性特征 9个离散型特征 三 测试集 16281个样本
python
机器学习
数据分析
【进阶】使用Excel进行回归分析,预测真实值
预备阅读 进阶 使用Excel进行相关分析 前言 昨天学习了Excel中的相关分析 在数据分析中 相关分析和回归分析关系紧密 今天来学习下Excel中的回归分析 回归分析 回归分析 regressionanalysis 是确定两种或两种以上
原创文章
Excel
数据
数据分析
数据之美
R语言broom包整洁化模型
文章目录 载入包 建模 broom 整洁模型数据 purrr包向量化函数与broom包结合 broom是tidyverse系列包之一 可以帮助人们获得干净整洁的模型数据结果 有效改善了R语言建模的用户体验 载入包 library tidyv
R语言
数据分析
机器学习
数据挖掘
数据分析 数据规约
一 概念 数据规约 Data Reduction 是指在尽可能保持数据原貌的前提下 最大限度地精简数据集 数据规约又分为2类 属性规约 和 数值规约 二 属性规约 1 概念 属性规约 Attributes Reduction 是指通过减少数
数据分析
数据挖掘
数据规约
Pandas处理日期数据
一 pandaas日期处理的作用 将2018 01 01 1 1 2018等多种日期格式映射成统一的格式对象 在该对象上提供强大的功能支持 几个概念 1 pd to datetime pandas的一个函数 能将字符串 列表 series变
pandas学习
数据挖掘
python
数据分析
实战干货!用 Python 爬取股票实时数据!
今天我们一起来学习一个 Python 爬虫实战案例 我们的目标网站就是东方财富网 废话不多说 开搞 网站分析 东方财富网地址如下 http quote eastmoney com center gridlist html hs a boar
python
开发语言
数据挖掘
数据分析
数据分析——工作中遇到的“辛普森悖论”
一 辛普森悖论定义 辛普森悖论 Simpson s Paradox 是英国统计学家 E H 辛普森 E H Simpson 于1951年提出的悖论 即在某个条件下的两组数据 在分别讨论时都会满足某种性质 可是一旦合并起来进行考虑 却可能导致
统计学
数据分析
数据挖掘流程-HCIE-BigData
机器学习流程 机器学习流程 1 了解需求 确认目标 2 获取数据 3 审阅数据 4 数据分析 4 1 统计分析 4 2 相关性分析 4 3 图形分析 1 散点图 2 热力图 3 直方图 4 统计图 5 柱状图 6 饼图 7 综合绘图 5 数
机器学习
python数据分析
python
数据分析
pandas 解决滑动窗口不会计算存在空值的窗口
Pandas官方的滑动窗口文档请参考 https pandas pydata org docs reference api pandas DataFrame rolling html 解决方法 添加参数 min periods 用于指定 当
python
数据处理
pandas
数据分析
vika+obsidian快速进入一个研究领域
目的是快速熟悉一个陌生的研究领域 写出文献综述 步骤 检索相关文献100篇以上 在vika中建表格 表头如下所示 阅读100篇论文的题目 关键词 摘要 填充vika表格 并找出需要精度的文献10篇左右 中文综述优先 精度10篇论文 并用ob
数据分析
举例详解数据分析会用到哪些SQL技能?
本文首发个人知乎https zhuanlan zhihu com p 137328389和个人微信公众号 呆呆玩数据 背景介绍 在一家知名电商企业的BI部门实习四个多月 岗位为数据分析 日常工作中打交道最多的就是SQL和EXCEL 在实习之
sql
数据分析
100天精通Python(数据分析篇)——第68天:Pandas数据清洗函数大全(判断缺失、删除空值、填补空值、替换元素、分割元素)
文章目录 一 drop 删除指定行列 1 删除指定行 2 删除指定列 二 del 删除指定列 三 isnull 判断是否为缺失 1 判断是否为缺失 2 判断哪些列存在缺失 3 统计缺失个数 四 notnull 判断是否不为缺失 五 drop
100天精通Python从入门到就业
python
pandas
数据分析
URL、URI和URN之间的区别
IT 技术
http
数据分析
数据分析之T检验
1 定义 t检验 亦称student t检验 Student s t test 主要用于样本含量较小 例如n lt 30 总体标准差 未知的正态分布 t检验是用t分布理论来推论差异发生的概率 从而比较两个平均数的差异是否显著 它与f检验 卡
数据分析
浅谈数据分析和数据挖掘
1 数据分析 数据分析是指用适当的统计分析方法对收集来的大量数据进行分析 提取有用信息和形成结论而对数据加以详细研究和概括总结的过程 数据分析有极其广泛的应用范围 典型的数据分析过程可看做 四部曲 第一 数据获取 获取数据的前提是对商业问题
数据分析
数据分析(师)
数据挖掘
数据清洗,数据分析,数据挖掘的区别
数据清洗 是指对原始数据进行预处理 包括去重 去噪 填充缺失值 处理异常值等操作 以提高数据的质量和可用性 保证分析和挖掘的可靠性 数据清洗是数据处理的基本步骤 也是数据分析和数据挖掘的前提 数据分析 是指利用统计学和数据科学技术对数据进行
数据挖掘
数据分析
干货
源于频率主义学派的极大似然估计 Maximum Likelihood Estimation 简称MLE 是根据数据采样来估计概率分布参数的经典方法 在机器学习的对数几率回归 贝叶斯分类器等中有广泛的应用 1 极大似然估计法 设总体的概率密度
机器学习专题
机器学习
数学建模
人工智能
数据分析
动手学数据分析 Task5
动手学数据分析 Task5 一 逻辑回归 二 随机森林 三 模型评估 3 1 k折交叉验证 3 2 混淆矩阵 3 3 ROC曲线 一 逻辑回归 LogisticRegression penalty l2 dual False tol 0 0
python
数据分析
机器学习
Excel使用hlookup和offset实现动态查询报表
文章目录 1 筛选器 2 hLookUp函数 3 sum offset函数 4 mod函数 效果图 数据源 文件下载 https download csdn net download diyangxia 85231108 1 筛选器 在年份
数据分析
Excel
动态查询
offset
match
Python数据分析基础篇--NumPy
大家好 我是小研 一个在研究生路上的苦行僧 今天给大家分享一下Python数据分析的Numpy基础 开启数据分析的基础篇 NumPy基础 NumPy Numerical Python的简称 是Python数值计算最重要的基础包 大多数提供科
Python数据分析学习
python
数据分析
NumPy
机器学习
«
1 ...
79
80
81
82
83
84
85
...87
»