Python
Java
PHP
IOS
Android
Nodejs
JavaScript
Html5
Windows
Ubuntu
Linux
数据挖掘的研究背景
数据挖掘是一门研究如何从大量的数据中发现有用的信息和知识的学科 数据挖掘的研究背景可以归纳为以下几点 数据爆炸 随着信息技术的发展 数据的生成速度越来越快 数据量越来越大 人们希望能够从中发现有用的信息和知识 决策支持 数据挖掘可以帮助人们
数据挖掘
人工智能
大数据
数据分析
数据库
数据挖掘的一般过程(小白的学习加实践记录)
数据挖掘的过程 虽然很早确定了研究任务 从网络数据获取 地理实体数据集成与处理 分析挖掘 制图或知识表达的思路来开展这方面的研究工作 分析挖掘如文本挖掘 空间关联分析 空间趋势分析 空间分布分析 空间聚类 空间分类分析等等 奈何上学期我一学
数据挖掘
kaggle竞赛——数据处理
kaggle竞赛攻略 数据处理 数据导入 Datatable time import datatable as dt df dt fread data train csv print Train size data shape Train
数据处理
深度学习
数据挖掘
kaggle
基于k-means聚类算法的城市出租车GPS时空分布特征分析
目录 前言 一 研究目的 二 数据源 三 数据预处理 3 1 通用预处理 3 2 删除出租车数据中载客状态瞬间变化的记录 3 3 获取OD数据 3 4 判断每一辆出租车的OD数据中最靠近整点时刻的记录 采用字典形式储存 3 5 将每一整点时
数据分析
聚类
算法
kmeans
数据挖掘
Apache Eagle:实时安全监控方案
原创 2016 03 27 朱洁 hadoop技术学习 Eagle是eBay开源的一个分布式实时安全监控方案 通过离线训练模型集合实时流引擎监控 能立即监测出对敏感数据的访问或恶意的操作 并立即采取应对的措施 下图是Eagle的架构 Eag
hadoop技术专栏
eagle
数据挖掘
Hadoop
Hbase
用Python爬取英雄联盟(lol)全部皮肤
首先 我们打开英雄联盟官网主页 网址为 https lol qq com main shtml 然后向下拉 可以看到英雄列表 如图所示 接着随意选一个英雄点击进入看一下 如图所示 再点击鼠标右键 接着选择检查 看一下皮肤的 URL 如图所示
python爬虫
列表
python
编程语言
数据挖掘
全国企业税收调查数据(2007-2016)共10年数据,均未脱敏。可通过纳税人识别号,识别具体企业名称和地区信息等,可匹配中国工业企业数据库,中国出口海关统计数据、中国企业污染排放数据库、中国海关数据
数据库
数据挖掘
经验分享
数据分析系列之目录
数据挖掘系列前言和目录 1 前言 为什么我要开这个系列 我明白 未来会是数据的天下 就如区块链而言 它是目前无法单独去生存下去 而是与其他技术绑定 才能更好地发挥未来的作用 什么是数据分析 就拿区块链的挖矿类比来说 数据就是矿 如何从大量矿
数据分析
数据挖掘
如何解决二分类中的样本不平衡问题
在搭建模型时 二分类中 经常会遇到目标变量的分类数量相差很大 比如分类是1的数量是5000 分类是0的数量是100 这样如果对数据的不平衡性不做处理 模型的效果也会很差 今天用一个案例来进行实操 1 案例目的 找出有资金需求的中小企业借贷户
分类
数据挖掘
人工智能
python
机器学习
曼哈顿距离,欧式距离,余弦距离
1 曼哈顿距离 曼哈顿距离 叫出租车距离的 具见上图黄线 应该就能明白 计算距离最简单的方法是曼哈顿距离 假设 先考虑二维情况 只有两个乐队 x 和 y 用户A的评价为 x1 y1 用户B的评价为 x2 y2 那么 它们之间的曼哈顿距离为
数据挖掘,机器学习
数据挖掘
欧氏距离
余弦距离
曼哈顿距离
大数据开发教程——MapReduce原理及编程
什么是MapReduce MapReduce是一种编程模型 用于大规模数据集 大于1TB 的并行运算 概念 Map 映射 和 Reduce 归约 是它们的主要思想 都是从函数式编程语言里借来的 还有从矢量编程语言里借来的特性 MapRedu
大数据架构师源码零基础教程
MapReduce
big data
数据挖掘
数据分析之数据预处理、分析建模、可视化
大纲 思维导图 1 数据分析概述 1 1 简介 1 2 发展历程 1 3 应用领域 1 4 开发流程 2 数据类型 2 1 结构化与非结构化数据 2 2 定性与定量数据 2 3 截面数据与时间序列数据 3 数据来源 4 数据预处理方法 4
数据分析
数据挖掘
python
大数据
Panel三维数据结构丨Pandas数据分析基础(5)
个人主页 互联网阿星 格言 选择有时候会大于努力 但你不努力就没得选 作者简介 大家好我是互联网阿星 和我一起合理使用Python 努力做时间的主人 如果觉得博主的文章还不错的话 请点赞 收藏 留言 支持一下博主哦 行业资料 PPT模板 简
数据分析
数据挖掘
python
pandas教程
python数据分析
机器学习类比赛中经常用到的一些函数和知识点
文章目录 豆瓣 清华源命令 pip升级命令 画图plot汉字显示不出 python控制台打印结果省略的问题 enumerate pandas描述数据基本分布情况 isin 判断值是否存在 某两个特征之间的关联性 np corrcoef fo
机器学习
数据挖掘
python
2022年度笔记本十大热门品牌销量排行榜
近年来 由于大环境的改变 线上教育 线上办公等的需求使得平板电脑出货量逐步提升 同时 5G时代来临 万物互联是未来的趋势 手机由于操作系统和交互上的局限性 笔记本电脑将会扮演更加重要的角色 未来 整个笔记本电脑行业的空间有望进一步打开 根据
大数据
数据分析
产品运营
数据挖掘
信息可视化
机器学习与数据挖掘参考文献
统计学习方法 李航 机器学习 周志华
机器学习数据挖掘
机器学习
数据挖掘
参考文献
数据挖掘简答知识点总结
绪论 为什么进行数据挖掘 1 已获得的大量数据往往是数据丰富但信息贫乏的 2 计算设备变得廉价且功能强大 3 没有强大的工具的话 数据量已经超过人类的理解能力 4 数据收集存储的速度越来越快 5 传统技术已经不适用于原始数据 6 数据挖掘有
数据挖掘
什么是用户增长? (超详细)
一 概况 原因 随着人口红利的衰减 互联网流量红利的马太效应显现 这意味着成本的大幅度增加 企业必须改变过去粗放型的营销和运营方式 用更高效更低成本实现快速增长 定义 通过实验和数据驱动 聚焦整个用户生命周期的方法论 在任何一家公司 任何业
业务
大数据
数据分析
数据挖掘
R语言broom包整洁化模型
文章目录 载入包 建模 broom 整洁模型数据 purrr包向量化函数与broom包结合 broom是tidyverse系列包之一 可以帮助人们获得干净整洁的模型数据结果 有效改善了R语言建模的用户体验 载入包 library tidyv
R语言
数据分析
机器学习
数据挖掘
数据分析 数据规约
一 概念 数据规约 Data Reduction 是指在尽可能保持数据原貌的前提下 最大限度地精简数据集 数据规约又分为2类 属性规约 和 数值规约 二 属性规约 1 概念 属性规约 Attributes Reduction 是指通过减少数
数据分析
数据挖掘
数据规约
«
1 ...
46
47
48
49
50
51
52
»