Python
Java
PHP
IOS
Android
Nodejs
JavaScript
Html5
Windows
Ubuntu
Linux
大数据导论学习日志Day1
第一章大数据概述 1数据 1 1数据的概念 数据是指对客观事件进行记录并可以鉴别的符号 是对客观事物的性质 状态以及相互关系等进行记载的物理符号或这些物理符号的组合 是可识别的 抽象的符号 数据和信息是两个不同的概念 信息是较为宏观的概念
big data
大数据
数据仓库
Hive窗口函数大全
Hive窗口函数 一 偏移量函数 lag lead 二 窗口分析函数 first value last value 三 排序函数 rank dense rank row number 一 偏移量函数 lag 语法 lag col n def
hive
Hadoop
数据仓库
数据挖掘技术的来源、历史、研究内容及常用技术
数据挖掘技术的来源 历史 研究内容及常用技术 1 数据挖掘技术的由来 1 1网络之后的下一个技术热点 我们现在已经生活在一个网络化的时代 通信 计算机和网络技术正改变着整个人类和社会 如果用芯片集成度来衡量微电子技术 用CPU处理速度来衡量
算法研究(数据挖掘机器学习自然语言深度学习搜索引擎)
数据挖掘
数据库
数据仓库
网络
[1218]hive之Map Join使用方法
文章目录 介绍 mapjoin的使用方法 介绍 MAPJION会把小表全部加载到内存中 在map阶段直接拿另外一个表的数据和内存中表数据做匹配 由于在map端是进行了join操作 省去了reduce运行的时间 算是hive中的一种优化 如上
大数据
hive
Hadoop
数据仓库
数据仓库建设及数据治理总结
在谈数仓之前 先来看下面几个问题 数仓为什么要分层 用空间换时间 通过大量的预处理来提升应用系统的用户体验 效率 因此数据仓库会存在大量冗余的数据 不分层的话 如果源业务系统的业务规则发生变化将会影响整个数据清洗过程 工作量巨大 通过数据分
数据仓库
数据分析
数据中台
大数据
数据治理
【转】Oracle性能调整的误区
Oracle性能调整的误区 http tech it168 com db o 2006 07 03 200607031305157 shtml 为了提高性能 我们针对Oracle数据库本身提供了的方法或方案进行过不少的尝试 主要包括 共享服
oracle性能调优
Oracle
服务器
数据仓库
负载均衡
阿里资深架构师答疑:数据湖概相关念、特征、架构与案例
写在前面 最近 数据湖的概念非常热 许多前线的同学都在讨论数据湖应该怎么建 阿里云有没有成熟的数据湖解决方案 阿里云的数据湖解决方案到底有没有实际落地的案例 怎么理解数据湖 数据湖和大数据平台有什么不同 头部的云计算玩家都各自推出了什么样的
架构微学堂
架构沉思录
数据湖
数据仓库
使用 Waffle 进行测试的基本流程及使用方法-文章来自问我社区
前言 Waffle 是一款适配 ehter js 的智能合约测试库 本样例演示了使用 Waffle 进行测试的基本流程及使用方法 Waffle 详细使用方法可以参考 Waffle 官网 对于不熟悉 Waffle 测试框架的开发者 可以根据本
区块链
开发语言
数据仓库
十分钟带你走进Hive世界(每走一步都是为了离你更近些)
该文章已更新到语雀中 后台回复 语雀 可获取进击吧大数据整个职业生涯持续更新的所有资料 该文基于Hive专题 从SQL聊Hive底层执行原理进一步的深入学习Hive 相信大多数童鞋对于Hive底层的执行流程只是局限于理论层面 那么本篇将带大
大数据
数据仓库
hive
big data
《KyLin学习理解》-01-KyLin麒麟的简介及其思想
1 美图 1 诞生背景 HIVE是数据仓库 是把存储在HDFS分布式文件系统的存储文件映射到类似于关系型数据库的东西 举个例子 假设有一个文件存储在本地 opt hzjs lcc work pro txt文件 文件的格式为 1 产品120
大数据KyLin(麒麟)
Kylin
数据仓库
hive
跟我一起学【数据仓库】之——需要避免的维度建模错误
1 在事实表中放入文本属性 2 限制使用冗长的描述符以节省空间 3 将层次 xff08 级联的多对一关系序列 xff09 划分为多个维度 4 忽略跟踪维度的变化 合理运用缓慢变化维度的类型 xff0c 或者微型维度 5 使用更多的硬件解决遇
跟我一起学
数据仓库
需要避免的维度建模错误
«
1 ...
11
12
13
14
15
16
17