hive

大数据单机学习环境搭建(5)Hive建表DDL详解

专题大数据单机学习环境搭建和使用 1 Hive建表简单示例 1 1 Hive建表语句 1 2 表详细信息 1 3 数据展示 2 Hive建表语法详解 3 拓展1 复杂数据分割 4 拓展2 事务表大数据单机学习环境搭建 5 Hive建表D

hive 大数据

Hive常用函数介绍(窗口函数)

1 窗口函数介绍窗口函数也叫也叫OLAP函数 Online Anallytical Processing 联机分析处理可对数据库数据进行实时分析处理 2 窗口函数入门 2 1 函数说明窗口函数也可以叫做开窗函数其从本质来看是将

hive 数据仓库 sql GraphQL

hive排序-order by / sort by / distribute by / cluster by

1 Order By 全局排序全局排序只能有一个reduce 1 1 使用 ORDER BY 子句排序 ASC ascend 升序默认 DESC descend 降序 1 2 ORDER BY 子句在SELECT语句的结尾 1 3 d

hive

数仓建模—宽表的设计

宽表的设计高内聚低耦合宽表是数仓里面非常重要的一块数仓是分层的这是技术进步和时代变化相结合的产物数仓的分层式为了更好地管理数仓以及更加高效地进行数据开发宽表主要出现在dwd 层和报表层当然有的人说dws 层也有宽表从字面意

Hive 大数据 数据仓库 数据挖掘 hive

数据清洗分析导出遇到的一些问题

本文简单记录一个学习过程无技术含量勿喷环境 ambari 2 6 1 spark 2 1 python 3 6 oracle 11 2 sqoop 1 4 最近一直在测试数据采集清洗分析导出展示的一系列的工作主要数据流程如下

spark hive python Oracle

关于Hive中case when不准使用子查询的解决方法

关于Hive中case when不准使用子查询的解决方法参考文章 1 关于Hive中case when不准使用子查询的解决方法 2 https www cnblogs com harrylyx p 12236441 html 3 http

hive Hadoop 大数据平台

从‘discover.partitions‘=‘true‘分析Hive的TBLPROPERTIES

从 discover partitions true 分析Hive的TBLPROPERTIES 前言 Hive3 1 2先建表 show databases use db lzy show tables create external ta

hive Hadoop 大数据 数据仓库 mysql

HIVE sql经典50题

表及数据 1表学生表 create table student s id int s name string dt string sex string row format delimited fields terminated by t

hive sql

采集校园卡消费信息可视化（安徽工商职业学院）

闲的没事干分析下我自己的一卡通消费信息使用了以下技术进行数据分析并且环境已经搭建好 Hadoop hive mysql sqoop centos7 python zeppelin 思路 python爬自己的消费记录存入到mysql s

信息可视化 python Hadoop hive 爬虫

sql计算占比

计算占比是日常分析中常见的需求下面我们来小结一下怎么用sql来实现计算占比 1 数据准备现在有一张表表里有两个字段 op name与state 都为离散型可枚举数据除此以外表里还有其他字段数据形式如下 op name state

hive sql 计算占比 over窗口函数 分组

Hive常用操作以及java.io.IOException: java.lang.RuntimeException: ORC split generation failed问题处理

使用datagrip连接hive 切换数据库 use testdb create database testdb 创建表 create table t user id int name varchar 100 age int create

大数据 数据库 hive Hadoop 数据仓库

Spark on Hive 和 Hive on Spark的区别

Spark on Hive Hive只作为存储角色 Spark负责sql解析优化执行这里可以理解为Spark 通过Spark SQL 使用Hive 语句操作Hive表底层运行的还是 Spark RDD 具体步骤如下通过SparkSQ

spark hive 大数据

Apache Hudi简介、与Kudu、Hive、 HBase对比

一 Apache Hudi 数据实时处理和实时的数据实时分为处理的实时和数据的实时即席分析是要求对数据实时的处理马上要得到对应的结果 Flink Spark Streaming是用来对实时数据的实时处理数据要求实时处理也要迅速数

湖仓一体（DeltaHudiIceberg） hive Hadoop big data

Servlet+JDBC实战开发书店项目讲解第11讲：管理员用户权限功能

Servlet JDBC实战开发书店项目讲解第11讲管理员用户权限功能在这一讲中我们将详细讲解如何实现书店项目中的管理员用户权限功能下面是每个步骤的详细说明步骤一创建管理员用户表首先我们需要在数据库中创建一个管理员用户表用

java webservletjdbc书店实战开发 Servlet hive 数据库

Hive的介绍及部署搭建

文章目录 Hive的介绍 Hive与Hadoop之间的关系 Hive功能实现图 Hive架构图 Hive组件 Hive中的元数据 Hive的安装部署安装部署的前提 Mysql的安装 Hive安装启动Hive 客户端连接Hive Hive

Hadoop hive 大数据

使用sqoop命令报错ERROR mapreduce.ExportJobBase: Export job failed ERROR tool.ExportTool: Error during exp

如图所示仔细查看错误信息会发现有下面一条 2022 07 10 20 17 39 786 INFO mapreduce Job Job job 1657447073157 0042 running in uber mode false 2

笔记 大数据 hive SQOOP mysql

Kerberos安全认证-连载10-Hive Kerberos 安全配置及访问

目录 1 Hive 配置 Kerberos 2 Hive Cli使用Kerberos 3 Hive beeline使用Kerberos 4 JDBC访问Kerberos认证Hive 5 Spark访问Kerberos认证Hive 6 Fli

Kerberos安全认证 hive Hadoop 安全

Hive 使用SQL统计出每个用户的累积访问次数

我们有如下的用户访问数据 userId visitDate visitCount u01 2017 1 21 5 u02 2017 1 23 6 u03 2017 1 22 8 u04 2017 1 20 3 u01 2017 1 23 6

hive sql HQL

【Hive】Hive元数据库介绍及信息查看

转载 dabokele 在安装Hive时需要在hive site xml文件中配置元数据相关信息与传统关系型数据库不同的是 hive表中的数据都是保存的HDFS上也就是说hive中的数据库表分区等都可以在HDFS找到对应的文件这

大数据 hive 元数据

Hive 计算用户留存率（次日，3日，N日）

文章目录什么是用户留存率创建数据源计算留存率计算 N 日的留存率什么是用户留存率用户留存率是指在特定时间段内用户在使用某个产品或应用程序后再次使用该产品或应用程序的比例它可以帮助公司了解用户是否喜欢他们的产品并提供有价值

hive Hadoop 数据仓库 sql