Hive(2) Hive单节点安装以及分布式安装

2023-11-16

Hive安装

单节点安装

在官网上下载Hive的安装包

把Hive的安装包上传到服务器中, 然后解压到指定文件(我这里解压到/opt/software/目录下

tar -zxvf apache-hive-1.2.2-bin.tar.gz -C /opt/software/

方便起见, 可以给Hive的根目录重命名一下

mv apache-hive-1.2.2-bin/ hive

拷贝一份HIve的conf目录下的hive-env.sh.template为hive-env.sh

cd /opt/software/hive/conf
cp hive-env.sh.template hive-env.sh

配置hive-env.sh

在文件最下面添加一行, 配置hadoop的目录

export HADOOP_HOME=<Hadoop的根目录>

配置hive的conf路径

export HIVE_CONF_DIR=/opt/software/hive/conf

到此Hive的单节点就配置完成了, 可以执行<Hive根目录>/bin/hive脚本启动Hive客户端,

注意

因为Hive基于Hadoop运行, 所以启动Hive之前, 必须先启动HDFS和Yarn

HIve集群搭建

Hive本身并没有集群一说, 只要Hadoop以集群的模式运行, Hive就可以在Hadoop集群中运行, 但是Hive在Hadoop集群中运行, 需要使用HDFS的/temp/ 和/user/hive/warehouse/ 目录, 所以需要给HDFS中的这2个目录赋予读权限(其他人)

hadoop fs -chmod g+w /tmp

hadoop fs -chmod g+w /user/hive/warehouse

然后启动Hvie客户端就可以了

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

大数据

Hive

hive

Hadoop

Hive(2) Hive单节点安装以及分布式安装的相关文章

Hadoop：处理大型序列化对象

我正在开发一个应用程序来使用 Hadoop 框架处理和合并几个大型 java 序列化对象顺序 GB 大小 Hadoop 存储将文件块分布在不同的主机上但由于反序列化需要所有块都存在于单个主机上因此它会极大地影响性能我该如何处理这
HDP 3.1.0.0-78 升级后无法使用 ResourceManager UI 终止 YARN 应用程序

我最近将 HDP 从 2 6 5 升级到 3 1 0 它运行 YARN 3 1 0 并且我无法再使用旧的 8088 cluster apps 或新的 8088 从 YARN ResourceManager UI 终止应用程序 ui2 ind
将多个前缀行过滤器设置为扫描仪 hbase java

我想创建一台扫描仪它可以为我提供带有 2 个前缀过滤器的结果例如我想要其键以字符串 x 开头或以字符串 y 开头的所有行目前我知道只能使用一个前缀方法如下 scan setRowPrefixFilter prefixFiltet 在
Spark超时可能是由于HDFS中文件超过100万个的binary Files()

我正在通过以下方式读取数百万个 xml 文件 val xmls sc binaryFiles xmlDir 该操作在本地运行良好但在纱线上失败并显示 client token N A diagnostics Application app
Hive查询快速查找表大小（行数）

是否有 Hive 查询可以快速查找表大小即行数而无需启动耗时的 MapReduce 作业这就是为什么我想避免COUNT I tried DESCRIBE EXTENDED 但这产生了numRows 0这显然是不正确的对新手问题表示歉
Spark JDBC 仅返回带有列名的数据帧

我正在尝试使用 Spark JDBC 连接到 HiveTable 代码如下 val df spark read format jdbc option driver org apache hive jdbc HiveDriver option
如果 HBase 不是运行在分布式环境中，它还有意义吗？

我正在构建数据索引这将需要以形式存储大量三元组 document term weight 我将存储多达几百万个这样的行目前我正在 MySQL 中将其作为一个简单的表来执行我将文档和术语标识符存储为字符串值而不是其他表的外键我正在重
在 Hadoop 中处理带标头的文件

我想在 Hadoop 中处理很多文件每个文件都有一些头信息后面跟着很多记录每个记录都存储在固定数量的字节中对此有何建议我认为最好的解决方案是编写一个自定义的InputFormat http hadoop apache org co
hadoop2.2.0追加文件发生AlreadyBeingCreatedException

我遇到了一个关于hadoop2 2 0追加操作的问题我通过 HDFS java API 将一些字节附加到 hdfs 文件首先如果在附加操作之前文件不存在我将创建目标文件代码如下 String fileUri hdfs hadoop
计算行的排名

我想根据一个字段对用户 ID 进行排名对于相同的字段值排名应该相同该数据位于 Hive 表中 e g user value a 5 b 10 c 5 d 6 Rank a 1 c 1 d 3 b 4 我怎样才能做到这一点可以使用ra
Namenode高可用客户端请求

谁能告诉我如果我使用java应用程序请求一些文件上传下载操作到带有Namenode HA设置的HDFS 这个请求首先去哪里我的意思是客户端如何知道哪个名称节点处于活动状态如果您提供一些工作流程类型图或详细解释请求步骤从开始到结束
如何通过sparkSession向worker提交多个jar？

我使用的是火花2 2 0 下面是我在 Spark 上使用的 java 代码片段 SparkSession spark SparkSession builder appName MySQL Connection master spark ip
如何使用 Amazon 的 EMR 在 CLI 中使用自定义 jar 指定 mapred 配置和 java 选项？

我想知道如何指定mapreduce配置例如mapred task timeout mapred min split size等等当使用自定义 jar 运行流作业时当我们使用 ruby 或 python 等外部脚本语言运行时我们可以使
如何通过Python访问Hive？

https cwiki apache org confluence display Hive HiveClient HiveClient Python https cwiki apache org confluence display Hi
使用 Hiveql 循环

我正在尝试合并 2 个数据集例如 A 和 B 数据集 A 有一个变量 Flag 它有 2 个值我并没有只是将两个数据合并在一起而是尝试根据标志变量合并两个数据集合并代码如下 create table new data as se
MiniDFSCluster UnsatisfiedLinkError org.apache.hadoop.io.nativeio.NativeIO$Windows.access0

做时 new MiniDFSCluster Builder config build 我得到这个异常 java lang UnsatisfiedLinkError org apache hadoop io nativeio NativeIO
纱线上的火花，连接到资源管理器 /0.0.0.0:8032

我正在我的开发机器 Mac 上编写 Spark 程序 hadoop的版本是2 6 spark的版本是1 6 2 hadoop集群有3个节点当然都在linux机器上我在idea IDE中以spark独立模式运行spark程序它运行成功
将数据从 oracle 移动到 HDFS，处理并从 HDFS 移动到 Teradata

我的要求是将数据从 Oracle 移至 HDFS 处理HDFS上的数据将处理后的数据移至 Teradata 还需要每 15 分钟执行一次整个处理源数据量可能接近50GB 处理后的数据也可能相同在网上搜索了很多之后我发现 PRARO
适用于 Hadoop 的 DynamoDB 输入格式

我必须使用 Hadoop mapreduce 处理保留在 Amazon Dynamodb 中的一些数据我在互联网上搜索 Dynamo DB 的 Hadoop InputFormat 但找不到它我对 Dynamo DB 不熟悉所以我猜测
猪的组连接等效吗？

试图在 Pig 上完成这个任务寻找 MySQL 的 group concat 等效项例如在我的表中我有以下内容 3fields userid clickcount pagenumber 155 2 12 155 3 133 155

随机推荐

出现'MySQL Daemon failed to start‘解决方法

方法千万条备份第一条运行 service mysqld start 重启数据库总是会出现如下提示 MySQL Daemon failed to start Starting mysqld FAILED 的提示如果直接输入 mysql
Ubuntu/linux c开发（6）内存泄露

写好个服务程序短期测试没啥问题准备跑长时间的结果前两天正常第三天突然涨了100多M 这感觉爽飞了这里说下Ubuntu中内存泄露检测工具 Valgrind 安装和使用连接如下链接 Valgrind安装使用这里大概说下统计结果
神经网络量化

前言神经网络在图像语音识别等领域使用越来越广泛大部分实时性要求不高的服务都可以部署在云上然而还是有不少模型需要在计算能力有限的可移动设备上快速运行如人脸解锁拍照视频的实时处理等一般训练的模型采用的都是32位浮点数考虑到大部分
第四讲赋予网页样式

文科编程系列课程 Web开发第四讲赋予网页样式目录引言 1 大小 1 1 长度单位 1 1 1 px 像素 1 1 2 百分比 1 2 宽高 1 1 1 宽度 1 1 2 高度 1 1 3 边框 2 颜色 2 1 颜色的三种表示形式
毕业设计:自主开发的害虫识别系统--文档附源码

基于yolov5多目标检测算法的农业害虫识别查询系统设计文档目标问题与意义价值研究意义本项目能够及时准确地识别农业害虫的种类是害虫准确测报和合理防治的前提传统的害虫识别方法主要依赖个人的专业经验进行辨别或参考书本网络上的文字
Qt5（一）编写Qt多窗口程序

本文作者小嗷微信公众号 aoxiaoji 吹比QQ群 736854977 链接 https f600lt github io archives 摘要这篇开始将从基础知识点开始一步一步QT到QT项目原因就是读者说 QT类很多看不懂这
如何抵御ddos攻击-免费防御方法分享

网站遭受DDOS攻击不要怕今天来跟大家聊聊防御ddos攻击顺便分享一些防御ddos攻击比较使用的方法如果你是学生也不要紧这里可以给你分享免费的防御方法针对ddos攻击我们升级服务器带宽配置是不起作用的因为大部分攻击都是来自海外
文心千帆为你而来

1 前言 3月16号百度率先发布了国内第一个人工智能大语言模型文心一言文心一言的发布在业界引起了不小的震动而文心一言的企业服务则由文心千帆大模型平台提供文心千帆大模型平台是百度智能云打造出来的一站式大模型开发与应用平台提供包括文心
【面试题】说一下promise的理解

一什么是Promise ES6 异步编程的一种解决方案比传统的方案回调函数和事件更加的合理和强大大家都知道传统解决异步编程用的是回调函数套回调函数简称回调地域以前用JQuery的朋友应该是相当熟悉了维护起来很难搞回调地域
七种Linux设备驱动模型之——Device

前言 Linux将所有的设备统一抽象为struct device结构同时将所有的驱动统一抽象为struct device driver结构这样设计之后就方便驱动开发工程师编写驱动只需要将具体的设备包含struct device结构具
std::string用法总结

在平常工作中经常用到了string类本人记忆了不好用到了的时候经常要去查询在网上摘抄一下总结一下为以后的查询方便 string类的构造函数 string const char s 用c字符串s初始化string int n char
Windows10下Nginx初步配置

1 nginx启动与关闭 nginx启动命令一闪而过为正常启动且看不到nginx进程 D server nginx nginx 1 16 0 gt start nginx nginx关闭命令快速停止 nginx s stop 完整有序
宝塔面板ip:端口，访问不进去；提示：请使用正确的入口登录面板解决办法

请使用正确的入口登录面板错误原因当前新安装的已经开启了安全入口登录新装机器都会随机一个8位字符的安全入口名称亦可以在面板设置处修改如您没记录或不记得了可以使用以下方式解决解决方法在SSH终端输入以下一种命令来解决 1 查看面
Android servicemanager进程启动过程

在分析ServiceManager实例化注册流程前先放张ServiceManager在Binder体系中的UML图一 ServiceManager启动流程查看system core rootdir init rc脚本可知 init进程
用anaconda在d盘中创建虚拟环境

我可以给你一些提示首先你需要在D盘中打开Anaconda Prompt 然后使用命令 conda create n python 来创建虚拟环境其中是你要为虚拟环境起的名字而则是你想安装的Python版本
2023-9-11 拆分-Nim游戏

题目链接拆分 Nim游戏 include
浅谈几个通信概念-如何理解卷积，负频率，傅里叶变换，奈奎斯特采样定理？

1 如何理解卷积 t时刻的输出信号是t时刻之前的无数小的脉冲序列冲击引起的 2 如何理解欧拉公式复指数信号呢可以看成一个点在复平面上以角速度w进行逆时针的旋转傅里叶分析整体到部分把一个信号分解成无数个基频组成的信号的和的过程 of
7-4 输出三角形字符阵列 (15 分)

7 4 输出三角形字符阵列 15 分本题要求编写程序输出n行由大写字母A开始构成的三角形字符阵列输入格式输入在一行中给出一个正整数n 1 n lt 7 输出格式输出n行由大写字母A开始构成的三角形字符阵列格式见输出样例其中每个
基于web的在线视频编辑的设计

基于web的在线视频编辑的设计我在这里首先说明一下本设计只涉及到逻辑设计和关键的技术具体的实现方法语言就得运用自己的特长去解决了场景 1 比如我用手机录播一段很长的MP4格式的视频我想剪切其中的几段然后在合并成一个新的视频如
Hive(2) Hive单节点安装以及分布式安装

Hive安装单节点安装在官网上下载Hive的安装包官网地址 http hive apache org 把Hive的安装包上传到服务器中然后解压到指定文件我这里解压到 opt software 目录下 tar zxvf apache