Hadoop系列

Linux环境下的jdk安装（大数据环境）

jdk安装创建软件存放目录上传文件我使用的MobaXterm 创建解压目录解压jdk压缩包修改软件名使他简洁易操作配置环境变量让配置文件生效查看jdk版本信息将HP01 的usr文件夹整体拷贝到HP02 HP03目录下

Hadoop系列 大数据 Linux Java Hadoop

1 首先打开zookeeper集群和kafka集群三台都开上 2 创建 Kafka 主题 call 在任意几点创都可以 kafka topics sh zookeeper hadoop01 2181 topic call create r

Hadoop系列 Hadoop

HDFS API操作的访问方式主要分为使用文件系统访问方式和URL访问方式 package com wyg hdfs import java io File import java io FileOutputStream import j

Hadoop系列 HDFS

切换到安装目录解压Hadoop压缩包修改软件名称 hadoop配置切换目录将以下配置文件放在usr app hadoop2 7 3 etc hadoop 目录下这里的文件是老师配好的配置hadoop环境让hadoop环境配置

Hadoop系列 Hadoop 大数据 Linux

1 hive下载地址http mirror bit edu cn apache hive 2 上传至software目录下 3 解压至指定目录 4 重命名hive 5 修改环境变量 6 让环境生效 7 查看hive版本 8 修改hive s

Hadoop系列 hive

解决办法将框内文件删除

Hadoop系列 VMware

1 上传zookeeper压缩包到服务器 opt software 目录下根据自己情况定 2 解压zookeeper到 usr app 目录下根据自己安装的地方来 3 将解压过去到usr app下的zookeeper改名 4 在 usr

Hadoop系列 Zookeeper

1 Copy阶段 ReduceTask从各个MapTask上远程拷贝一片数据并针对某一片数据如果其大小超过一定阈值则写到磁盘上否则直接放到内存中 2 Merge阶段在远程拷贝数据的同时 ReduceTask启动了两个后台线程对内存

Hadoop系列 大数据 Hadoop

1 将Hadoop压缩包解压放在指定目录 2 Hadoop本地环境配置新建一个HADOOP HOME 添加path 3 安装maven 解决java开发依赖问题这里可以直接去官网上下载 https maven apache org

Hadoop系列 Hadoop

wordcountReduce java package MaperReduce import java io IOException import org apache hadoop io LongWritable import org

Hadoop系列 Hadoop MapReduce Java

90 的hive数据库初始化失败的原因都是配置文件没整明白咱们可以看看hive env sh template 这句话的意思是 lt 警告这个文件是自动生成的只用于文档的目的 gt lt 警告你对这个文件所做的任何修改都将被Hive

Hadoop系列 1024程序员节 hive

问题描述 connect to host master port 22 No route to host 问题分析先去ifconfig能不能出现你自己配的网卡一般情况是不能的或者重启网卡会启动失败当然了使用远程连接工具也会连接不上

Hadoop系列 Hadoop

1 用户接口 Client CLI hive shell JDBC ODBC java 访问 hive WEBUI 浏览器访问 hive 2 元数据 Metastore 元数据包括表名表所属的数据库默认是 default 表的拥有者

Hadoop系列 hive 数据库 大数据 Hadoop

1 安装第一台虚拟机参照博主文章连接如下 https blog csdn net weixin 46457946 article details 114758813 2 配置网卡配置网卡前看看你的ifconfig命令能不能用一般来说

Hadoop系列 Hadoop

配置如下参数可以开启Hive的本地模式 hive gt set hive exec mode local auto true 默认为false

Hadoop系列 hive

waitForCompletion submit 1建立连接 connect 1 创建提交Job的代理 new Cluster getConfiguration 1 判断是本地yarn还是远程 initialize jobTrackAddr

Hadoop系列 大数据 Hadoop Java