Sqoop安装与配置

2023-11-08

一、了解Sqoop

sqoop 是 Hadoop 和关系数据库服务器之间传送数据的工具。主要用于在hive和关系型数据库间进行数据的传递,可以将一个关系型数据库中的数据导进到Hadoop的HDFS中,也可以将HDFS的数据导进到关系型数据库中。

核心的功能有两个:

  • 导入、迁入

  • 导出、迁出

二、下载Sqoop安装包

下载地址:https://mirrors.tuna.tsinghua.edu.cn/apache/sqoop/
在这里插入图片描述

三、安装Sqoop

首先将文件放进Linux,然后使用命令tar解压sqoop

[root@master dev]# tar -zxvf sqoop-1.4.7.bin__hadoop-2.6.0.tar.gz 

将sqoop-1.4.7.bin__hadoop-2.6.0改为sqoop

[root@master dev]# mv sqoop-1.4.7.bin__hadoop-2.6.0 sqoop

在home目录下创建apps文件夹。

[root@master dev]# mkdir -p /home/apps

将sqoop文件夹放入apps中。

[root@master dev]# mv sqoop /home/apps

四、配置Sqoop

  • 配置系统环境变量

使用vi命令修改系统环境变量文件

[root@master dev]# vi /etc/profile

添加以下环境变量

export SQOOP_HOME=/home/apps/sqoop

export PATH=$PATH:$SQOOP_HOME/bin

使添加的环境变量立即生效

[root@master dev]# source /etc/profile
  • 修改Sqoop配置文件

Sqoop的配置文件在conf文件夹里面

[root@master dev]# cd /home/apps/sqoop/conf
[root@master conf]# ll
total 28
-rw-rw-r--. 1 centos centos 3895 Dec 19  2017 oraoop-site-template.xml
-rw-rw-r--. 1 centos centos 1404 Dec 19  2017 sqoop-env-template.cmd
-rwxr-xr-x. 1 centos centos 1345 Dec 19  2017 sqoop-env-template.sh
-rw-rw-r--. 1 centos centos 6044 Dec 19  2017 sqoop-site-template.xml
-rw-rw-r--. 1 centos centos 6044 Dec 19  2017 sqoop-site.xml

使用mv将文件名改为sqoop-env.sh和vi命令写入文件

[root@master conf]# mv sqoop-env-template.sh sqoop-env.sh
[root@master conf]# vi sqoop-env.sh

修改你的已经安装了的Hadoop组件,如果没有安装的就注释。

#Set path to where bin/hadoop is available
export HADOOP_COMMON_HOME=/home/hadoop/hadoop-2.9.2

#Set path to where hadoop-*-core.jar is available
export HADOOP_MAPRED_HOME=/home/hadoop/hadoop-2.9.2

#set the path to where bin/hbase is available
export HBASE_HOME=/home/apps/habase

#Set the path to where bin/hive is available
export HIVE_HOME=/home/apps/hive

#Set the path for where zookeper config dir is
export ZOOCFGDIR=/home/apps/zookeeper

为什么在sqoop-env.sh 文件中会要求分别进行 common和mapreduce的配置呢???

在apache的hadoop的安装中;四大组件都是安装在同一个hadoop_home中的

但是在CDH, HDP中, 这些组件都是可选的。

在安装hadoop的时候,可以选择性的只安装HDFS或者YARN,

CDH,HDP在安装hadoop的时候,会把HDFS和MapReduce有可能分别安装在不同的地方

[root@master dev]# mv mysql-connector-java-5.1.48.jar /home/apps/sqoop/lib

注:如果启动失败可能是MySQL驱动包版本问题

验证sqoop安装是否成功

[root@master dev]# sqoop-version

五、Sqoop基本命令

首先我们可以使用sqoop help命令来查看sqoop支持哪些命令

[root@master dev]# sqoop help
21/01/15 18:53:02 INFO sqoop.Sqoop: Running Sqoop version: 1.4.7
usage: sqoop COMMAND [ARGS]

Available commands:
  codegen            Generate code to interact with database records
  create-hive-table  Import a table definition into Hive
  eval               Evaluate a SQL statement and display the results
  export             Export an HDFS directory to a database table
  help               List available commands
  import             Import a table from a database to HDFS
  import-all-tables  Import tables from a database to HDFS
  import-mainframe   Import datasets from a mainframe server to HDFS
  job                Work with saved jobs
  list-databases     List available databases on a server
  list-tables        List available tables in a database
  merge              Merge results of incremental imports
  metastore          Run a standalone Sqoop metastore
  version            Display version information

See 'sqoop help COMMAND' for information on a specific command.
[root@master dev]#

如果不知道使用方式,可以使用sqoop help import 的命令 来查看某条具体命令的使用方式,

[root@master dev]# sqoop help import

六、示例

查看MySQL中有哪些数据库

[root@master dev]# sqoop list-databases --connect jdbc:mysql://192.168.1.121:3306/ --username root --password 123456789
21/01/15 19:01:38 INFO sqoop.Sqoop: Running Sqoop version: 1.4.7
21/01/15 19:01:38 WARN tool.BaseSqoopTool: Setting your password on the command-line is insecure. Consider using -P instead.
21/01/15 19:01:38 INFO manager.MySQLManager: Preparing to use a MySQL streaming resultset.
Fri Jan 15 19:01:38 CST 2021 WARN: Establishing SSL connection without server's identity verification is not recommended. According to MySQL 5.5.45+, 5.6.26+ and 5.7.6+ requirements SSL connection must be established by default if explicit option isn't set. For compliance with existing applications not using SSL the verifyServerCertificate property is set to 'false'. You need either to explicitly disable SSL by setting useSSL=false, or set useSSL=true and provide truststore for server certificate verification.
information_schema
hive
mysql
performance_schema
sys
[root@master dev]#

结语:大数据Hadoop笔记sqoop安装与配置

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

Sqoop安装与配置 的相关文章

随机推荐

  • 了解GFS和HDFS后,要懂得分布式文件系统设计原理

    转自 https www jianshu com p fc0aa34606ce 一 概述 分布式文件系统是分布式领域的一个基础应用 其中最著名的毫无疑问是 HDFS GFS 如今该领域已经趋向于成熟 但了解它的设计要点和思想 对我们将来面临
  • 伸缩自如的ElasticSearch——通过bboss操作和访问elasticsearch模式

    文章目录 ClientUtil 加载配置文件中的dsl来实现对es的操作模式 所有不依赖dsl的功能 或直接接收dsl模式 基本功能 配置es查询dsl 文档批量创建或者修改 http api 查询dsl动态脚本语法规范 配置springb
  • C++11模板元编程—std::enable_if使用说明

    std enable if 顾名思义 满足条件时类型有效 作为选择类型的小工具 其广泛的应用在 C 的模板元编程中 它的定义也非常的简单 STRUCT TEMPLATE enable if template
  • linux硬盘安装器下载,通过硬盘安装Linux

    一 下载iso文件 下载后的文件可以保存在linux分区或windows分区 iso一般还有个md5sum的说明 用这个可以检验iso文件的正确性 以redhat7 3为例 linux下用 md5sum valhalla i386 disc
  • 接口测试和单元测试

    接口测试的本质 就是通过数据驱动 测试类里面的函数 单元测试的本质 通过代码级别 测试函数 单元测试的框架 unitest 接口 pytest WEB gt 接口 pytest jenkins allure requests 模块讲解和应用
  • 单链表逆转的2种方法。

    单链表逆转方法有很多 这里谈两种 1 再建一个链表然后 边遍历原来的链表 便是用头插法 完成新的单链表 这样子虽然内存损耗比较大 但是也是勉强可以完成的 2 使用3个指针 逐个节点的逆转 p q两个指针分别指向想要逆转关系的两个节点 p指向
  • iOS苹果开发者账号(公司账号)申请流程详解

    前言 近期由于公司项目的需要 全程参与了公司一款iOS原生应用的开发与上线 其中最让我印象深刻的还是申请苹果开发者账号以及app的上架审核 申请苹果开发者账号一波三折 又是邮件又是电话的 审核过程被拒多次 由于苹果审核时间大多是在凌晨或者第
  • JSP介绍

    目录 JSP简介 JSP脚本片段 JSP表达式 JSP声明片段 JSP的指令标识 page的属性 Include指令 Taglib指令 JSP标签 动态引入和静态引入的区别 JSP作用域 JSP的九大内置对象 内置 不需要创建 直接就能用
  • 立即放弃 TypeScript 的 17 个理由

    如果你和我一样 你可能会因为被迫而使用 Typescript 你的公司决定它会成为未来的语言 所以你被迫学习它 起初 您很高兴使用 Typescript 你知道它有很大的潜力 可以帮助你制作更强大的应用程序 但在使用了一段时间后 您开始意识
  • 微博登录和session恢复过程

    微博登录和session恢复过程 登录 预登录 获取验证码 登录 密码密文sp计算 登录请求 跨域广播登录 解决cookie设置不上的问题 跨域广播之后 恢复session 完整源码参考我的pixiv to weibo项目 只实现了核心部分
  • cygwin开发环境搭建与apt-cyg的应用

    1 Cygwin安装 http www cygwin com 下载安装工具 具体安装过程参照http jingyan baidu com article 6b97984d83dfe51ca2b0bf0e html 2 Cygwin一些设置
  • 使用Arduino开发板控制伺服电机

    大多数情况下 直流电机控制的控制方法都是非常简单的 只需要连接电源和地 伺服电机有一些不同 它使用3根线连接 电源 地和信号 将电机移动到某个旋转位置 该位置由信号线上发送的信号决定 一旦电机到达信号指定的位置 它将保持其位置 并抵抗试图将
  • 利用GPU预热以及同步执行正确计算卷积神经网络推理性能【附代码】

    我们在评价一个卷积神经网络模型性能好坏时 通常会用AP mAP来判断分类准确性 针对速度方面经常使用ms 毫秒 或者FPS 表示每秒处理多少张图像 或者说处理一张图像用多少秒 在看一些代码的时候 常常会看到是直接用python中的time函
  • docker 镜像的复制和导入

    1 复制 docker save o 要保存的文件名 要保存的镜像 docker save o d docker images fastdfs tar zl fastdfs 2 导入 docker load input 文件 docker
  • mysql数据库的安装和卸载(windows10)

    数据库安装 官网下载ZIP压缩包 解压到D MySQL mysql 5 6 40 winx64 打开刚刚解压的文件夹 D MySQL mysql 5 6 40 winx64 里面有一个系统自带的配置文件 my default ini 复制该
  • android ndk NEON Support

    NEON Support On this page Using LOCAL ARM NEON Using the neon Suffix Build Requirements Runtime Detection Sample Code Th
  • 从技术的角度Struts1.1与WebWork2的比较

    从技术的角度Struts1 1与WebWork2的比较 标签 action webwork struts 拦截器 验证 从技术的角度Struts1 1与WebWork2的比较 特 征 Struts1 1 WebWork2 Action类 在
  • rootkit模拟木马病毒

    Rootkit是一种特殊的恶意软件 它的功能是在安装目标上隐藏自身及指定的文件 进程和网络链接等信息 比较多见到的是Rootkit一般都和木马 后门等其他恶意程序结合使用 而我们今天要模拟学习的就是与它很像的恶意软件 Rootkit 其中之
  • 【难受】SpirngBoot-Alibaba-nacos跨服务器访问接口的问题

    原想法 我首先准备了 一个网关 2个服务 分别将两个服务部署到不同的远程服务器当中 实现跨服务器访问接口 网关为本地调用 这里就不一一介绍了 问题 利用gateway做路由时出现服务不可用的情况 看日志发现服务调用的IP是172开头的网卡段
  • Sqoop安装与配置

    Sqoop安装与配置 一 了解Sqoop 二 下载Sqoop安装包 三 安装Sqoop 四 配置Sqoop 五 Sqoop基本命令 六 示例 一 了解Sqoop sqoop 是 Hadoop 和关系数据库服务器之间传送数据的工具 主要用于在