java/Python3连接数据库(Hive、Oracle)

2023-11-08

Python连接Hive

一、前提准备

Python版本:3.6.4;
需要下载的包:
打开cmd在命令提示窗口中运行:

pip install sasl
pip install thrift
pip install thrift-sasl
pip install PyHive

这里大家在安装sasl的时候,如果报错的话,可以进入官网下载,我在这里下载的是
sasl‑0.2.1‑cp35‑cp35m‑win_amd64.whl,大家根据需要自行下载。
下载完成后,即可打开Python界面:
jupyter notebook

二、代码连接

首先需要开启hiveserver2:
hive --service hiveserver2
2.1、初体验
首先需要导入包pyhive

#导入包
from pyhive import hive
#建立与hive建立连接:主机ip、端口号、主机名、库名
coon = hive.Connection(host='192.168.136.10',port=10000,username='hadoop01',database='test')
test1 = coon.cursor()
#需要执行的sql语句
test1.execute("select * from code_name")
#获取结果
for result in test1.fetchall():
    print(result)

这里为了方面,我们可以把它封装为一个方法,同时,转换为DataFrame的形式输出。
2.2、转换为DataFrame形式

import pandas as pd
#定义一个方法:
def python_To_Hive(sql):
    connection = hive.Connection(host='192.168.136.10',port=10000,username='hadoop01',database='test')
    cur = connection.cursor()      
    cur.execute(sql)
    #description输出表格信息组成的列表,每一个信息组成一个元组
    columns = [col[0] for col in cur.description]
    #获取数据,组成字典
    result = [dict(zip(columns, row)) for row in cur.fetchall()]
    df = pd.DataFrame(result)
    df.columns = columns 
    return df

sql = "select * from code_name"
df = python_To_Hive(sql)

在这里插入图片描述

2.3、简单计算:求空值率

df.apply(lambda x : x.isnull().sum()/len(x),axis=0)

在这里插入图片描述

Java连接Oracle

一、前提准备

上传Oracle驱动包。我这里使用的是ojdbc6.jar
在这里插入图片描述

二、代码实现

2.1、测试连接
设置Oracle的url有两种方式:
jdbc:oracle:thin:@host:port:SID
jdbc:oracle:thin:@//host:port/service_name
这里我采用的是第一种方式。Oracle默认的SID的orcl。

package Connect;

import java.sql.*;

/**
 * @Author
 * @Date 2021/9/19
 * @Description
 */
public class ConnectToOracle {
    //1、设置属性
    Connection conn = null;
     Statement stmt = null;
    String url = null;
    String username = null;
    String password = null;
    //2、定义连接方法
    public String connect(String url, String username, String password) {
        try {
            //加载驱动
            Class.forName("oracle.jdbc.OracleDriver");
            //连接
            conn = DriverManager.getConnection(url, username, password);
            if (conn != null) {
               System.out.println("Oracle连接成功");
            }else {
               System.out.println("Oracle连接失败");
            }
             assert conn != null;
            stmt = conn.createStatement();
        } catch (ClassNotFoundException | SQLException e) {
            e.printStackTrace();
        }finally {
            return "";
        }
    }
    
    public String getUrl() {
        return url;
    }

    public void setUrl(String url) {
        this.url = url;
    }

    public String getUsername() {
        return username;
    }

    public void setUsername(String username) {
        this.username = username;
    }

    public String getPassword() {
        return password;
    }

    public void setPassword(String password) {
        this.password = password;
    }
}

测试运行:

public class Test {
    public static void main(String[] args) {
        String url = "jdbc:oracle:thin:@192.168.136.10:1521:orcl";
        String username = "system";
        String password = "admin";
        ConnectToOracle coon = new ConnectToOracle();
        String res = coon.connect(url, username, password);
        System.out.println(res);

    }
}

在这里插入图片描述
2.2、操作Oracle
现在oracle里有三张表studentteacherschool
school是张空表
在这里插入图片描述

下面我们按照各表id统计数量。没有id的统计总数。
当我们的表数量较多时,可以采用读取文件的方式,加载各表。
我这里把表名和字段名存储到table.txt文件中。
在这里插入图片描述
代码实现:

package Connect;

import java.io.*;
import java.sql.ResultSet;
import java.sql.SQLException;

/**
 * @Author
 * @Date 2021/9/19
 * @Description
 */
public class JavaOracle {
    public static void main(String[] args) {
        String url = "jdbc:oracle:thin:@192.168.136.10:1521:orcl";
        String username = "system";
        String password = "admin";
        BufferedReader buffer = null;
        BufferedWriter out = null;
        ResultSet rs = null;
        //1、连接数据库
        ConnectToOracle coon = new ConnectToOracle();
        String res = coon.connect(url, username, password);
        System.out.println(res);
        try {
            //2、读取文件
            File file = new File("Data/table.txt");
            InputStreamReader read = new InputStreamReader(new FileInputStream(file));
             buffer = new BufferedReader(read);
            //3、写入文件
            out = new BufferedWriter(new FileWriter("Data/result.txt"));
            String sql = null;
            String lineText = null;
            //4、按行读取文件,并把每行拆分成一个数组。
            while ((lineText = buffer.readLine()) != null) {
                String[] table_date = lineText.trim().split(",");
                //5、判断各表
                if (table_date.length == 2 && table_date[0].toString().equals("student")) {
                    sql = "select count(1) as cnt from " + table_date[0] + " where " + table_date[1] + " >1";
                    System.out.println(sql);
                } else if (table_date.length == 2 && table_date[0].toString().equals("teacher")) {
                    sql = "select count(1) as cnt from " + table_date[0] + " where " + table_date[1] + " >101";
                    System.out.println(sql);
                } else if (table_date.length == 1) {
                    sql = "select count(1) as cnt from " + table_date[0];
                    System.out.println(sql);
                }
                try {
                    rs = coon.stmt.executeQuery(sql);
                    while (rs.next()) {
                        if (rs.getInt("cnt") == 0) {
                            out.write(table_date[0] + " 表中没有数据\n");
                        } else {
                            out.write(table_date[0] + " 的数据量为:" + rs.getInt("cnt")+"\n");
                        }
                    }
                } catch (SQLException s) {
                    //当某张表的SQL发生异常时,我们可以捕获并写入到文件中去。
                    out.write(table_date[0] + " 表没有找到\n");
                }
            }
        } catch (IOException e) {
            e.printStackTrace();
        }finally {
            try {
                //关闭文件
                buffer.close();
                out.close();
            } catch (IOException e) {
                e.printStackTrace();
            }
        }
    }
}

运行后我们可以在文档中查看结果:
在这里插入图片描述

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

java/Python3连接数据库(Hive、Oracle) 的相关文章

随机推荐

  • 关于搭建CDH中遇到的问题

    本人搭建的cdh版本是5 10 1 服务器的版本是redhat 7 4 在搭建cdh的过程中遇见了下列问题 分享出来给大家参考参考 一 CDH搭建成功以后 安装服务的过程中突然崩溃的步骤 解决 1 gt 删除Agent节点的UUID rm
  • 数字化转型 价值效益参考模型_003-企业数字化转型:数字化转型的实际应用与价值...

    引子 经历了国庆长假 迎来了2020年的第四季 跳出第三季的懈怠 第四季还是延续数字化转型的主题 在第二季讲到了数字化转型需要的思维模式 掌握了生意人思维 量化的思维 运营的思维模式后 我们已经在认知上有了提升 接着我们来探讨数字化转型的在
  • R语言数据标签、变量赋值、修改赋值

    在数据处理分析过程中 分类变量的值有时候是试用数值来表示 从直观上并不能理解其含义 必须要有赋值对照表才能辅助理解 R语言在加标签上的功能并不常用 好在R语言可以直接处理分析字符串 在分析前把相应赋值改为具体含义的文字即可 例如 常见数据中
  • chronyc时间服务配置和常用命令

    配置文件说明 etc chronyc conf 和时间服务器偏差超过1 0秒后 分3次步进完成纠正时间偏差 可以加快时间调整过程 chronyc默认行为是渐进调整 当时间偏差大时 缓慢调整 避免应用软件因为时间跳变而功能异常 比如定时器失效
  • Celery和Django结合(一)

    Celery和Django结合 一 Windows下安装Celery过程记录 背景 最近项目中遇到一个问题 需要定时执行任务 选择通过celery来实现 计划步骤 1 Celery基本使用 启用多个workers 2 Celery 定时任务
  • 2022软件质量与管理-考题复习

    最下面有2022的软件工程与管理考题 简答题 2021 估算的要点 10分 尽可能划分详细一些 建立对估算结果的信心 依赖数据 估算是利益相关者达成共识的过程 而不是结果 2021 基于Yield构建预测模型 10分 基于Yield指标构建
  • LeetCode题目笔记——1487. 保证文件名唯一

    文章目录 题目描述 题目链接 题目难度 中等 方法一 哈希表 代码 Python 代码 C 总结 题目描述 给你一个长度为 n 的字符串数组 names 你将会在文件系统中创建 n 个文件夹 在第 i 分钟 新建名为 names i 的文件
  • 我的e家虚拟服务器,我的e家无线路由器怎么设置 我的e家无线路由器设置方法...

    您可能感兴趣的话题 我的e家 路由器 核心提示 我的e家是电信推出了一上网套餐 但是有的朋友还不是太了解设置技巧 可以参考下文中的设置方法 一起看看吧 我的e家是电信推出了一上网套餐 但是有的朋友还不是太了解设置技巧 可以参考下文中的设置方
  • PaddleDetection 个人测评

    2021 11 26测评 目录 旋转检测 车辆检测 检测跟踪算法 跨镜头跟踪 流量监测 宣传页
  • STM32编译错误,No section matches selector - no section to be FIRST/LAST.

    错误提示如下 可以看到工程里没有 s文件 cubeMX生成工程时提示有错 但是没发现是什么错误 也许就是这个吧 右键 管理工程项目 添加 s文件 再编译 错误就没有了
  • int , long , long long 的取值范围

    关于带符号与无符号类型 整型 int stort 和 long 都默认为带符号型 要获得无符号型则必须制定该类型为unsigned 比如unsigned long unsigned int类型可以简写为unsigned 也就是说 unsig
  • chinese_lite OCR使用教程

    目录 一 简介 二 环境 三 项目地址 四 使用说明 五 各语言的Demo地址 六 效果展示 一 简介 超轻量级中文ocr 支持竖排文字识别 支持ncnn mnn tnn推理 dbnet 1 8M crnn 2 5M anglenet 37
  • DolphinDB 机器学习在物联网行业的应用:实时数据异常率预警

    数据异常率预警在工业安全生产中是一项重要工作 对于监控生产过程的稳定性 保障生产数据的有效性 维护生产设备的可靠性具有重要意义 随着大数据技术在生产领域的深入应用 基于机器学习的智能预警已经成为各大生产企业进行生产数据异常率预警的一种有效解
  • 使用PD虚拟机,弹出“无法连接到 Parallels 服务”,详细的解决方法

    在使用Parallels Desktop 虚拟机的时候 启动时出现以下错误消息 Parallels Desktop 无法启动 无法连接至 Parallels服务 在该虚拟机中没有安装操作系统 遇到以上3种问题怎么解决呢 可能的原因如下 过时
  • AlexNet模型

    目录 1 摘要 介绍背景及提出AlexNet模型 获得ILSVRC 2012冠军 2 Introduction 介绍了本文的主要贡献 研究的成果主要得益于大量的数据以及高性能的GPU 3 The DataSet ILSVRC 2012数据集
  • git提交时忽略文件及文件夹方法

    如果要忽略的文件没有被跟踪过 可以直接在 gitnore文件中写要忽略的内容即可 gitignore内容 idea 文件夹名称 文件夹名称 子目录名称 如果要忽略的文件已经是被跟踪状态 则需要先把本地缓存删除 变成未跟踪状态 然后再提交 g
  • MyBatis-Plus框架简介

    MyBatis Plus框架简介 1 MyBatis Plus MyBatis Plus 简称 MP 是一个 MyBatis 的增强工具 在 MyBatis 的基础上只做增强不做改变 为简化开发 提高效率而生 其特性有 无侵入 只做增强不做
  • C#中 IoC 的实现

    前两天看到一个博 http www cnblogs com liuhaorain p 3747470 html 在说IoC 我觉得这个东西还是很you必要学习一下 于是就有了这个 首先 明确下IoC是什么东西 控制反转 Inversion
  • 性能测试重点17个疑难解答

    前言 1 如何理解性能测试的 高并发的请求下看它的响应时间与吞吐率是否满足相应的消息 2 响应时间时如何理解的 响应时间是指从发生请求到得到响应时间这一段时间的总和 简单的说 响应时间就是一次完整的http请求流程所需的时间 3 怎么区分负
  • java/Python3连接数据库(Hive、Oracle)

    Python连接Hive 一 前提准备 Python版本 3 6 4 需要下载的包 打开cmd在命令提示窗口中运行 pip install sasl pip install thrift pip install thrift sasl pi