python 读写hive

2023-11-05

最近正在 做一个 项目,需要把 算法模型的结果持久化 至hive.

目前 使用的 pyhive,切记 在windows上不能使用,我目前在centos6.5上使用,官方说再macos和linux上可用。

 

from pyhive import hive
import pandas as pd
# from sqlalchemy import create_engine

# from pyspark.sql import sqlContext

conn = hive.Connection(host='xxx', port=10000, username='xxx', database='default')
cur = conn.cursor()

#读取hive

dftt=pd.read_sql("select * from dw.ml_catalog limit 10",con=conn)
print(dftt)

# test data
listpandas=[[456,'test456'],[789,'test456'],[123,'test123'],[110,'test110']]
# engine=create_engine('hive://xxx@xxx:10000/default')
df=pd.DataFrame(listpandas,columns=['id','name'])
# must use the follow to write hive,to_sql 目前有bug,只能存入一条语句https://github.com/dropbox/PyHive/issues/50
for index, row in df.iterrows():
    strsql="insert into default.test100(id,name) values("+str(row[0])+",'"+str(row[1])+"'"+")"
    cur.execute(strsql)


# with engine.connect() as conn, conn.begin():
#     for index, row in df.iterrows():
#         row.to_sql('default.test100', engine, if_exists='append',index=False, index_label=None, chunksize=None, dtype=None)
#     # df.to_sql('default.test100', engine, if_exists='append',index=False, index_label=None, chunksize=None, dtype=None)

# print(df)

# connect=hive.Connection(host='10.15.4.161', port=10000, username='zhouzhou', database='default')

# df.to_sql("default.test100", con=conn)


# for index, row in df.iterrows():
#     row.to_sql('default.test100', con=connect, if_exists='append',index=False, index_label=None, chunksize=None, dtype=None)

# cursor = conn.cursor()
# cursor.execute('select * from dw.ml_catalog limit 10')
# for result in cursor.fetchall():
#     print(result)
 

知乎: https://zhuanlan.zhihu.com/albertwang

微信公众号:AI-Research-Studio

https://img-blog.csdnimg.cn/20190110102516916.png ​​

下面是赞赏码

 

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

python 读写hive 的相关文章

随机推荐

  • 06_Vue-router与综合练习

    Vue router 一 生命周期钩子函数 含义 在生命周期处理响应函数的别称 1 初始化 beforeCreat 创建对象时 没初始化data和methods created 实例已经创建好了 此时在里面发送ajax请求 2 挂载 bef
  • 自学Python兼职赚钱靠谱吗?

    自学python兼职九成九是赚不到钱的 程序员兼职的门槛是挺高的 python兼职的类型可以分为 开发 也就是写网页的底层逻辑 但是大概率需要会前端 前端也就是页面 爬虫 数据分析 兼职的话 甲方是不会把数据给你去分析的 在这个社会当中数据
  • html动态设置透明度

  • Debian12中为python3配置虚拟环境及在Pycharm中使用虚拟环境

    在Debian 12中 python默认为python 3 11 基于应用 现需设置虚拟环境 1 安装venv模块 从python3 3开始 配置python虚拟环境 可用venv模块 更加方便了 执行命令 apt install pyth
  • 网络安全管理

    网络安全面临的主要威胁 人为因素 系统和运行环境等 常见的互联网服务安全包括 Web浏览器安全 文件传输 FTP 服务安全 E mail服务安全 远程登录 Telnet 安全 DNS域名安全和设备的实体安全 防火墙的局限性以及风险 防火墙能
  • 编译和安装gdb源码详细步骤介绍

    1 gdb源码下载 1 源码下载网址 https ftp gnu org gnu gdb 2 本文下面的编译是按照8 2版本的源码进行的 其余版本的源码可能会报错 需要自行解决 2 编译源码 2 1 Makefile文件 顶层目录 TOOL
  • 银行业法律法规与综合能力 第四章 银行从业法律基础 25%

    第四章 银行从业法律基础 4 1 银行基本法律法规 1 考点1 中国人民银行的职能和职责 一 职能 二 职责 考点2 中国人民银行的监督管理 一 直接检查监督杈 二 建议检查监督杈 三 特定情况下的检查监督权 考点3 国务院银行业监督管理机
  • hexo引用本地图片无法显示

    最近重新开始用起hexo 但是发现在文章中引用本地图片时总是显示不出来 问题如下图所示 花费了许久时间才解决这个问题 因此将一些解决经验整理出来 希望能帮助到大家 一 插件安装与配置 首先我们需要安装一个图片路径转换的插件 这个插件名字是h
  • 2023年智慧农业与经济发展国际研讨会议(ISSAED 2023)

    2023 International Seminar on Smart Agriculture and Economic Development 地点 合肥 智慧农业 农业信息管理系统 农业物联网系统集成与实践技术 农业大数据分析与应用 农
  • LLVM学习入门(2):实现解析器 Parser 和语法树 AST

    实现解析器 Parser 和语法树 AST 2 1 The Abstract Syntax Tree AST 语法抽象树 2 2 Parser Basics 基本的解析器 2 3 Basic Expression Parsing 基本表达式
  • 计算机与不确定性原理,不确定性原理

    题目 A simple baseline for bayesian uncertainty in deep learning 摘要 本文提出了一种简单 可扩展 通用的面向深度学习的不确定性表示和标定方法SWA Gaussian SWAG 随
  • SCILAB-自由科学计算软件

    SCILAB 自由科学计算软件 原创 2006 04 03 15 05 15 发表者 phoenixlin SCILAB是由法国国家信息与自动化研究院 INRIA 的科学家们开发的 开放源码 科学计算自由软件 SCILAB一词来源于英文 S
  • Graphics2D绘制图片,线段、矩形、圆形

    新建图片 BufferedImage newImage new BufferedImage 1079 512 BufferedImage TYPE INT RGB 获取绘图对象 Graphics2D g2d newImage createG
  • 访问云服务器文件共享,访问云服务器文件共享

    访问云服务器文件共享 内容精选 换一换 华为云帮助中心 为用户提供产品简介 价格说明 购买指南 用户指南 API参考 最佳实践 常见问题 视频帮助等技术文档 帮助您快速上手使用华为云服务 安装传输工具在本地主机和Windows云服务器上分别
  • 数组工具类

    该工具类有两个方法 1 isContained方法用来判断一个数组中是否包含另一个数组中所有的数据 2 arrayDiff方法用来删除一个数组中与另一个数组中值相同的元素 arrUtil js文件 key存在时表示是对象数据 可以不存在时表
  • Flying to the Mars(字典树)

    Flying to the Mars Time Limit 5000 1000 MS Java Others Memory Limit 32768 32768 K Java Others Total Submission s 12965 A
  • 整形在内存中的存储

    目录 整形在内存中的存储 大小端字节序存储 什么是大端小端 判断大小端的代码 变量的创建是要在内存中开辟空间的 空间的大小是根据不同的类型而决定的 那接下来我们谈谈数据在所开辟内存中到底是如何存储的 整形在内存中的存储 计算机中的整数有三种
  • UE4 伤害事件,不同部位不同伤害(C++)

    UE4 伤害事件 不同部位不同伤害 C 可以先看射线检测 效果 打头和身体有不同的伤害 前面设置部分 先设置项目设置里的物理的Physical Surface 添加好身体的部位 2 添加了几个就几个变量 设置好它们的表面类型 3 找到被伤害
  • 第1章 数据库系统概论---数据库原理及应用

    目录 课程学习目标 本课程教学内容 课程教材 课程实践使用的数据库软件 第1章 数据库系统概论 1 数据库系统概述 一 基本概念 数据 文字 图片等数据化后存入计算机 数据库 DB 按一定的数据模型组织的共享数据 数据库管理系统 DBMS
  • python 读写hive

    最近正在 做一个 项目 需要把 算法模型的结果持久化 至hive 目前 使用的 pyhive 切记 在windows上不能使用 我目前在centos6 5上使用 官方说再macos和linux上可用 from pyhive import h