【Hive】insert into 与 insert overwrite的区别

2023-11-01

目录

一、无分区表情况

1、创建表

2、insert into插入数据

3、继续insert overwrite插入数据

二、分区表情况

1、创建表

2、insert into插入数据

3、继续insert overwrite插入数据

三、insert into和insert overwrite区别


一、无分区表情况

1、创建表

create table stu(name string,age int) 
row format delimited fields terminated by ',';

2、insert into插入数据

insert into table stu(name,age) values ("Lucy",22);
insert into table stu(name,age) values ("Lucy",22);
insert into table stu(name,age) values ("Lina",23);
Total MapReduce CPU Time Spent: 5 seconds 120 msec
hive> select * from stu;
OK
Lucy	22
Lucy	22
Lina	23
Time taken: 1.134 seconds, Fetched: 3 row(s)

3、继续insert overwrite插入数据

insert overwrite table stu values("Lucy",22);
hive> select * from stu;
OK
Lucy	22
Time taken: 0.074 seconds, Fetched: 1 row(s)

insert overwrite 经常 insert overwrite table stu select * from ....使用;

二、分区表情况

1、创建表

create table stu01(name string) 
partitioned by(age int)
row format delimited fields terminated by ',';

2、insert into插入数据

insert into table stu01(name,age) values ("Lucy",22);
insert into table stu01(name,age) values ("Lucy",22);
insert into table stu01(name,age) values ("Lina",23);
hive> select * from stu01;
OK
Lucy	22
Lucy	22
Lina	23
Time taken: 0.088 seconds, Fetched: 3 row(s)

3、继续insert overwrite插入数据

insert overwrite table stu01 values ("Lucy",22);
hive> select * from stu01;
OK
Lucy	22
Lina	23
Time taken: 0.079 seconds, Fetched: 2 row(s)
hive> show partitions stu01;
OK
age=22
age=23
Time taken: 0.045 seconds, Fetched: 2 row(s)

三、insert into和insert overwrite区别

        insert overwrite table 后面的表不能指明要插入的字段名,否则报错。insert into table可以。stu(name,age),紫色部分;

        两者都可以向 hive 表中插入数据,但 insert into 操作是以追加的方式向 hive 表尾部追加数据,而 insert overwrite 操作则是直接重写数据,即先删除 hive 表的数据,再执行写入操作。注意,如果 hive 表是分区表的话,insert overwrite 操作只会重写当前分区的数据,不会重写其他分区数据。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

【Hive】insert into 与 insert overwrite的区别 的相关文章

随机推荐

  • kafka的简单实例

    关于kafka的安装 我主要是在windows下部署的 大家可以看这一篇 https blog csdn net woshixiazaizhe article details 80610432 然后后台启动这个kafka 进入到kafka的
  • 朝圣Java(问题集锦)之:The Apache Tomcat installation at this directory is version 8.5.32. A Tomcat 8.0 inst...

    最近开始学Java了 有C 底子 但是学起来Java还是很吃力 感觉别人架好了各种包 自己只要调用就行了 结果还有各种bug出现 掩面中 启动Tomcat的时候 报错The Apache Tomcat installation at thi
  • Dubbo通信模型

    Dubbo和通信结合 通信实现 服务的发布过程使用通信功能 Protocol export 时会为每个服务创建一个Server 服务的引用过程使用通信功能 Protocol refer 时会创建一个Client 整个类结构及调用关系如下 从
  • (HAL库学习4)STM32CubeMX HAL FreeRTOS 任务创建与删除(也会教直接用代码实现方式)

    这次教的是使用STM32CubeMX使用FreeRTOS来进行任务的创建与任务的删除 其实还有FreeRTOS还有一些需要注意的地方 但是任务的创建与删除就是最重要的了 其他的会在后面讲到 首先说说对FreeRTOS的看法吧 这是公认的大面
  • gitbook 入门教程之 gitbook 简介

    gitBook 是一个基于node js的命令行工具 使用 github git 和 markdown asciiDoc 构建精美的电子书 gitbook 支持输出静态网页和电子书等多种格式 其中默认输出静态网页格式 gitbook 不仅支
  • 除了安苏哪个服务器稳定,同样是魔兽世界玩家,为什么安苏服务器那么不受玩家待见?...

    原标题 同样是魔兽世界玩家 为什么安苏服务器那么不受玩家待见 在魔兽世界中只要一提到安苏服务器 相信很多玩家想到的第一个标签就是贵族服务器 然而同样作为魔兽世界国服服务器中的一员 为什么安苏服务器就那么不受玩家的待见呢 其实原因就很多 今天
  • HTTP 协议详解

    目录 前言 1 HTTP 介绍 2 URL介绍 1 了解 URL 和 URI 2 URL 格式 3 URL encode 3 HTTP 协议格式 1 请求报文格式 2 响应报文格式 3 协议格式总结 4 HTTP 请求 Request 1
  • 红宝书--第一章总结分享

    红宝书 第一章总结分享 作为一名前端开发者 我想很有必要认真阅读业界大佬的著作 这不仅能拓展认知 更能发现曾经的遗漏点和误区 为了激励自己能坚持阅读完 特在此分享自己的品读总结 菜鸟也会变成老鸟 为了我的全栈梦 前端是少不了的 1 Java
  • 如何在Windows 11上安装pycocotools(实操记录)

    参考 https blog csdn net m0 45971439 article details 118332681 https blog csdn net en Wency article details 124767742 目录 一
  • 轻松拿结果-第一部分-第二章 管理者要做“定海神针”

    第二章 管理者要做 定海神针 管理者的三张面孔 做一个严厉的爸爸 在整个团队的管理过程中坚持执行制度 提高团队的人效 做一个温暖的妈妈 让所有员工感受到团队带来的安全感 让大家有所依靠 做一个优秀的教练 有方法 成系统 精细化 过程化的对员
  • 分拆TableSplit 让多个mapper同时读取

    分拆TableSplit 让多个mapper同时读取 默认情况下 一个region是一个tableSplit 对应一个mapper进行读取 但单mapper读取速度较慢 因此想着把默认一个table split分拆成多个split 这样ha
  • AttributeError:‘CartPoleEnv‘ object has no attribute ‘seed‘解决方案

    前言 在尝试运行gym的classic control模块中的Cart Pole的相关代码时 想用随机种子重置一下环境 结果不停的报AttributeError CartPoleEnv object has no attribute see
  • PyQt5-QTablewidght设置表头外框线

    1 设置表头外框线 自带的效果 修改 经过一番探索后 添加一行代码 self logo encode table horizontalHeader setStyleSheet color rgb 0 83 128 border 1px so
  • WIN10系统下VS2019编译CloudCompare2.12.4

    目录 一 源码下载 二 源码编译 1 CCCoreLib 2 Cmake编译 3 设置相关选项 三 报错处理 四 使用插件 本文由CSDN点云侠原创 原文链接 爬虫网站自重 一 源码下载 1 CloudCompare源码 https git
  • oracle rdbms 占内存_Oracle-块损坏故障:ORA-01578

    ORA 01578 错误 ORACLE data block corrupted file s block s 块损坏故障现象 ORA 01578 一般情况下 ORA 01578 错误是由硬件问题引起的 如果ORA 01578 错误始终返回
  • 金山文档服务器暂不可用,常见问题

    GPU相对于CPU有哪些优势 GPU比CPU拥有更多的逻辑运算单元 ALU 支持并行计算 可以多线程大规模并行计算 GPU加速型云服务器是否可以支持配置升级和降级 GPU加速型云服务器支持对直通型GPU云服务器实例进行升级配置 支持套餐有G
  • mysql切换数据库命令_MySQL数据库的基础使用命令大全

    show databases 显示所有已经存在的数据库 create database test 创建名字为test的数据库 drop database test 删除名字为test的数据库 use test 使用名字为test的数据库 s
  • some()和every()的区别

    for in for of forEach some 方法用于检测数组中的是否存在元素满足指定条件 存在返回true 否则返回false 即 只要有一个元素满足条件即为true some 不会对空数组进行检测 some 不会改变原始数组 如
  • 数据分析之数据准备(1-3)

    承接数据分析之数据探索 https blog csdn net qq 45626019 article details 108074152 import pandas as pd import numpy as np housing pd
  • 【Hive】insert into 与 insert overwrite的区别

    目录 一 无分区表情况 1 创建表 2 insert into插入数据 3 继续insert overwrite插入数据 二 分区表情况 1 创建表 2 insert into插入数据 3 继续insert overwrite插入数据 三