Error during job, obtaining debugging information... FAILED: Execution Error, return code 2 from org

2023-10-26

create table userbehavior_partitioned2(
user_id string,
item_id string,
category_id string,
behavior_type string
)
partitioned by (time string)


insert into userbehavior_partitioned2 partition(time)
select user_id,item_id,category_id,behavior_type,
from_unixtime(cast(time as bigint),'yyyy-MM-dd HH:mm:ss')time
from userbehavior;

上面的sql是创建分区表userbehavior_partitioned2，并从userbehavior
中select数据插入分区表中

执行代码之前先开启动态分区非严格模式

set hive.exec.dynamic.partition.mode=nonstrict;

再加一条命令

set hive.optimize.sort.dynamic.partition=true;

充分利用动态分区 job数能变少哦

执行上面sql
在这里插入图片描述

报错…
期间花了很长时间看了网上的很多资料，方法很多，但是治不了我这个报错，
但是后来有提示去看日志，于是去找日志
在hive目录下有logs 进去查看
在这里插入图片描述
看到了如下的具体错误信息

然后果断去hive那边

set hive.exec.max.dynamic.partitions.pernode=20000
set hive.exec.max.dynamic.partitions=20000

以为找到原因了还是没用。

但是已经能知道点意思了，开始考虑… 意思是允许的最大分区不够，但是设置了那么大了还是不行，再去看看sql，发现分区的字段好像有点问题，from_unixtime(cast(time as bigint),‘yyyy-MM-dd HH:mm:ss’)time
这个分区字段到了时分秒了，那肯定不行了啊，有十万条数据就有十万个分区啊，肯定不行啊分区是以天为单位，不就一下少了很多吗，改

create table userbehavior_partitioned2(
user_id string,
item_id string,
category_id string,
behavior_type string,
time string  				
)
partitioned by (dt string)


insert into userbehavior_partitioned2 partition(dt)
select user_id,item_id,category_id,behavior_type,
from_unixtime(cast(time as bigint),'yyyy-MM-dd HH:mm:ss')time,
from_unixtime(cast(time as bigint),'yyyy-MM-dd')dt
from userbehavior;

from_unixtime(cast(time as bigint),‘yyyy-MM-dd’)dt，以这个为分区就ok了
再次执行成功
总结：
很多错误表面提示是一样的，但是很多问题是各有各的原因的，最好的解决办法是去找日志，找到根本原因，再去解决。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

hive

Error during job, obtaining debugging information... FAILED: Execution Error, return code 2 from org 的相关文章

行排序时优化 Hive GROUP BY

我有以下非常简单 Hive 查询 select user id event id min time as start max time as end count as total count interaction 1 as clicks
hive 0.14 更新和删除查询配置错误

在阿帕奇中hive 0 14我们可以通过支持更新和删除查询ACID配置 hive configuration hive support concurrency true hive enforce bucketing true hive ex
Spark 返回错误 libsnappyjava.so：无法从共享对象映射段：不允许操作

我刚刚将 Spark 1 6 0 提取并设置到全新安装了 hadoop 2 6 0 和 hive 0 14 的环境中我已经验证了 hive beeline 和 mapreduce 在示例上运行良好然而一旦我跑sc textfile 在
[Hive]查询 hive 数据库时出现“ArrayIndexOutOfBoundsException”

当我查询配置单元基础 hive 0 11 0 和 hive 0 12 0 时我总是得到 ArrayIndexOutOfBoundsException 但有时不会这是错误 java lang RuntimeException Hive R
Hive 和 PIG/Grunt shell 挂在 cygwin 上

我在 Windows 7 机器 32 位上以本地模式运行 Hadoop 我已将 HIVE PIG Hadoop Java6 全部安装在 C 驱动器上我使用的 Cygwin 版本 2 819 我已将 C 安装在 cygwin 上我可以从
使用 PIG 从 Hive 表解析嵌套 XML 字符串

我正在尝试使用 PIG 从 Hive 表中的字段而不是从 XML 文件中提取一些 XML 这是我读过的大多数示例的假设 XML 来自排列如下的表 ID XML string XML 字符串包含 n 行始终包含最多 10 个属性中的至少一个
Hive 命令行如果不是在后台执行 MapReduce 作业，则选择查询所花费的时间不正确

我正在运行配置单元查询如下所示 Select count group name from table name group by group name 状态正在运行在应用程序 ID XXXX 的 YARN 集群上执行 VERTICES
Hive“ANALYZE TABLE”如何从java执行

我需要计算配置单元表中的行数为此我正在使用查询 ANALYZE TABLE p 7 COMPUTE STATISTICS noscan 我想通过java获取结果我正在尝试以下操作代码并没有运气我得到的错误是 Exception i
Hive 左外连接长期运行

Hortonworks HDP 2 3 0 Hive 0 14 Table T1 partition on col1 no bucket ORC 应用程序 1 2 亿行和 6GB 数据大小Table T2 partition on col2
Hive 函数替换列值中的逗号

我有一个配置单元表其中字符串列的值为 12 345 有没有什么方法可以在插入此配置单元表期间删除逗号的配置单元函数您可以使用regexp replace string INITIAL STRING string PATTERN stri
将 Hive 表导出到 hdfs 中的 csv

我知道在 Hive 中将表保存到 csv 或其他文本文件时分隔符存在一个已知问题所以我想知道你们是否可以帮助我解决这个问题我有一个现有的表表 A 我想将其以 csv 格式保存到 hdfs 通过阅读其他回复我相信我必须首先创建一个
HIVE JDBC ThriftHive$Client.sendBase

我在 Hadoop hive 上工作我已经安装了 hadoop 和 hive 它在命令提示符下运行良好我还创建了 hive 的 MySQL 元存储我在 hive site xml 文件中定义了 HIVE DB 数据库名称 MySQL
hive 查询特定联合类型的记录

我创建了一个示例配置单元表 CREATE TABLE union test foo UNIONTYPE
Hive Full Outer Join为相同的Join Key返回多行

我正在对同一列上的 4 个表进行完全外连接我想为连接列中的每个不同值仅生成 1 行输入是 employee1 employee1 personid employee1 name 111 aaa 222 bbb 333 ccc
如何在 Hive 中将字符串转换为毫秒时间戳

我有一个字符串 20141014123456789 它代表一个毫秒时间戳我需要将其转换为 Hive 中的时间戳 0 13 0 而不丢失毫秒我尝试了这个但 unix timestamp 返回一个整数所以我丢失了毫秒 from unix
如果没有可用的指定分区路径，SPARK SQL 会失败

我在 EMR 中使用 Hive Metastore 我可以通过 HiveSQL 手动查询表但是当我在 Spark Job 中使用同一个表时它说输入路径不存在 s3 导致 org apache hadoop mapred InvalidI
如何根据“^P”分隔符分隔的数据构建 Hive 表

我的查询是 CREATE EXTERNAL TABLE gateway staging poll int total int transaction id int create time timestamp update time time
HIVE：GROUP BY 的行为与 MySQL 中不同

我对 MySQL 有一些经验最近我必须在 HIVE 上做一些工作两者之间的查询基本结构非常相似但是 HIVE 中的 GROUP BY 的工作方式似乎有点不同因此我无法实现以前在 MySQL 中使用 GROUP BY 可以实现的目标
Hive 表的默认分隔符是什么？

如果我们在创建表时不提及任何分隔符 hive 是否有默认分隔符创建表日志 ts bigint 行字符串按 dt 字符串国家地区字符串分区默认分隔符 001 如果创建hive表时没有设置您可以将其更改为其他分隔符例如 hive
Hive 中字符串数据类型是否有最大大小？

谷歌了很多但没有在任何地方找到它或者这是否意味着只要允许集群 Hive 就可以支持任意大字符串数据类型如果是这样我在哪里可以找到我的集群可以支持的最大字符串数据类型大小提前致谢 Hive 列表的当前文档STRING作为有效的数据类

随机推荐

最强 Verilog 中 IP核调用实现及思想

写在前面无论是在 ISE 还是 Vivado 中关于 IP核的调用都是非常方便的所以对于初学者来说最关键的不是在 IP Catalog 中设置相关的 IP核参数而是在生成相关的 IP核后该怎么做也即如何让这些 IP核为项目
海思3516系列芯片SPI速率慢问题深入研究与优化（基于PL022 SPI 控制器）

海思3516系列芯片SPI速率慢问题深入分析与优化基于PL022 SPI 控制器我在某个海思主控的项目中需要使用SPI接口来驱动一块液晶屏液晶屏主控为 st7789 分辨率 240x240 图像格式 RGB565 查阅海思相关手册可知
HDU - 1598之为达目的不择手段（并查集的应用）

find the most comfortable road Time Limit 1000 1000 MS Java Others Memory Limit 32768 32768 K Java Others Total Submissi
docker快速搭建redis集群（两种暴露宿主网络的方法）

宿主机IP 192 168 123 181 方案一 host网络模式 1 新建6个容器节点 for port in seq 4001 4006 do docker run itd name redis port network host v
Java线程：volatile关键字

本文转载至 http lavasoft blog 51cto com 62575 222076 Java线程 volatile关键字 Java 语言包含两种内在的同步机制同步块或方法和 volatile 变量这两种机制的提出都是为了
自制个人图床

如何自制个人图床有时候我们想要将自己的图片以链接的形式展示就得需要使用图床或者上传到自己的服务器别人的图床会担心图片链接过期然而自己的服务器会占用内存资源所以我们就自制个人图床首先你得有服务器和域名好了废话不多说直接上教程
2021-10-21

当打开一个页面需要第一行显示当前用户能够领取奖励的按钮应用场景 1 当某些游戏有在线领奖的活动比如在线10分钟 20分钟以此类推可以领取一些奖励当有很多时页面装不下的时候我们希望显示的第一个就是玩家可以领取的奖励比如10分钟
C++—类和对象

文章目录 1 类 2 对象 2 1 创建对象 2 2 对象的操作 2 3 构造函数 2 4 析构函数 3 静态成员 4 this指针 5 友元一切我们研究的事物都可以叫做对象对象具有状态操作和行为通常用一个数值来描述对象的状态对
DVWA ----Buete Force

DVWA Buete Force 暴力破解 low 直接使用Burip suite来进行暴力破解 medium 与low的方法一样但是在破解速度上比较慢因为在源代码中多了sleep 函数 high 同样使用Burip suite进行暴力
RK3588开发板上使用Qt+OpenCV捕获摄像头图像

在Qt下没有专门的视频采集与播放工具这里使用了OpenCV所带的库函数捕获摄像头的视频图像硬件环境讯为RK3588开发板 OV5695 MIPI接口摄像头软件版本 OS ubuntu20 04镜像固件 QT 5 12 8 Qt C
安全运营场景下的语言模型应用

接上篇将安全运营的定义为使用算法能力提取关键信息以此来规避算法误判漏判带来的责任问题同时提升运营人员的工作效率在这篇尝试对语言模型的使用方法做一下讨论和分享 1 语言模型先聊一下语言模型这里刻意规避了大模型这个词主要是对
【Python】循环语句

目录 1 while 循环 2 for 循环 3 continue 4 break 1 while 循环基本语法格式 while 条件循环体条件为真则执行循环体代码条件为假则结束循环例1 打印 1 10 的整数 num 1 w
pyspark合并两个dataframe_PySpark源码解析，教你用Python调用高效Scala接口

在数据科学领域 Python 一直占据比较重要的地位仍然有大量的数据工程师在使用各类 Python 数据处理和科学计算的库例如 numpy Pandas scikit learn 等相较于Scala语言而言 Python具有其独有的优
Mybatis 快速入门之mybatis与spring集成

目录一基本概念撰述 1 SqlSessionFactory对象只有创建了SqlSessionFactory对象才能调用openSession 方法得到SqlSession对象 2 dao接口的代理对象例如StudentDao接口
Hadoop Ls命令添加显示条数限制參数

前言在hadoop的FsShell命令中预计非常多人比較经常使用的就是hadoop fs ls lsr cat等等这种与Linux系统中差点儿一致的文件系统相关的命令可是细致想想这里还是有一些些的不同的首先从规模的本身来看单机
adfs服务器获取信息失败,为什么 elasticsearch 获取节点信息失败？

在 spring boot 项目中即成集成 elasticsearch dao层数据与es交互使用的的是 spring data elasticsearch 首先安装了服务器端的 es 服务和 head 插件 es 服务启动正常 node
C++中关于count的用法总结

华为OD机试真题 2022 2023 真题目录点这里华为OD机试真题信号发射和接收试读点这里华为OD机试真题租车骑绿道试读点这里 C 中关于count的用法总结下面是关于字符串中count的两种用法 STL容器数组的用
JS逆向笔记之断点分类

JS逆向笔记之断点分类文章目录 JS逆向笔记之断点分类 1 JS断点 2 DOM断点 3 XHR断点 4 事件监听器断点 1 JS断点 1 Sources断点 Sources断点添加的流程是 F12 Ctrl Shift I 打开开发工具
Python-opencv读取深度图像

由于实验需要用到Kinect2 0采集的深度图像但是用以下程序读取深度图片的时候显不方便观察 temp img cup depth png depth filename os path join image dir depth img t
Error during job, obtaining debugging information... FAILED: Execution Error, return code 2 from org

create table userbehavior partitioned2 user id string item id string category id string behavior type string partitioned

Error during job, obtaining debugging information... FAILED: Execution Error, return code 2 from org

Error during job, obtaining debugging information... FAILED: Execution Error, return code 2 from org 的相关文章

随机推荐

热门标签