Hive/SparkSQL：如何将 Unix 时间戳转换为时间戳（而不是字符串）？

2024-03-09

我以为这很容易......

在 Hive/SparkSQL 中，如何将 unix 时间戳[注 1] 转换为timestamp数据类型？

（注1：即自1970年1月1日起的秒/毫秒数）

我想from_unixtime()会这样做，但它返回一个字符串而不是时间戳。下面的实验说明了这个问题

第0步：准备

select 
  from_unixtime(1508673584) as fut;

Result:

-----------------------
| fut                 |
| ------------------- |
| 2017-10-22 11:59:44 |
-----------------------

步骤 1：创建一个表，其中包含结果from_unixtime()

create table test
select 
  from_unixtime(1508673584) as fut;

步骤 2：检查列的数据类型fut

describe test;

Result:

----------------------------------
| col_name | data_type | comment |
| -------- | --------- | ------- |
| fut      | string    | <null>  |
----------------------------------

我也尝试过这个

select 
  from_utc_timestamp(1508618794*1000, 'EDT');

根据手册（链接here https://cwiki.apache.org/confluence/display/Hive/LanguageManual+UDF#LanguageManualUDF-DateFunctions），这应该有效。因为它指出：

将 UTC 时间戳*转换为给定时区（从 Hive 0.8.0 开始）。 * timestamp 是一个原始类型，包括时间戳/日期， tinyint/smallint/int/bigint、float/double 和decimal。分数值被视为秒。整数值被视为毫秒.. 例如 from_utc_timestamp(2592000.0,'PST'), from_utc_timestamp(2592000000,'PST') 和 from_utc_timestamp(timestamp '1970-01-30 16:00:00','PST') 全部返回时间戳 1970-01-30 08:00:00

但是，我得到了一个错误

Error: org.apache.spark.sql.AnalysisException: 
  cannot resolve 'from_utc_timestamp((1508618794 * 1000), 'EDT')' 
  due to data type mismatch: 
  argument 1 requires timestamp type, 
  however, '(1508618794 * 1000)' is of int type.; line 2 pos 2;
'Project [unresolvedalias(from_utc_timestamp((1508618794 * 1000), EDT), None)]
+- OneRowRelation$

SQLState:  null
ErrorCode: 0

（我自己在这里提供答案。）

答案是使用cast()。这对两者都有效date and timestamp

select 
  from_unixtime(1508673584)                    as fut,
  cast(from_unixtime(1508673584) as date)      as futAsDate,
  cast(from_unixtime(1508673584) as timestamp) as futAsTimestamp;

Result:

------------------------------------------------------------
| fut                 | futAsDate  | futAsTimestamp        |
| ------------------- | ---------- | --------------------- |
| 2017-10-22 11:59:44 | 2017-10-22 | 2017-10-22 11:59:44.0 |
------------------------------------------------------------

数据类型验证

create table test2
select 
  from_unixtime(1508673584)                    as fut,
  cast(from_unixtime(1508673584) as date)      as futAsDate,
  cast(from_unixtime(1508673584) as timestamp) as futAsTimestamp;

And then

describe test2;

Result:

----------------------------------------
| col_name       | data_type | comment |
| -------------- | --------- | ------- |
| fut            | string    | <null>  |
| futAsDate      | date      | <null>  |
| futAsTimestamp | timestamp | <null>  |
----------------------------------------

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

hive

apachesparksql

Hive/SparkSQL：如何将 Unix 时间戳转换为时间戳（而不是字符串）？的相关文章

Apache Spark SQL 按范围对数据进行分组

我有一个表包含年龄列我想根据年龄将人们分为几组例如 0 5 5 10 10 15 然后我会对每组进行相同的计算并比较结果这样做的目的是看看年龄是否与其他变量相关请帮忙你可以用这个公式来计算年龄range start age a
“RDD”对象没有属性“_jdf”pyspark RDD

我是 pyspark 的新手我想对文本文件执行一些机器学习 from pyspark import Row from pyspark context import SparkContext from pyspark sql session
如果没有可用的指定分区路径，SPARK SQL 会失败

我在 EMR 中使用 Hive Metastore 我可以通过 HiveSQL 手动查询表但是当我在 Spark Job 中使用同一个表时它说输入路径不存在 s3 导致 org apache hadoop mapred InvalidI
如何根据“^P”分隔符分隔的数据构建 Hive 表

我的查询是 CREATE EXTERNAL TABLE gateway staging poll int total int transaction id int create time timestamp update time time
Hive 表的默认分隔符是什么？

如果我们在创建表时不提及任何分隔符 hive 是否有默认分隔符创建表日志 ts bigint 行字符串按 dt 字符串国家地区字符串分区默认分隔符 001 如果创建hive表时没有设置您可以将其更改为其他分隔符例如 hive
Spark 使用前一行的值向数据帧添加新列

我想知道如何在 Spark Pyspark 中实现以下目标初始数据框 id num 4 9 0 3 7 0 2 3 0 1 5 0 结果数据框 id num new Col 4 9 0 7 0 3 7 0 3 0 2 3 0 5 0 我通
如何根据列值是否位于 Spark DataFrame 中的一组字符串中来过滤行

是否有一种更优雅的方法根据字符串集中的值进行过滤 def myFilter actions Set String myDF DataFrame DataFrame val containsAction udf action String g
如何在大窗口上优化窗口聚合？

我在 Spark 2 4 4 中使用带有大窗口的窗口函数例如 Window partitionBy id orderBy timestamp 在我的测试中我有大约 70 个不同的 ID 但我可能有大约 200 000 行 ID 如果没有
PySpark 中按降序排序

我正在使用 PySpark Python 2 7 9 Spark 1 3 1 并有一个数据框 GroupObject 我需要按降序过滤和排序试图通过这段代码来实现它 group by dataframe count filter coun
Spark 两个分区数据帧之间的共置连接

对于以下两个之间的连接DataFrames在 Spark 1 6 0 中 val df0Rep df0 repartition 32 col a cache val df1Rep df1 repartition 32 col a cache
Spark：将 bytearray 转换为 bigint

尝试使用 pyspark 和 Spark sql 将 kafka 键二进制字节数组转换为 long bigint 会导致数据类型不匹配无法将二进制转换为 bigint 环境详情 Python 3 6 8 Anaconda custo
Hive（查找连续 n 列中的最小值）

我在 Hive 中有一个表有 5 列即电子邮件 a first date b first date c first date d first date a b c d 是用户可以执行的 4 个不同操作上表中的 4 列表示用户执行第一个
如何在 PySpark 数据框中创建动态组？

虽然问题是基于连续行的两个或多个列的值创建多个组但我只是通过这种方式简化问题假设有这样的 pyspark 数据框 gt gt gt df sqlContext createDataFrame Row SN 1 age 45 gender
Hive 中字符串数据类型是否有最大大小？

谷歌了很多但没有在任何地方找到它或者这是否意味着只要允许集群 Hive 就可以支持任意大字符串数据类型如果是这样我在哪里可以找到我的集群可以支持的最大字符串数据类型大小提前致谢 Hive 列表的当前文档STRING作为有效的数据类
连接到 Hive 时使用 Spark 进行 Kinit

我正在尝试从独立的 Spark 连接到 Hive hadoop 集群具有 kerberos 身份验证有人可以让我知道如何在 Spark 程序中执行 kinit 我可以连接到配置单元吗更新我的 Spark 与 Hadoop 位于不同的集
Hive ParseException - 无法识别“结束”“字符串”附近的输入

尝试从现有 DynamoDB 表创建 Hive 表时出现以下错误 NoViableAltException 88 at org apache hadoop hive ql parse HiveParser IdentifiersParser
Spark 使用自定义架构读取镶木地板

我正在尝试使用自定义架构导入镶木地板格式的数据但它返回类型错误 option 缺少 1 个必需的位置参数值 ProductCustomSchema StructType StructField id sku IntegerType T
如何将我自己的函数添加为 ML pyspark Pipeline 中的自定义阶段？ [复制]

这个问题在这里已经有答案了 Florian 的示例代码 ball column keep the hall column 0 7 14 1 8 15 2 9 16 3 10 17 4 11 18
如何计算 pyspark dataframe 中的每日基础（时间序列）

所以我有一个数据框我想计算一些数量比如说每天假设我们有 10 列 col1 col2 col3 col4 coln 其中每列都依赖于值col1 col2 col3 col4 等等日期根据id date col1 id col2 co
HIVE 执行错误，从 org.apache.hadoop.hive.ql.exec.DDLTask 返回代码 1

我在创建配置单元数据库时收到以下错误 FAILED 执行错误从 org apache hadoop hive ql exec DDLTask 返回代码 1 com facebook fb303 FacebookService Iface

随机推荐

动态语言 - 我应该选择哪一种？

动态语言正在兴起而且数量很多例如Ruby Groovy Jython Scala 静态但具有动态语言的外观和感觉等我的背景是 Java SE 和 EE 编程我想将我的知识扩展到这些动态语言之一以便为未来做好更好的准备但我应该
iOS 6 - BluetoothManager 框架 - “NSObject”未找到错误

我的问题是重复的this https stackoverflow com questions 14069892 bluetoothmanager framework nsobject error lq 1一但那个问题正确地被关闭为非建
是否有任何工具可以检测不再使用的代码/功能？

我们有许多应用程序正在运行考虑所有应用程序都在 Java 平台上运行我们需要检查过去例如 3 个月使用了哪些应用程序以及在这些活动应用程序中哪些部分功能以及使用频率仍在使用中那可能吗这里的目标是检测不再与业务相关的应用
如何获取从 Invoke-RestMethod 返回 400 Bad Request 的 Web 请求正文

当我运行以下语句时 Invoke RestMethod https api mysite com the endpoint Body ConvertTo Json data ContentType application json Head
如何获取 Google Cloud Platform 中当前项目的组织 ID？

我想知道我当前在 GCP 中的项目的组织 ID gcloud projects describe PROJECT ID将显示parent可以是组织但如果父级是folder 不会出现组织 ID 我可以使用递归文件夹的父层次结构gcloud
更改 iframe 内的字体[重复]

这个问题在这里已经有答案了我有一个 HTML 页面其中包含iframe 我想更改 iframe 内容的样式但我似乎无法做到这一点我想更改里面所有内容的字体iframe到塔霍马这是我的代码
以编程方式循环遍历 DatagridView 并选中复选框

我有 DataGridView 由数据表绑定我有相同的复选框我想导航或循环浏览 datagridview 并选中这些复选框下面是我使用的语法 foreach DataGridViewRow dr in dgvColumns Rows
将图像作为 json 条目发送 android

我有一个要求我将 json 文件发送到服务器并且解析发生在服务器端我已经创建了 json 文件的条目现在我想将 imageview 中存储的图像存储为 json 文件的条目搜索了之前的几篇文章但找不到具体的操作任何指针对于以
在另一个字符串中搜索字符串数组的最有效方法

我有一个很大的字符串数组看起来像这样 String temp new String 200000 我有另一个字符串我们称之为大文本我需要做的是迭代 temp 的每个条目检查是否在 bigtext 中找到该条目然后基于它做一些工作
jQuery UI 调整大小，同时保持相同的整体宽度

我有两个水平放置的容器position absolute 我试图在中间制作一个调整大小栏这样拖动它就会增加一个元素的大小同时减小另一个元素的大小因此保持整体宽度相同 div class container left div div
更改 XTS 对象的时区

我有一个数据对象 index x 6217 2014 09 03 GMT 2014 09 04 GMT 2014 09 05 GMT 2014 09 08 GMT 2014 09 09 GMT 2014 09 10 GMT 2014 09
在 d3.js 中，在使用行转换导入 csv 文件时，如何“切片”数据以仅包含一系列行？

我正在 d3 中使用包含超过 39000 行的数据表并且我不想一次直观地表示所有项目这就是我目前所拥有的 var impt d3 csv Data prisoncsv8 csv function data i return more d
在 ScalaTest 中使用“不应该产生 [异常]”语法

我正在玩 Scala 中的 BDD 的 Specs2 和 ScalaTest 当我断言不应抛出给定异常时我在 Specs2 中写下了期望 do something in must not throwA MyException 我希望能够在
.NET 是否可以测试数组的等效性而不仅仅是相等的引用？

var a new double 1 2 3 var b new double 1 2 3 System Console WriteLine Equals a b Returns false 但是我正在寻找一种比较数组的方法该方法会比较
正则表达式：对 url 字符串的两个斜杠之间的倒数第二个值进行子串

我有一个像这样的字符串 http www example com value 1234 different value 我怎样才能提取1234 注意末尾可能有斜杠 http www example com value 1234 diffe
字符串数组转换

我有以下代码 char array1 3 hello world there struct locator t char t int len locator 2 array1 10 它可以使用 gcc Wall ansi pedantic
PHP：对数组进行排序

我有一个数组其中包含来自嵌套集模型中的 MySQL 表的数据我希望对其进行排序不仅按字母顺序排序而且还按父节点之后的子节点排序示例要排序的数组排序之前 Array 0 gt Array id gt 1 name gt Komp
SQL 连接同一文件中不同记录的文本字段

我们正在讨论使用 DB2 的 iSeries 上的文件中的数据文件结构如下 Item Textline Text 12755 1 this item 12755 2 is no longer 12755 3 for sale abc123
如何在 Android 中创建 GUI 而不是使用 XML？

我不喜欢管理XML and Java在一起我可以使用创建相同的 GUIJava语言我该怎么做你能告诉我简单的代码吗Button 我将不胜感激正确的答案是的你可以 public class MyActivity extends Act
Hive/SparkSQL：如何将 Unix 时间戳转换为时间戳（而不是字符串）？

我以为这很容易在 Hive SparkSQL 中如何将 unix 时间戳注 1 转换为timestamp数据类型注1 即自1970年1月1日起的秒毫秒数我想from unixtime 会这样做但它返回一个字符串而不是时间戳

Hive/SparkSQL：如何将 Unix 时间戳转换为时间戳（而不是字符串）？

Hive/SparkSQL：如何将 Unix 时间戳转换为时间戳（而不是字符串）？ 的相关文章

随机推荐

热门标签

Hive/SparkSQL：如何将 Unix 时间戳转换为时间戳（而不是字符串）？的相关文章