Spark SQL 未正确转换时区[重复]

2024-04-18

使用 Scala 2.10.4 和 Spark 1.5.1 和 Spark 1.6

sqlContext.sql(
  """
    |select id,
    |to_date(from_utc_timestamp(from_unixtime(at), 'US/Pacific')),
    |from_utc_timestamp(from_unixtime(at), 'US/Pacific'),
    |from_unixtime(at),
    |to_date(from_unixtime(at)),
    | at
    |from events
    | limit 100
  """.stripMargin).collect().foreach(println)

Spark-提交选项：--driver-java-options '-Duser.timezone=US/Pacific'

result:

[56d2a9573bc4b5c38453eae7,2016-02-28,2016-02-27 16:01:27.0,2016-02-28 08:01:27,2016-02-28,1456646487]
[56d2aa1bfd2460183a571762,2016-02-28,2016-02-27 16:04:43.0,2016-02-28 08:04:43,2016-02-28,1456646683]
[56d2aaa9eb63bbb63456d5b5,2016-02-28,2016-02-27 16:07:05.0,2016-02-28 08:07:05,2016-02-28,1456646825]
[56d2aab15a21fa5f4c4f42a7,2016-02-28,2016-02-27 16:07:13.0,2016-02-28 08:07:13,2016-02-28,1456646833]
[56d2aac8aeeee48b74531af0,2016-02-28,2016-02-27 16:07:36.0,2016-02-28 08:07:36,2016-02-28,1456646856]
[56d2ab1d87fd3f4f72567788,2016-02-28,2016-02-27 16:09:01.0,2016-02-28 08:09:01,2016-02-28,1456646941]

美国/太平洋时间应该是2016-02-28 00:01:27等等，但有些如何减去“8”小时两次

读了一段时间后，得出以下结论：

Spark-Sql 不支持日期时间，也不支持时区
使用时间戳是唯一的解决方案
from_unixtime(at)正确解析纪元时间，只是将其打印为字符串会因时区而改变它。可以肯定地假设from_unixtime将正确转换它（尽管打印它可能会显示不同的结果）
from_utc_timestamp会将时间戳转移（不仅仅是转换）到该时区，在这种情况下，它将从 (-08:00) 开始的时间减去 8 小时
打印 sql 结果会弄乱时区参数的时间

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

scala

apachespark

hive

timezone

Spark SQL 未正确转换时区[重复] 的相关文章

如何在 Spark 中创建空数据帧

我有一组基于 Avro 的配置单元表我需要从中读取数据由于Spark SQL使用hive serdes从HDFS读取数据因此比直接读取HDFS慢很多因此我使用数据块 Spark Avro jar 从底层 HDFS 目录读取 Avr
如何使用 PHP 获取格林威治标准时间？

我有一台设置为 EST 的服务器并且数据库中的所有记录都设置为 EST 我想知道如何将其设置为 GMT 我想为我的用户提供时区选项 I would strongly建议避免弄乱 UNIX 时间戳使其看起来像不同的时区这是我从惨痛的教训
在 Spark-submit 上的 _find_and_load 中获取文件“”，第 991 行

我目前使用的是Python 3 7 9 spark spark 2 4 6 bin hadoop2 6 在这个项目 venv 中我的设置为 kafka python 2 0 2 pip 21 2 4 py4j 0 10 9 pyspark
模式匹配中使用的抽象类型的类型不匹配

此代码编译时出现错误 def f1 T e T T e match case i Int gt i case b Boolean gt b type mismatch found i type with underlying type In
Scala 中两个地图的交集和合并/连接

假设我有两张类似这样的地图 val m1 Map 1 gt One 2 gt Two 3 gt Three val m2 Map 2 gt 2 0 3 gt 3 0 4 gt 4 0 我想根据键获取交集并返回一个表示合并值的元组结果看起来
如何使用 JavaScript 将时间戳字符串转换为本地时间？

我有一个 JSP 页面其中我将存储在数据库中的时间戳作为字符串提取其形式如下Thu Aug 21 2014 22 09 23 GMT 0530 India Standard Time 当然我可以按原样在页面中显示它但是我一直在寻找
对于值类型，asInstanceOf[X] 和 toX 之间有什么区别吗？

我使用 IntelliJ 将 Java 代码转换为 Scala 代码的功能通常效果很好看来 IntelliJ 用调用替换了所有强制转换asInstanceOf 是否有任何有效的用法asInstanceOf Int asInstanceO
Spark SQL / PySpark 中的逆透视

我手头有一个问题陈述其中我想在 Spark SQL PySpark 中取消透视表我已经浏览了文档我可以看到仅支持pivot 但到目前为止还不支持取消透视有什么方法可以实现这个目标吗让我的初始表如下所示 When I pivotPy
将 Spark 数据框中的时间戳转换为日期

我见过这里如何将DataFrame中的时间戳转换为日期格式 https stackoverflow com questions 40656001 how to convert timestamp to date format in da
JavaFx ComboBox 绑定混乱

我有一个 I18N 实现它通过属性绑定 JavaFX UI 元素例如 def translateLabel l Label key String args Any Unit l textProperty bind createStrin
如何更改 SparkContext.sparkUser() 设置（在 pyspark 中）？

我是新来的Spark and pyspark 我使用 pyspark 之后我rdd处理中我试图将其保存到hdfs使用saveAsTextfile 功能但我得到一个没有权限错误消息因为 pyspark 尝试写入hdfs使用我的本地帐
有皮茨时区列表吗？

我想知道 Python 库 pytz 中时区参数的所有可能值是什么怎么做您可以列出所有可用的时区pytz all timezones In 40 import pytz In 41 pytz all timezones Out 42 A
如何过滤 pyspark 列表中值的列？

我有一个数据框原始数据我必须在 X 列上应用值 CB CI 和 CR 的过滤条件所以我使用了下面的代码 df dfRawData filter col X between CB CI CR 但我收到以下错误 Between 恰好需要 3
为什么 PySpark 中的 agg() 一次只能汇总 DataFrame 的一列？ [复制]

这个问题在这里已经有答案了对于下面的数据框 df spark createDataFrame data Alice 4 300 Bob 7 677 schema name High 当我尝试找到最小值和最大值时我只得到输出中的最小值 d
在 case 语句中间使用 unapply 的对象

scala gt object Test def unapply L R v L R Some v defined object Test scala gt 1 2 match case 1 Test 2 gt println First
案例类和案例对象之间的区别？

我正在学习 Scala 和 Akka 并且在最近的查找中solution https stackoverflow com questions 22770927 waiting for multiple results in akka 我发现
Java：getTimeZone不返回默认值

我有以下指示 TimeZone zone TimeZone getTimeZone Asia Toyo 显然它应该返回 null 但它会返回默认时区这不是我的情况所需的行为来自 Java 文档返回指定的TimeZone 或 GMT
如何在Scala中实现尾递归快速排序

我写了一个递归版本 def quickSort T xs List T p T T gt Boolean List T xs match case Nil gt Nil case gt val x xs head val left righ
从继承的受保护 Java 字段创建公共访问器

我怎样才能完成以下工作 class Foo extends javax swing undo UndoManager increase visibility works for method override def editToBeUnd
解析嵌套括号内包含的值

我只是在开玩笑奇怪地发现在简单的递归函数中解析嵌套括号有点棘手例如如果程序的目的是查找用户详细信息它可能来自 name surname age to Bob Builder age 然后到Bob Builder 20 这是一个用于在

随机推荐

Python 中从右到左的语言

我想用 Python 编写希伯来语字符串然后将其显示在屏幕上问题是我得到了我所写内容的镜像如何将字符串设置为使用 RTL 而不是从左到右你尝试过这个吗 http pypi python org pypi python bidi ht
如果多个ID从一张表指向另一张表，如何连接三个表或三个以上的表？

我对加入感到困惑假设我这里有三个表学生表课程表教师表学生表 Std Id Std Name Course Id Teacher Id 1 Amit 2 1 2 Yogesh 1 1 3 Pravin 3 2 4 Nilay 1 3
尝试使用 R fitdistr{MASS} 拟合伽玛分布时出错

我在 R 中遇到 fitdistr MASS 函数的问题我有这个向量 a lt c 26 73 84 115 123 132 159 207 240 241 254 268 272 282 300 302 329 346 359 367
有人可以帮助我使用 Android RemoteControlClient 吗？

我正在尝试获取RemoteControlClient设置以便我的应用程序的音乐可以通过锁定屏幕上弹出的小部件进行控制例如 SoundCloud Google Play 音乐和其他音乐视频应用程序我不确定我的代码有什么问题以及为什么它没
具有多处理功能的超时装饰器类会出现酸洗错误

所以在 Windows 上signal和thread一般来说这种方法是坏主意不适用于函数超时我制作了以下超时代码它会抛出timeout exception from multiprocessing当代码花费很长时间时这正是我想要的
php 和 html 文件扩展名有什么区别？

我有一个 php文件包含以下代码当我将文件的扩展名更改为 html那么它也以同样的方式表现任何人都可以解释以下内容为什么文件的行为方式与两个文件的行为方式相同扩展两者有什么区别 php and html文件扩展名 php file
检测鼠标悬停在用户控件和所有子控件上 - C# WinForms

我设计了一个用户控件里面有几个控件我将用户控件拖放到表单上然后为其设置鼠标悬停事件以在某处显示评论但有一个问题用户应该将鼠标悬停在 UserControl 容器上才能看到该注释如果他将鼠标悬停在 UserControl 内的其中
如何调用模板基类中的模板成员函数？

当在基类中调用非模板化成员函数时可以使用以下命令导入其名称using到派生类中然后使用它这对于基类中的模板成员函数也可能吗只是与using它不起作用使用 g snapshot 20110219 std c 0x template
是否有必要创建与现有 ASP.NET 2.0 ASPState DB 不同的 ASP.NET 4.0 SQL 会话状态数据库？

Is the ASP NET 4 0SQL 会话状态机制向后兼容 ASP NET 2 0 会话状态架构或者我们应该必须为 ASP NET 4 0 应用程序创建一个单独且不同的会话状态数据库无论如何我倾向于后者但是2 0数据库seem
匹配/分组重复行（索引）

如何有效地匹配分组重复行的索引假设我有这个数据集 set seed 14 dat lt data frame mtcars sample 1 5 14 TRUE sample int 14 rownames dat lt NULL da
BlueImp 插件 jQuery 文件上传：如何使用 fileInput 选项以便 fileupload() 可以绑定新的动态添加的输入？

我使用 BlueImp 插件上传文件当用户单击添加文件时会动态添加新的文件输入然后当用户上传文件时它会通过 AJAX 存储在我的 Web 文件夹中我的第一个想法是在生成的 id 上调用 fileupload 方法例如 fi
无法在回收者视图中从一项活动转到另一项活动

大家好我正在尝试使用回收器视图的适配器类中的意图从一个活动移动到另一个活动但这样做时出现 son me 错误以下是错误 1 PakistaniActivity 不是一个封闭类 2 无法解析StatrActivity 方法这是我的代码
“天真的”svn 从分支合并到主干？

我正在将 TortoiseSVN 用于我的 C 项目并尝试将分支重新集成回主干我的情况很简单因此对于分支中更改的每个文件我希望它完全覆盖主干中的匹配文件不幸的是 TortoiseSVN 比我聪明因此它合并了每对文件导致了一
与与“iostream.h”

在 C 中包含头文件时有什么区别包括 h部分与不包括 h包裹时的部分 lt gt signs include 与 include 将标头名称用双引号括起来还是用符号括起来 include 与 include iostream h 简而
在查询索引/唯一字段时使用 MySQL“LIMIT 1”有什么意义吗？

例如我正在查询一个我知道将是唯一的并且已建立索引例如主键的字段因此我知道这个查询只会返回 1 行即使没有 LIMIT 1 SELECT FROM tablename WHERE tablename id 123 LIMIT 1 或
如何使用 SSH 密钥和 Pageant 通过 Paramiko 连接到 SFTP

我正在尝试使用受密码保护的 SSH 密钥通过 Paramiko 连接到 SFTP 我已将密钥加载到 Pageant 中据我所知 Paramiko 支持该密钥但我无法用它来解密我的私钥我找到了这个例子here https stackov
通过检索 JavaScript 值自动选择复选框

自 1 周以来我在一点上遇到了一些困难我有 2 个数组我想通过检索其中一个数组内的值来自动选择复选框首先我有一个循环它根据第一个数组选项创建一些复选框每次我选中一个复选框时文本字段都会用分隔符更新我自己保存这个文本字段
MVVMCross 以编程方式更改启动 ViewModel

可移植类库定义了启动视图模型这种情况听起来不错但我正在考虑这一点您编写了一个 iOS 通用应用程序或 Android 需要更改其开始屏幕视图模型如果应用程序是手机则默认视图模型是登录但如果应用程序是平板电脑则需要不同的视图模
从 PHP 5.5 升级到 5.6 后，cURL 文件上传不再起作用

从 PHP 5 5 升级到 5 6 后我的 cURL 上传失败 aPost array file gt localFile default file gt html version html expiration gt 2 31 24 6
Spark SQL 未正确转换时区[重复]

这个问题在这里已经有答案了使用 Scala 2 10 4 和 Spark 1 5 1 和 Spark 1 6 sqlContext sql select id to date from utc timestamp from unixtim

Spark SQL 未正确转换时区[重复]

Spark SQL 未正确转换时区[重复] 的相关文章

随机推荐

热门标签