Apache Hive regEx serde：数据类型

2024-03-30

对于处理日志，我想使用 Apache Hive regEx serde，但我只找到使用 String 作为表列的数据类型的示例。

现在我的问题是：是否支持基于日期的类型、整数和数组，还是只是字符串？

此示例（和其他示例）仅使用字符串：

CREATE TABLE access_log (
  remote_ip STRING,
  request_date STRING,
  method STRING,
  request STRING,
  protocol STRING
)
ROW FORMAT SERDE 'org.apache.hadoop.hive.contrib.serde2.RegexSerDe'
WITH SERDEPROPERTIES  (
"input.regex" = "([^ ]) . . [([^]]+)] \"([^ ]) ([^ ]) ([^ \"])\" *",
"output.format.string" = "%1$s %2$s %3$s %4$s %5$s"
)
STORED AS TEXTFILE

;

参考SERDE的代码：RegexSerDe 代码 http://www.docjar.com/html/api/org/apache/hadoop/hive/contrib/serde2/RegexSerDe.java.html or github - RegexSerDe 代码 https://github.com/apache/hive/blob/trunk/contrib/src/java/org/apache/hadoop/hive/contrib/serde2/RegexSerDe.java, 所有列都必须是 STRING 类型。 ——摘自程序评论
如果你想对其进行一些调整，请编写一些自定义 Serde 代码（如果你擅长 java，然后继续）并添加为自定义 Serde jar，如下例所示csv 自定义 Serde https://github.com/ogrodnek/csv-serde/
如果不是，则让列类型仅为 STRING，当您想要对任何列进行操作时，请使用 Casting (hive 中的cast() 函数）在查询中。

希望这可以帮助：）

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

regex

apache

hive

Apache Hive regEx serde：数据类型的相关文章

我在 apache 中使用乘客 for Rails 时收到 403 错误

我已经安装了所需的工具并遵循了几个教程试图让乘客做出回应我可以访问公共文件夹 public 500 html 或 422 hml 中的静态文件昨天我通过虚拟主机进入发现一些乘客错误但一段时间后托管重新启动了服务从那时起我就无
mod_rewrite 有例外

为了将我的服务器上的每个请求重定向到我使用的安全连接 RewriteCond SERVER PORT 80 RewriteRule https mywebsite com 1 R L 效果完美但是我需要两条路径不被重定向说我什么时候访问
设置 Silex Bootstrap 时出现 Apache 错误：无法检查 htaccess 文件

我正在尝试使用 Silex Bootstrap 建立一个网站我已将它与其他 Web 项目一起放在我的文件夹中并更改了 Apache 配置中的 DocumentRoot
使用起始字符串和结束字符串从长字符串中提取子字符串？

我有这个长字符串它是一个长的连续字符串 Home address H NO 12 SECTOR 12 GAUTAM BUDH NAGAR NOIDA 121212 UTTAR PRADESH INDIA 911112121212 Last
jQuery自动完成插件-自定义突出显示功能

我的每个项目的自动完成结果如下所示 h3 Celebrity Sweepstakes h3 p 0 episodes p 但我只想突出显示 H3 内的标题请参阅下面的突出显示功能我不知道如何更改原始正则表达式以仅替换标题内的内容 s
仅当环境变量具有特定值时如何设置 Apache 标头

我想在我的 Apache 2 4 配置中设置标头但前提是环境变量具有特定值 SetEnv ENV NAME prod 我如何仅在以下情况下设置此标头ENV NAME is not prod Header set X Robots Tag
将 Node.js（用于实时通知）添加到现有 PHP 应用程序

我有一个现有的 PHP 应用程序我需要向其中添加实时通知为了实现这一点我安装了node js 打算添加socket io以实现所有实时功能然而尽管在过去的三个小时里研究并试图弄清楚如何将两者结合起来但我发现自己并没有更接近于获得
为什么Apache MPM prefork.c 使用互斥体来保护accept()？

我坐下来读书Apache 的 MPM prefork c http code metager de source xref apache httpd server mpm prefork prefork c这段代码使用了一个名为accept
操作错误：尝试在 ubuntu 服务器中写入只读数据库

我正在使用 FlaskApp 运行mod wsgi and apache2在 Ubuntu 服务器上我尝试运行烧瓶应用程序localhost成功然后部署到ubuntu服务器上但是当我尝试更新数据库时出现错误 Failed to up
如何让“grep -zoP”单独显示每个匹配项？

我有一个此表格的文件 X this is the first match blabla X this is the second match and here we have some fluff 我想提取 X 之后和相同标记之间出现的所有
Python RE（总之检查第一个字母是否区分大小写，其余部分不区分大小写）

在下面的情况下我想匹配字符串 Singapore 其中 S 应始终为大写其余单词可能为小写或大写但在下面的字符串 s 是小写的它在搜索条件中匹配任何人都可以让我知道如何实施吗 import re st Information in
如何使用 PHP 查找字符串中字符的序列模式？

假设我有随机的文本块 EAMoAAQAABwEBAAAAAAAAAAAAAAABAgMFBgcIBAkBAQABBQEBAAAAAAAAAAAAAAAGAgMEBQcBCBAAAQMDAgMEBQcIBQgGCwEAAQACAxEEBSEG
正则表达式 - 匹配不包含字符串的模式

我对正则表达式很陌生并且一直在寻找方法来做到这一点但没有成功给定一个字符串我想删除以 abc 开头以 abc 结尾且中间不包含 abc 的任何模式如果我做 abc abc abc 它将匹配以 b 开头以 abc 结尾并且中间包
在 OSX 和 GNU 中使用“find”删除带有数字的文件名

我正在尝试搜索一个文件并删除名称中包含数字的类似文件我的文件 txt from myfile 00 04 version txt myfile 00 txt find E iregex myfile 0 9 1 txt 删除 myfile
Golang 正则表达式命名组和子匹配

我正在尝试匹配正则表达式并获取匹配的捕获组名称当正则表达式仅与字符串匹配一次时这是有效的但如果它与字符串匹配多次 SubexpNames不返回重复的名称这是一个例子 package main import fmt regexp fu
需要 RegEx 返回第一段或前 n 个单词

我正在寻找一个正则表达式来返回段落中的前 n 个单词或者如果该段落包含少于 n 个单词则返回完整的段落例如假设我最多需要前 7 个单词 p one two p
为什么我的 PHP 脚本无法对其创建的文件进行 chmod？

我有一个 php 创建一个需要可执行的文件它是一个需要由系统运行的批处理文件由于某种原因即使该文件归 apache 所有并且 php 作为 apache 运行并且创建了该文件该脚本还是在 chmod 行处终止我需要进行哪些不同配
正则表达式从字符串中提取 IP 和端口

我正在使用 Perl 尝试从字符串中提取 IP 地址和端口我尝试使用的正则表达式是 s sip 字符串是 sip 255 255 255 255 8080 transport TCP sip 255 255 255 255 8080 显然
使用 Python 从网站下载所有 pdf 文件

我遵循了几个在线指南试图构建一个可以识别并从网站下载所有 pdf 的脚本从而避免我手动执行此操作到目前为止这是我的代码 from urllib import request from bs4 import BeautifulSoup
PHP 致命错误：未找到“MongoClient”类

我有一个使用 Apache 的网站代码如下当我尝试访问它时我在 error log 中收到错误 PHP Fatal Error Class MongoClient not found 以下是可能错误的设置但我认为没有错误 php i

随机推荐

AngularJS ng-value 布尔验证

具体来说我有两个单选按钮它们的 ng model 值必须是布尔值由于这对于正常的 html value 属性是不可能的我发现有用的 Angularjs ng value 问题是当我想做一些验证时当选择单选按钮 ng value f
Solr“实时”索引

我知道有几个与此类似的问题但它们没有为当前的问题提供简单的答案抱歉如果您觉得这是重复的但我认为清晰易懂的答案将使很多人受益那么对于这个问题 Solr 索引更新可以自动化吗如果可以的话最佳方法是什么这是一个简单的用例来澄清问
使用 Powershell 将 PDF 打印为 XPS

我想使用 Powershell 将包含 PDF 文件的文件夹转换为 XPS 文件由于系统限制我无法下载任何第三方软件例如 iTextSharp 来完成此工作我已经能够让Powershell打开文档并打开XPS的打印窗口但名称始终为
使用 javax.sound.midi 包设置乐器通道

我在 javax sound midi 包中设置乐器时遇到问题 Synthesizer synthesizer MidiSystem getSynthesizer MidiChannel channels synthesizer getCh
Python setup.py 在 Egg 中包含 .json 文件

我想将 json 文件也打包到 python Egg 文件中例如 boto包有endpoints json文件但是当我运行 python setup py bdist egg 时它不包含 Egg 中的 json 文件如何将Json文
greenhills 编译器关闭文件或部分文件的优化

我发现了几个用于禁用专用代码部分的 GCC 优化的代码片段使用编译指示 GCC 优化 0 但我找不到 Greenhils 编译器的类似内容没有这样的选择吗从手册 pragma ghs Ostring Turns on optimiza
Powershell 命令修剪以“\”结尾的路径

如果路径结尾为我需要修剪路径 C Ravi 我需要更改为 C Ravi 我有一个情况路径不会以那么它必须跳过我尝试过 EndsWith 但是当我有时它会失败代替可以在 PowerShell 中完成此操作而不诉诸条件吗考虑使用T
检索 Win64 异常表中的所有条目

从一些更清晰的理解Win64异常堆栈行走不显示条目 https stackoverflow com questions 14187450 win64 exception stack walking not displaying entrie
需要字母和数字 - regEx

我试图弄清楚如何只需要字母和数字而不需要任何其他字符所以从字面上看 a z and d or 0 9 取决于对数字执行此操作的更好方法因此如果我有一个需要验证的字符串 toValidate Q23AS9D0APQQ2 It may s
为什么泛型类型不能有显式布局？

如果尝试使用以下方法创建一个通用结构 StructLayout http msdn microsoft com en us library system runtime interopservices structlayoutattribu
类型参数不可分配给字符串

我有一个格式化的 json 数据我想在 d3 中使用它来绘制层次结构它正在处理旧数据但在 json 数据中添加更多维度后出现以下错误类型参数 name string 孩子们组数量名称字符串组数量不可分配给只读字符串
安卓LVL合理吗？

我即将发布我的第一个 Android 应用程序我正在考虑为我的应用程序使用 Android 的许可服务 LVL 但现在我不确定不使用任何许可服务是否会更好 a LVL 无论如何都可以被破解 b LVL 导致我的应用程序出现一些延迟你们有
缩放后确定 HTML5 画布上的鼠标位置

我正在开发一些 HTML5 中涉及画布使用的软件我需要在一张画布上进行缩放并允许用户通过单击鼠标在画布上进行涂鸦到目前为止在我找到的一些示例的帮助下我已经可以使用缩放功能了问题是缩放后我的绘图工具上的鼠标位置不正常在进行任何缩
绘制线而不是点 R

这可能是一个简单的问题但我无法找到解决方案我有以下图我正在使用图 CI 因为我无法用图填充点 leg lt c 1 2 3 4 5 6 7 8 Col rar1 lt c rgb 1 0 0 0 7 rgb 0 0 1 0 7 rg
PyQt self.close() 在 __init__() 中

我在 Python 2 7 下使用 PyQt4 时遇到了一些小问题我正在编写一个小项目其中有一些 QDialogs 相互打开因此我打开一个对话框然后立即打开另一个对话框来检查某些内容当出现错误检查时我希望关闭整个对话框它看起
您可以设置整数的最大限制（C++）吗？

如果我不想让一个整数超过 100 是否有任何简单的方法可以确保该整数永远不会超过 100 无论用户添加了多少例如 50 40 90 50 50 100 50 60 100 50 90 100 尝试这个 std min 50 40 100
从 JSON 创建多表头表

我是熊猫新手我正在尝试创建下表 C Perl line func line func version covered total covered total 我创建的 JSON 结构如下 version1 perl line covere
使用 Google AppEngine MapReduce 处理所有记录后，如何从计数器获取值？

使用 Google AppEngine MapReduce 处理所有记录后如何从计数器获取值或者我在这里错过了计数器的用例示例代码来自http code google com p appengine mapreduce wiki Us
如何从 browserify/babelify 导出全局变量以便在没有 browserify 的项目中使用？

设想我有两个设置完全不同的项目常规网站遗留代码和简单的 gulp 设置小宠物项目在 ES6 类的帮助下编写的 JS 滑块插件用 babel 转译 JS 吞咽任务 gulp task js function return gulp
Apache Hive regEx serde：数据类型

对于处理日志我想使用 Apache Hive regEx serde 但我只找到使用 String 作为表列的数据类型的示例现在我的问题是是否支持基于日期的类型整数和数组还是只是字符串此示例和其他示例仅使用字符串 CREAT

Apache Hive regEx serde：数据类型

Apache Hive regEx serde：数据类型 的相关文章

随机推荐

热门标签

Apache Hive regEx serde：数据类型的相关文章