Hive Utf-8 编码支持的字符数?

2023-12-22

您好,实际上问题如下,我想要插入到 hive 表中的数据包含拉丁单词,并且采用 utf-8 编码格式。但 hive 仍然无法正确显示。

Actual Data:- Actual Data

数据插入到hive中

我将表的编码更改为 utf-8,下面的 hive DDL 和命令仍然存在相同的问题

CREATE TABLE IF NOT EXISTS test6
(
CONTACT_RECORD_ID    string,
ACCOUNT    string,
CUST    string,
NUMBER    string,
NUMBER1    string,
NUMBER2    string,
NUMBER3    string,
NUMBER4    string,
NUMBER5    string,
NUMBER6    string,
NUMBER7    string,
LIST    string
)
ROW FORMAT DELIMITED 
FIELDS TERMINATED BY '|';
ALTER TABLE test6 SET serdeproperties ('serialization.encoding'='UTF-8');

hive 只支持 UTF-8 的前 128 个字符吗? 请您提出建议。


这可能不是理想的解决方案,但这是可行的。 Hive 似乎不将它们视为 UTF8。请尝试使用以下参数创建表:

CREATE TABLE testjoins.yt_sample_mapping_1(
   `col1` string,
   `col2` string,
   `col3` string)
   ROW FORMAT SERDE "org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDe"
   WITH SERDEPROPERTIES ( "separatorChar" = ",", 
    "quoteChar" = "\"", 
    "escapeChar" = "\\", 
    "serialization.encoding"='ISO-8859-1') 
    TBLPROPERTIES ( 'store.charset'='ISO-8859-1', 
    'retrieve.charset'='ISO-8859-1');
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

Hive Utf-8 编码支持的字符数? 的相关文章

随机推荐

  • 使用带有 ldap_sasl_bind_s 函数的 kerberos 凭证通过 GSSAPI 进行 SASL 绑定

    我正在尝试使用 kerberos 凭据和 ldap sasl bind s 函数通过 GSSAPI 实现 SASL 绑定 我按照中描述的步骤操作ldap sasl bind s GSSAPI 凭证 BERVAL 结构中应提供什么 https
  • 函数参数中的 `type_alias{}` VS `char[N]{}`

    环境 x86 64Clang 6 0 0 函数的定义 void foo const char foo char 16 houston there is a problem foo type alias
  • 您可以在 iPhone 上执行 Ping 或 Traceroute 命令吗?

    奇怪的问题 我知道我可以在 OS X Objective C 中执行此操作 但是您可以对 iPhone 上的 IP 或 URL 运行 ping 吗 有框架支持吗 与执行跟踪路由相同 None
  • VBA查找多个文件

    我有这段代码 它根据搜索字符串查找文件名 以及文件路径 这段代码在查找单个文件时效果很好 我希望这个宏能够查找多个文件并使用逗号分隔显示它们的名称 Function FindFiles path As String SearchStr As
  • boost::python:编译失败,因为复制构造函数是私有的

    我使用 boost python 来包装 C 类 这个类不允许复制构造函数 但 python 模块总是想创建一个 C 类看起来像这样 简化 class Foo public Foo const char name constructor p
  • EntityMode.Map 与 Hibernate 4.2.6+ Spring 3.2

    我正在尝试使用动态休眠模型 下面是获取会话的代码片段 我已经声明了 hibernate default entity mode as dynamic map 在 hibernate 会话工厂配置 xml 中 Declared at clas
  • 强制 Backbone 将属性保存为文件

    有没有办法使用Model set and Model save以强制 Backbone 将数据作为文件发送到服务器的方式 就像您提交带有
  • Javascript库:混淆还是不混淆 - 这就是问题[关闭]

    Closed 这个问题正在寻求书籍 工具 软件库等的推荐 不满足堆栈溢出指南 help closed questions 目前不接受答案 我需要编写一个与 GUI 相关的 javascript 库 它将给我的网站带来一点优势 就我可以提供的
  • []byte(字符串) 与 []byte(*字符串)

    我很好奇为什么 Go 不提供 byte string 方法 从性能角度来说 不会 byte string 复制输入参数并增加更多成本 尽管这看起来很奇怪 因为字符串是不可变的 为什么要复制它们 byte something 不是函数 或方法
  • 评估 PHP 中的 XPath 2.0

    我目前正在开发一个用 PHP 编写的项目 并且想要评估 XML 文件上的 XPath 表达式 由于文件相当复杂 我的 XPath 包含如下表达式为了 回报 循环或 XPath 2 引入的其他功能 不幸的是 PHP 的DOMXPath htt
  • facebook javascript sdk 登录在 iOS 上不起作用/移动设备的最佳实践

    我试图允许用户使用 javascript SDK 通过 facebook 登录登录我的 web 应用程序 它适用于桌面 safari 和 chrome 但弹出窗口在 iOS 上的 safari 和 chrome 上均失败 该错误直接发送至不
  • Laravel PHPUnit 模拟请求

    我正在我的控制器上执行 PHPUnit 但我似乎无法正确模拟请求 这是控制器 use Illuminate Http Request public function insert Request request some codes her
  • 无法生成临时类(结果=1)。错误CS0030:

    我正在尝试使用贝宝快速结账https www sandbox paypal com wsdl PayPalSvc wsdl https www sandbox paypal com wsdl PayPalSvc wsdl 当我打电话使用时
  • 在for循环中运行replace()方法?

    已经很晚了 我一直在尝试编写一个简单的脚本 将点云数据重命名为工作格式 我不知道我做错了什么 因为底部的代码工作正常 为什么for循环中的代码不起作用 它将其添加到列表中 但它只是没有被替换功能格式化 抱歉 我知道这不是调试器 但我真的很困
  • 如何使用 Gmail 中的标签来识别单个邮件而不是已由脚本处理的线程

    使用 google 邮件脚本 我尝试使用 API 将带有某些标签的新电子邮件上传到我们的 CRM 我无法检查邮件是否已上传 因此我必须在邮箱中为之前已处理过的邮件应用标签 不幸的是 谷歌脚本只允许您在线程级别添加或检查标签 由于新消息可以在
  • 使用 sqlplus 检索大型 clob 数据

    如何使用 sqlplus 将大 clob 数据从表中完全检索到标准输出 有一种方法可以使用特定于语言的数据库 API 来完全获得它 但是当我尝试纯粹使用 sqlplus 来获取它时 我遇到了几个问题 例如 输出缓冲区太小 最大 4000 字
  • Xamarin:应用程序未安装问题

    当我在 Android 移动设备上以调试模式安装应用程序时 它似乎已安装 但是 在签署应用程序并发布后 它并未安装在我的手机上 释放模式 它说 应用程序未安装 我尝试了一些方法但无法解决这个问题 我还用另一个密钥库进行了测试 但仍然无法安装
  • 将匿名侦听器与 C# 和垃圾收集中的事件分离

    假设我有一个名为 Dialog 的类 它扩展了 Form 对话框上有一个文本框和一个 确定 按钮 当用户单击 确定 时 文本框值将通过事件返回 public class Dialog Form public delegate void on
  • 命令替换中的 Heredoc:引号或括号不平衡时出错(bash 和 zsh)

    考虑以下用于打印单引号的混淆脚本 该脚本适用于ksh bin ksh echo cat lt
  • Hive Utf-8 编码支持的字符数?

    您好 实际上问题如下 我想要插入到 hive 表中的数据包含拉丁单词 并且采用 utf 8 编码格式 但 hive 仍然无法正确显示 Actual Data 数据插入到hive中 我将表的编码更改为 utf 8 下面的 hive DDL 和