将数据从一个 hbase 表复制到另一个 hbase 表

2023-12-27

我创建了一个表 hivetest，它还在 hbase 中创建了名为“hbasetest”的表。现在我想将“hbasetest”数据复制到具有相同架构的另一个 hbase 表（例如 logdata）中。那么，任何人都可以帮助我如何在不使用配置单元的情况下将数据从“hbasetest”复制到“logdata”。

CREATE TABLE hivetest(cookie string, timespent string, pageviews string, visit string, logdate string) 
STORED BY 'org.apache.hadoop.hive.hbase.HBaseStorageHandler'
WITH SERDEPROPERTIES ("hbase.columns.mapping" = "m:timespent, m:pageviews, m:visit, m:logdate")
TBLPROPERTIES ("hbase.table.name" = "hbasetest");

更新的问题：

我已经像这样创建了 logdata 表。但是，我收到以下错误。

create 'logdata', {NAME => ' m', BLOOMFILTER => 'NONE', REPLICATION_SCOPE => '0', VERSIONS => '3', COMPRESSION => 'NONE', MIN_VERSIONS =>'0', TTL => '2147483647', BLOCKSIZE=> '65536', IN_MEMORY => 'false', BLOCKCACHE => 'true'}

13/09/23 12:57:19 INFO mapred.JobClient: Task Id : attempt_201309231115_0025_m_000000_0, Status : FAILED
org.apache.hadoop.hbase.client.RetriesExhaustedWithDetailsException: Failed 755 actions: org.apache.hadoop.hbase.regionserver.NoSuchColumnFamilyException: Column family  m does not exist in region logdata,,1379920697845.30fce8bcc99bf9ed321720496a3ec498. in table 'logdata', {NAME => 'm', DATA_BLOCK_ENCODING => 'NONE', BLOOMFILTER => 'NONE', REPLICATION_SCOPE => '0', COMPRESSION => 'NONE', VERSIONS => '3', TTL => '2147483647', MIN_VERSIONS => '0', KEEP_DELETED_CELLS => 'false', BLOCKSIZE => '65536', ENCODE_ON_DISK => 'true', IN_MEMORY => 'false', BLOCKCACHE => 'true'}
    at org.apache.hadoop.hbase.regionserver.HRegionServer.multi(HRegionServer.java:3773)
    at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
    at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:57)
    at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43)
    at java.lang.reflect.Method.invoke(Method.java:606)
    at org.apache.hadoop.hbase.ipc.WritableRpcEngine$Server.call(WritableRpcEngine.java:320)
    at org.apache.hadoop.hbase.ipc.HBaseServer$Handler.run(HBaseServer.java:1426)
: 755 times, servers with issues: master:60020, 
    at org.apache.hadoop.hbase.client.HConnectionManager$HConnectionImplementation.processBatchCallback(HConnectionManager.java:1674)
    at org.apache.hadoop.hbase.client.HConnectionManager$HConnectionImplementation.processBatch(HConnectionManager.java:1450)
    at org.apache.hadoop.hbase.client.HTable.flushCommits(HTable.java:916)
    at org.apache.hadoop.hbase.client.HTable.close(HTable.java:953)
    at org.apache.hadoop.hbase.mapreduce.TableOutputFormat$TableRecordWriter.close(TableOutputFormat.java:109)
    at org.apache.hadoop.mapred.MapTask$NewDirectOutputCollector.close(MapTask.java:651)
    at org.apache.hadoop.mapred.MapTask.runNewMapper(MapTask.java:766)
    at org.apache.hadoop.mapred.MapTask.run(MapTask.java:370)
    at org.apache.hadoop.mapred.Child$4.run(Child.java:255)
    at java.security.AccessController.doPrivileged(Native Method)
    at javax.security.auth.Subject.doAs(Subject.java:415)
    at org.apache.hadoop.security.UserGroupInformation.doAs(UserGroupInformation.java:1121)
    at org.apache.hadoop.mapred.Child.main(Child.java:249)

13/09/23 12:57:29 INFO mapred.JobClient: Task Id : attempt_201309231115_0025_m_000000_1, Status : FAILED
org.apache.hadoop.hbase.client.RetriesExhaustedWithDetailsException: Failed 755 actions: org.apache.hadoop.hbase.regionserver.NoSuchColumnFamilyException: Column family  m does not exist in region logdata,,1379920697845.30fce8bcc99bf9ed321720496a3ec498. in table 'logdata', {NAME => 'm', DATA_BLOCK_ENCODING => 'NONE', BLOOMFILTER => 'NONE', REPLICATION_SCOPE => '0', COMPRESSION => 'NONE', VERSIONS => '3', TTL => '2147483647', MIN_VERSIONS => '0', KEEP_DELETED_CELLS => 'false', BLOCKSIZE => '65536', ENCODE_ON_DISK => 'true', IN_MEMORY => 'false', BLOCKCACHE => 'true'}
    at org.apache.hadoop.hbase.regionserver.HRegionServer.multi(HRegionServer.java:3773)
    at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
    at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:57)
    at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43)
    at java.lang.reflect.Method.invoke(Method.java:606)
    at org.apache.hadoop.hbase.ipc.WritableRpcEngine$Server.call(WritableRpcEngine.java:320)
    at org.apache.hadoop.hbase.ipc.HBaseServer$Handler.run(HBaseServer.java:1426)
: 755 times, servers with issues: master:60020, 
    at org.apache.hadoop.hbase.client.HConnectionManager$HConnectionImplementation.processBatchCallback(HConnectionManager.java:1674)
    at org.apache.hadoop.hbase.client.HConnectionManager$HConnectionImplementation.processBatch(HConnectionManager.java:1450)
    at org.apache.hadoop.hbase.client.HTable.flushCommits(HTable.java:916)
    at org.apache.hadoop.hbase.client.HTable.close(HTable.java:953)
    at org.apache.hadoop.hbase.mapreduce.TableOutputFormat$TableRecordWriter.close(TableOutputFormat.java:109)
    at org.apache.hadoop.mapred.MapTask$NewDirectOutputCollector.close(MapTask.java:651)
    at org.apache.hadoop.mapred.MapTask.runNewMapper(MapTask.java:766)
    at org.apache.hadoop.mapred.MapTask.run(MapTask.java:370)
    at org.apache.hadoop.mapred.Child$4.run(Child.java:255)
    at java.security.AccessController.doPrivileged(Native Method)
    at javax.security.auth.Subject.doAs(Subject.java:415)
    at org.apache.hadoop.security.UserGroupInformation.doAs(UserGroupInformation.java:1121)
    at org.apache.hadoop.mapred.Child.main(Child.java:249)

13/09/23 12:57:38 INFO mapred.JobClient: Task Id : attempt_201309231115_0025_m_000000_2, Status : FAILED
org.apache.hadoop.hbase.client.RetriesExhaustedWithDetailsException: Failed 755 actions: org.apache.hadoop.hbase.regionserver.NoSuchColumnFamilyException: Column family  m does not exist in region logdata,,1379920697845.30fce8bcc99bf9ed321720496a3ec498. in table 'logdata', {NAME => 'm', DATA_BLOCK_ENCODING => 'NONE', BLOOMFILTER => 'NONE', REPLICATION_SCOPE => '0', COMPRESSION => 'NONE', VERSIONS => '3', TTL => '2147483647', MIN_VERSIONS => '0', KEEP_DELETED_CELLS => 'false', BLOCKSIZE => '65536', ENCODE_ON_DISK => 'true', IN_MEMORY => 'false', BLOCKCACHE => 'true'}
    at org.apache.hadoop.hbase.regionserver.HRegionServer.multi(HRegionServer.java:3773)
    at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
    at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:57)
    at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43)
    at java.lang.reflect.Method.invoke(Method.java:606)
    at org.apache.hadoop.hbase.ipc.WritableRpcEngine$Server.call(WritableRpcEngine.java:320)
    at org.apache.hadoop.hbase.ipc.HBaseServer$Handler.run(HBaseServer.java:1426)
: 755 times, servers with issues: master:60020, 
    at org.apache.hadoop.hbase.client.HConnectionManager$HConnectionImplementation.processBatchCallback(HConnectionManager.java:1674)
    at org.apache.hadoop.hbase.client.HConnectionManager$HConnectionImplementation.processBatch(HConnectionManager.java:1450)
    at org.apache.hadoop.hbase.client.HTable.flushCommits(HTable.java:916)
    at org.apache.hadoop.hbase.client.HTable.close(HTable.java:953)
    at org.apache.hadoop.hbase.mapreduce.TableOutputFormat$TableRecordWriter.close(TableOutputFormat.java:109)
    at org.apache.hadoop.mapred.MapTask$NewDirectOutputCollector.close(MapTask.java:651)
    at org.apache.hadoop.mapred.MapTask.runNewMapper(MapTask.java:766)
    at org.apache.hadoop.mapred.MapTask.run(MapTask.java:370)
    at org.apache.hadoop.mapred.Child$4.run(Child.java:255)
    at java.security.AccessController.doPrivileged(Native Method)
    at javax.security.auth.Subject.doAs(Subject.java:415)
    at org.apache.hadoop.security.UserGroupInformation.doAs(UserGroupInformation.java:1121)
    at org.apache.hadoop.mapred.Child.main(Child.java:249)

13/09/23 12:57:53 INFO mapred.JobClient: Job complete: job_201309231115_0025
13/09/23 12:57:53 INFO mapred.JobClient: Counters: 7
13/09/23 12:57:53 INFO mapred.JobClient:   Job Counters 
13/09/23 12:57:53 INFO mapred.JobClient:     SLOTS_MILLIS_MAPS=34605
13/09/23 12:57:53 INFO mapred.JobClient:     Total time spent by all reduces waiting after reserving slots (ms)=0
13/09/23 12:57:53 INFO mapred.JobClient:     Total time spent by all maps waiting after reserving slots (ms)=0
13/09/23 12:57:53 INFO mapred.JobClient:     Rack-local map tasks=4
13/09/23 12:57:53 INFO mapred.JobClient:     Launched map tasks=4
13/09/23 12:57:53 INFO mapred.JobClient:     SLOTS_MILLIS_REDUCES=0
13/09/23 12:57:53 INFO mapred.JobClient:     Failed map tasks=1

Use the 复制表 http://hbase.apache.org/book/ops_mgt.html#copytable命令。例子：

$ bin/hbase org.apache.hadoop.hbase.mapreduce.CopyTable --new.name=logdata hbasetest

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Hadoop

Hbase

hive

将数据从一个 hbase 表复制到另一个 hbase 表的相关文章

在 Apache Spark 上下文中，内存数据存储意味着什么？

我读到 Apache Spark 将数据存储在内存中然而 Apache Spark 旨在分析大量数据又称大数据分析在这种情况下内存数据存储的真正含义是什么它可以存储的数据是否受到可用 RAM 的限制它的数据存储与使用HDFS的A
以编程方式读取 Hadoop Mapreduce 程序的输出

这可能是一个基本问题但我在谷歌上找不到答案我有一个映射缩减作业它在其输出目录中创建多个输出文件我的 Java 应用程序在远程 hadoop 集群上执行此作业作业完成后需要使用以下命令以编程方式读取输出org apache had
如何决定使用哪种NoSQL技术？ [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案 MongoDB 基于文档 HBase 基于列和 Neo4j 对象图的优缺点是什么我特别有兴趣了解
是否可以通过编写单独的mapreduce程序并行执行Hive查询？

我问了一些关于提高 Hive 查询性能的问题一些答案与映射器和减速器的数量有关我尝试使用多个映射器和减速器但在执行中没有看到任何差异不知道为什么可能是我没有以正确的方式做或者我错过了其他东西我想知道是否可以并行执行 Hive
Spark/Yarn：HDFS 上不存在文件

我在 AWS 上设置了 Hadoop Yarn 集群有 1 个主服务器和 3 个从服务器我已经验证我有 3 个活动节点在端口 50070 和 8088 上运行我在客户端部署模式下测试了 Spark 作业一切正常当我尝试使用 Spa
Protobuf RPC 在 Hadoop 2.2.0 单节点服务器上不可用？

我正在尝试在按照本教程安装的本地单节点集群上运行 hadoop 2 2 0 mapreduce 作业 http codesfusion blogspot co at 2013 10 setup hadoop 2x 220 on ubuntu
Apache Impala 中是否有相当于 Hive 的“爆炸”功能的函数？

Hive的函数explode是记录在这里 https cwiki apache org confluence display Hive LanguageManual UDF LanguageManualUDF Built inTable G
Hadoop 超立方体

嘿我正在启动一个基于 hadoop 的超立方体具有灵活的维度数有人知道这方面现有的方法吗我刚刚发现PigOLAP草图 http wiki apache org pig PigOLAPSketch 但没有代码可以使用它另一种方法是Z
在 HBase 中存储和检索字符串数组

我读过这个答案如何将复杂对象存储到hadoop Hbase中 https stackoverflow com questions 4086684 how to store complex objects into hadoop hbase
插入 Hive 表 - 非分区表到具有多个分区的分区表 - 无法插入目标表，因为列号/类型

当我尝试插入分区表时出现以下错误 SemanticException 错误 10044 第 1 23 行无法插入目标表因为列号类型不同表 insclause 0 有 6 列这 3 列已分区我们不需要任何必须从中转储存储的过滤器
使用 Hive 计算文本变量的单词频率

我有一个变量每一行都是一个句子例子 Row1 Hey how are you Rwo2 Hey Who is there 我希望输出是按单词分组的计数 Example Hey 2 How 1 are 1 我正在使用 split a bi
如何从spark中的hbase表中获取所有数据

我在 hbase 中有一个大表名称为 UserAction 它具有三个列族歌曲专辑歌手我需要从歌曲列族中获取所有数据作为 JavaRDD 对象我尝试了这段代码但效率不高有更好的解决方案来做到这一点吗 static Spa
像袋子一样压平元组

我的数据集如下所示 A 1 2 B 2 9 我想展平 Pig 中的元组基本上为内部元组中找到的每个值重复每个记录这样预期的输出是 A 1 A 2 B 2 B 9 我知道当元组 1 2 和 2 9 是袋时这是可能的你的洞察力很好可以
Hive FROM_UNIXTIME() 以毫秒为单位

我看过足够多的帖子其中我们除以 1000 或进行转换以从毫秒纪元时间转换为时间戳我想知道如何在时间戳中保留毫秒部分 1440478800123 最后3个字节是毫秒我如何将其转换为类似 YYYYMMDDHHMMSS sss 的内容我还
从具有多个分区列的 hive 表中获取最新数据

我有一个具有以下结构的配置单元表 ID string Value string year int month int day int hour int minute int 该表每 15 分钟刷新一次并按年月日小时分钟列进行分区
名称节点与辅助名称节点

Hadoop 具有一致性和分区容忍性即它属于 CAP 理论的 CP 类别 Hadoop不可用因为所有节点都依赖于名称节点如果名称节点崩溃集群就会崩溃但考虑到 HDFS 集群有一个辅助名称节点为什么我们不能称 hadoop 为可用
HDFS：使用 HDFS API 附加到 SequenceFile

我一直在尝试使用 Java API 在 HDFS 上创建和维护序列文件而不运行 MapReduce 作业作为设置用于未来的 MapReduce 工作我想将 MapReduce 作业的所有输入数据存储在单个序列文件中但数据会随着时间的推
Hadoop2.2.0无法访问网页http://:8088

我设置了一个包含两个节点 hadoop01 master 10 0 0 151 和 hadoop02 slaves 10 0 0 152 的 hadoop 集群当输入 start dfs sh 然后访问网站 my ip 上面就是 10 0
Hive 错误：parseException 缺少 EOF

我不确定我在这里做错了什么 hive gt CREATE TABLE default testtbl int1 INT string1 STRING stored as orc tblproperties orc compress NONE
如何列出hadoop hdfs中目录及其子目录中的所有文件

我在 hdfs 中有一个文件夹其中有两个子文件夹每个子文件夹大约有 30 个子文件夹最后每个子文件夹都包含 xml 文件我想列出所有 xml 文件仅给出主文件夹的路径在本地我可以这样做apache commons io 的 h

随机推荐

mongodb 从一个值获取整个文档

我想从单个值获取 mongodb 文档的所有值例子 id id name name description description invite invite support server server developer develop
同一行有多个命令

我一直在尝试找到一些可以让我在 Vim 中的同一行上运行多个命令的东西类似于在 nix 系统中使用分号来分隔命令或在Windows中有没有办法做到这一点 A bar 将允许你这样做从 help bar 可用于分隔命令因此您可以在一
IoC 容器的使用；特别是温莎

我认为这个问题的答案是如此明显以至于没有人费心写这个但已经晚了我真的无法理解这个问题我一直在阅读 IoC 容器在本例中为 Windsor 但我不知道如何从代码的各个部分与容器进行通信我得到了 DI 我已经做了穷人 DI 空构造函
在 scala 中将其别名为 self =>

一些 Scala API 别名this to self 例如 trait Function1 T1 R extends AnyRef self gt 我知道该怎样this别名通常有效但没有看到像 Function1 这样的特征如何从中受益
清理大型遗留 Java 项目

我被指派去做一个大型Java项目的一些工作开发人员的几次迭代的影响是显而易见的没有标准的编码风格格式命名约定或类结构当我遇到 Javadoc 类时真是美好的一天单元测试是一个快乐的白日梦到目前为止我们参与该项目的人员一直在
if 条件在 nginxconf 中的 location 块内如何工作？

我读过了https www nginx com resources wiki start topics 深度 ifisevil https www nginx com resources wiki start topics depth if
从 HttpClient SendAsync 请求获取响应时出现无法解释的超时和延迟

我们有一个 NET 4 7 2 它混合使用异步和同步代码我知道这是禁忌我们在 Windows 服务上使用 NancyFX 该服务获取休息呼叫并进行休息呼叫线程池看起来很健康整个进程只使用了 70 个线程由于某种原因某些 http
警告：def 文件末尾的 .drectve 已损坏

我在 eclipse cdt c 中使用 gcc mingw 安装了 glew glfw 和 glm 全部都是静态的一切正常但我不喜欢 eclipse 输出控制台中的警告警告 def 文件末尾的 drectve 已损坏我如何修复并隐
ASCII 编码 UTF-8 的有效方法

我正在寻找一种简单有效的方法来以 ASCII 7 存储 UTF 8 字符串我所说的高效是指输入中的所有 ASCII 字母数字字符应与输出中的 ASCII 字母数字字符保持相同结果字符串应尽可能短该操作需要可逆且不会丢失任何数据生成
如何在 ASP.NET MVC 4 应用程序中使用会话？

我是 ASP NET MVC 新手我以前使用过 PHP 很容易创建会话并根据当前会话变量选择用户记录我在 Internet 上到处寻找简单的分步教程该教程可以向我展示如何在 C ASP NET MVC 4 应用程序中创建和使用会话我
将张量组织成一批动态形状的张量

我有以下情况我想使用 Tensorflow Serving 部署人脸检测器模型 https www tensorflow org serving https www tensorflow org serving 在 Tensorflow
寻找分区问题算法返回 true 的最大值子集

我有以下任务您有一个包含 1 假设S有两个子集s1和s2 其中一个子集所有元素的值之和等于另一个子集所有元素值之和且为最大可能值我必须返回 S 的哪些元素不会包含在两个子集中的任何一个中它可能之前已经解决了我认为它的一些变体分区问
Eclipse 动态 Web 项目文件位置

我正在 Eclipse 中创建一个新的动态 Web 项目并且想知道文件夹分类的最佳实践是什么这就是我认为的文件夹有人可以验证一下吗
jQuery：获取父级、父级 ID？

ul li a href www example com link a li ul 如何使用 jQuery 获取 ul myList 的 id 单击链接时会触发我的 j 脚本事件我努力了 this parent attr id 但它获取了
有关运行 Windows Phone 8 资源密集型任务的任何提示吗？

我一直在尝试让资源密集型任务后台代理在部署到手机后以发布模式运行几天但从未见过它运行有人让它在调试器之外工作吗你等了多久才运行我能够使用 LaunchForTest 启动并成功运行资源密集型任务但从未让它在发布模式下正常运行即使
通过打开包含内容的文本编辑器来捕获用户输入

从 bash 脚本中我想打开当前用户的默认文本编辑器粘贴字符串 original content in it 一旦用户修改内容然后关闭文本编辑器将修改后的字符串捕获到变量中 modified content 然后保存 modifie
我是否可以在前向声明中默认模板参数

所以我试图了解 Boost 发生了什么ptree执行在ptree hpp中basic ptree实际上定义为 template
在 VBA 中从 IEEE-754 双精度数中提取尾数、指数和符号数据

如何在 VBA 中从 IEEE 754 64 位双精度浮点数中提取尾数指数和符号数据谢谢 Edit 约翰科尔曼评论后在发布原始问题之前我已经四处寻找解决方案但只能找到如何在 C 中执行此操作例如使用具有位字段的结构找不到
我可以更改 PHP 接受的扩展吗？

我想接受包含 PHP 代码的其他类型的文件例如如果通过 PHP 读取 aspx 文件就像它是 php 一样那就太好了将其添加到 Apache 中的 htaccess 文件中以使 html 解析为 PHP AddType appl
将数据从一个 hbase 表复制到另一个 hbase 表

我创建了一个表 hivetest 它还在 hbase 中创建了名为 hbasetest 的表现在我想将 hbasetest 数据复制到具有相同架构的另一个 hbase 表例如 logdata 中那么任何人都可以帮助我如何在不使用配置

将数据从一个 hbase 表复制到另一个 hbase 表

将数据从一个 hbase 表复制到另一个 hbase 表 的相关文章

随机推荐

热门标签

将数据从一个 hbase 表复制到另一个 hbase 表的相关文章