在 Amazon EMR 上使用 java 中的 hbase 时遇到问题

2024-05-11

因此，我尝试使用作为 MapReduce 步骤启动的自定义 jar 来查询 Amazon ec2 上的 hbase 集群。我的 jar （在地图函数内）我这样调用 Hbase：

public void map( Text key, BytesWritable value, Context contex ) throws IOException, InterruptedException {
    Configuration conf = HBaseConfiguration.create();
    HTable table = new HTable(conf, "tablename");
      ...

问题是，当它到达 HTable 行并尝试连接到 hbase 时，该步骤失败，并且出现以下错误：

2014-02-28 18:00:49,936 INFO [main] org.apache.zookeeper.ZooKeeper: Initiating client connection, connectString=localhost:2181 sessionTimeout=180000 watcher=hconnection
2014-02-28 18:00:49,974 INFO [main] org.apache.hadoop.hbase.zookeeper.RecoverableZooKeeper: The identifier of this process is [email protected] /cdn-cgi/l/email-protection
2014-02-28 18:00:49,998 INFO [main-SendThread(localhost:2181)] org.apache.zookeeper.ClientCnxn: Opening socket connection to server localhost/127.0.0.1:2181. Will not attempt to authenticate using SASL (unknown error)
2014-02-28 18:00:50,005 WARN [main-SendThread(localhost:2181)] org.apache.zookeeper.ClientCnxn: Session 0x0 for server null, unexpected error, closing socket connection and attempting reconnect
java.net.ConnectException: Connection refused

      ...

2014-02-28 18:01:05,542 WARN [main] org.apache.hadoop.hbase.zookeeper.RecoverableZooKeeper: Possibly transient ZooKeeper exception: org.apache.zookeeper.KeeperException$ConnectionLossException: KeeperErrorCode = ConnectionLoss for /hbase/hbaseid
2014-02-28 18:01:05,542 ERROR [main] org.apache.hadoop.hbase.zookeeper.RecoverableZooKeeper: ZooKeeper exists failed after 3 retries
2014-02-28 18:01:05,542 WARN [main] org.apache.hadoop.hbase.zookeeper.ZKUtil: hconnection Unable to set watcher on znode (/hbase/hbaseid)
org.apache.zookeeper.KeeperException$ConnectionLossException: KeeperErrorCode = ConnectionLoss for /hbase/hbaseid

      ... and on and on

我可以很好地使用 hbase shell，并且可以从 shell 查询数据和所有内容。我不知道从哪里开始，我已经在谷歌上搜索了几个小时但没有运气。互联网上的大多数此类问题都没有提及亚马逊的具体修复方法。我认为zookeeper和hbase应该通过亚马逊引导程序自动正确连接。

我使用 hbase 0.94.17 jar，亚马逊正在运行 hbase 0.94.7，我很确定这不是问题，我猜更多的是我没有正确设置 Java 代码。如果有人可以提供帮助，我们将不胜感激。谢谢

好吧，经过近 30 个小时的尝试，我找到了解决方案。对此有很多注意事项，并且版本很重要。

在本例中，我使用 amazon emr hadoop2 (ami 3.0.4) 和 Hbase 0.94.7，并尝试在同一集群上运行自定义 jar 以通过 java 在本地访问 hbase。

因此，第一件事是，由于 EC2 面临的外部/内部 IP 特性，默认的 hbase 配置将不起作用。所以你不能使用 HConfiguration （因为它默认为本地主机仲裁）您需要做的就是使用亚马逊为您设置的配置（位于 /home/hadoop/hbase/conf/hbase-site.xml ），然后手动将其添加到空白配置对象中。

连接代码如下所示：

Configuration conf = new Configuration();
conf.addResource("/home/hadoop/hbase/conf/hbase-site.xml");
HBaseAdmin.checkHBaseAvailable(conf);

其次，您必须使用正确的 hbase jar 打包到您的自定义 jar 中。原因是因为 hbase 94.x 默认是为 hadoop1 编译的，所以你必须获取名为 hbase-0.94.6-cdh4.3.0.jar 的 cloudera hbase jar（你可以在网上找到它），它是针对 hadoop2 编译的。如果您不执行此部分，您将收到许多令人讨厌的、无法通过谷歌搜索的错误，包括 org.apache.hadoop.net.NetUtils 异常。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

在 Amazon EMR 上使用 java 中的 hbase 时遇到问题的相关文章

AWS RDS MySql - 如何在设置“公开可用”后允许访问

刚刚使用默认设置和用户密码创建了新的 AWS RDS MySql 实例我也将其设置为publicly available并在此过程中创建新的 VPC 目前无法从我的笔记本电脑连接到此 RDS mysql h endpoint u myu
AWS DynamoDB 写后读一致性 - 理论上它是如何工作的？

大多数nosql解决方案仅使用最终一致性并且考虑到DynamoDB将数据复制到三个数据中心如何保持写后读一致性解决此类问题的通用方法是什么我认为这很有趣因为即使在 MySQL 复制中数据也是异步复制的我将详细告诉您 Dynam
在 Elastic Beanstalk 中禁用自动安全组命名

创建新环境时 Beanstalk 往往会使用随机且非常大的字符串例如 awseb e nhmvcuvtjh stack AWSEBSecurityGroup 1R8CUK434DLPG 来污染我们的安全组命名约定这些字符串之后无法更改
如何创建 HIVE 表来读取分号分隔值

我想创建一个 HIVE 表该表将以分号分隔的值读取但我的代码不断给出错误有没有人有什么建议 CREATE TABLE test details Time STRING Vital STRING sID STRING PARTITION
我可以在没有 Hadoop 的情况下使用 Spark 作为开发环境吗？

我对大数据和相关领域的概念非常陌生如果我犯了一些错误或拼写错误我很抱歉我想了解阿帕奇火花 http spark apache org 并使用它仅在我的电脑中在开发测试环境中由于Hadoop包含HDFS Hadoop分布式文件系统
从 android 简单上传到 S3

我在网上搜索了从 android 上传简单文件到 s3 的方法但找不到任何有效的方法我认为这是因为缺乏具体步骤 1 https mobile awsblog com post Tx1V588RKX5XPQB TransferManage
为什么我会收到 ElasticBeanstalk::ExternalInitationError？

我的应用程序基于 RubyOnRails 构建并使用乘客部署为弹性 beanstalk 应用程序我尝试向 nginx 服务器添加标头并重新启动它这是我的配置文件是 aws elastic beanstalk 中 ebextensio
如何向 boto 中的联合用户授予 s3 存储桶的权限？

尝试从文档中找出答案但无法创建可以访问 s3 存储桶的联合用户首先是进口 gt gt gt from boto s3 connection import S3Connection gt gt gt from boto sts impor
更改 Spark Streaming 中的输出文件名

我正在运行一个 Spark 作业就逻辑而言它的性能非常好但是当我使用 saveAsTextFile 将文件保存在 s3 存储桶中时输出文件的名称格式为 part 00000 part 00001 等有没有办法更改输出文件名谢谢
如何在AWS中从快照创建Windows实例

我的公司想要在 Amazon Web Service 中拍摄窗口的每日快照我们可以毫无问题地拍摄快照但是当我尝试从快照创建实例时它总是创建一个 Linux ami 所以当服务器启动时它总是无法通过健康检查是否可以从快照创建 Win
Elastic Beanstalk 中的 enum34 问题

我正在尝试在 Elastic Beanstalk 中设置 django 环境当我尝试通过requirements txt 文件安装时我遇到了python3 6 问题 File opt python run venv bin pip li
无法对 Elastic Beanstalk AWS 上运行 ASP.NET 的网站强制使用 HTTPS（使用经典负载均衡器）

这样我终于能够成功创建一个https网站了它只是运行模板 ASP NET Web 项目我有一个证书并且该证书已添加到 AWS 中的 ELB 弹性负载均衡器经典中我的环境可以浏览到https www mvc cloudy skie
IOPS 与吞吐量。选择 AWS EBS 时使用哪一种

在选择合适的 EBS 卷类型时我需要决定IOPS 或吞吐量是否是更好的性能衡量标准 https docs aws amazon com en us AWSEC2 latest UserGuide EBSVolumeTypes html问题
在 Windows 7 64 位中删除 Spark 临时目录时出现异常

我正在尝试在 Windows 7 64 位中运行 Spark 作业的单元测试我有 HADOOP HOME D winutils winutils path D winutils bin winutils exe 我运行了以下命令 winu
2n + 1 法定人数是什么意思？

我在描述 HBase 的 Zookeeper 配置时遇到过这个问题但我对这个术语并不熟悉 N 与我的 HBase 集群中的节点数量有关系吗或者我应该在 Zookeeper 集群中使用的节点数量 2f 1是指你所需要的可靠性可用性水平
将 EC2 实例注册到 ECS 集群，无需公网 IP

我很难将在我的 VPC 和私有子网上没有附加互联网网关创建的实例添加到 ECS 集群目前我设法做到这一点的唯一方法是添加公共 IP 并配置 NAT 实例网关如何使用具有私有子网的 ECS 集群我想我已经在 AWS 文档中找到了
名称节点处于安全模式

我提到了这些问题名称节点处于安全模式无法离开 https stackoverflow com questions 15803266 name node is in safe mode not able to leave and SafeM
AWS CLI 从 AWS CLI 获取私有存储桶的下载 S3 URL

我可以将文件上传到private使用以下命令成功S3存储桶 aws s3 cp myfile txt s3 myfolder myfile txt region us east 1 output json 我想发出 AWS CLI 命令来返
Spark 和 Python 使用自定义文件格式/生成器作为 RDD 的输入

我想问一下 Spark 中输入的可能性我可以看到从http spark apache org docs latest programming guide html http spark apache org docs latest pro
AWS Lambda 不读取环境变量

我正在编写一个 python 脚本来查询 Qualys API 中的漏洞元数据我在 AWS 中将其作为 lambda 函数执行我已经在控制台中设置了环境变量但是当我执行函数时出现以下错误 module initialization

随机推荐

查找PID所属的tmux会话

我正在使用 htop 所以看看哪些进程占用了大量内存以便我可以杀死它们我有很多 tmux 会话和很多类似的流程如何检查 PID 位于哪个 tmux 窗格中以便确定我正在杀死我想杀死的东西鉴于PID下面一行是目标 pid 号 tmu
SQL Server - 删除语句增加日志大小

我有一个LOGGIN数据库很大 400 GB 它有数百万行我刚刚跑了一个delete该语句花费了 2 5 小时并删除了可能数百万行 delete FROM DB dbo table where Level not in info erro
R中一张图中的多个条形图

我是 R 初学者我需要创建一个像这样的图表 https i stack imgur com az56z jpg https i stack imgur com az56z jpg 我不知道如何生成整个数据集基本思想是某个外显子 ID 会
传递 oauth 令牌请求的授权标头

我使用java实现oauth来获取未经授权的请求令牌如何传递授权标头中的参数我需要通过 GET request token HTTP 1 1 Host photos example net 80 Authorization OAuth
如何在 GTX 560 及更高版本上使用 OpenGL 进行立体 3D？

我正在使用在 Windows 7 上运行的开源触觉和 3D 图形库 Chai3D 我重写了该库以使用 Nvidia nvision 执行立体 3D 我将 OpenGL 与 GLUT 一起使用并使用 glutInitDisplayMode
将数组从控制器传递到视图

I have UIView UI视图控制器在 UIViewController 中我需要能够将项目插入到 6 个整数的固定数组中然后我需要将此数组传递给视图以便它分析该数组并适当地更新屏幕我该怎么做呢我尝试过使用标准 C 数组
为什么在特征中返回“Self”可以工作，但返回“Option”需要“Sized”？

这个特征定义编译得很好 trait Works fn foo gt Self 然而这确实会导致错误 trait Errors fn foo gt Option
Google Map Android API v2 无法在 Play 商店应用程序中显示地图

我正在与Google Map Android API v2在 Android 应用程序中它可以很好地与未签名的应用程序在不同的设备上但是当我签署 apk 并将应用程序上传到 Play 商店时下载的应用程序显示白屏而不是地图您使用什
如何在打字稿中的类方法上强制执行函数类型接口？

许多方法的class我隐含地写着同样的功能类型 https www typescriptlang org docs handbook interfaces html function types 我想要做的是强制执行此函数类型以便我可以明
Javascript 闭包与 PHP 闭包，有什么区别？

JS 中的闭包和 PHP 中的闭包有什么区别它们的工作方式几乎相同吗在 PHP 中编写闭包时有什么需要注意的注意事项吗一个区别是两者如何处理存储执行匿名函数的上下文 JavaScript var a 1 var f function
覆盖 Predef 的隐式转换

我有多个返回 java lang Integer 的方法然后使用 Scala 的 Predef 隐式转换将其隐式转换为 Int 下面是它的编写方式there https github com scala scala blob v2 11
在 SQL Server 中选择条件的值[重复]

这个问题在这里已经有答案了在查询选择中我想显示字段是否满足条件的结果想象一下我有一张名为stock 该表有一列告诉我库存中每种商品的数量我想做的是这样的 SELECT stock name IF stock quantity lt
codeStyleSettings.xml 始终由 Android Studio 修改

使用Android Studio 1 3 2 不断修改 idea codeStyleSettings xml以添加以下部分
使用 Perl 分割大文本文件

我必须将一个 1 8Tb 的大文本文件分成两部分我只需要文件的后半部分该文件有 n作为记录分隔符 I tried perl ne print if gt line to start from test txt gt result txt
onclick 调用 hide-div 函数不起作用

我一直在与这段简单的代码作斗争我正在尝试使用
Javascript：将 JSON 字符串转换为 ES6 映射或其他形式以保留键的顺序

ES6 或后续版本 Javascript 或 TypeScript 中是否有原生内置方法将 JSON 字符串转换为 ES6 映射或者可以选择要实现的自制解析器目标是保留 JSON 字符串编码对象的键顺序 Note 我故意不使用解析
用于保护网站安全（使用 SSL）时，数字证书如何工作？

请帮助我了解整个过程是如何进行的据我了解 Web 浏览器包含 verisign Entrust Comodo 等证书颁发机构 CA 的根证书但是当用户访问安全页面时到底会发生什么 Web 浏览器是否向 CA 服务器发送请求来验证证书还
Scala Function.tupled 和 Function.untupled 等效于变量 arity，或者使用元组调用变量 arity 函数

昨晚我试图围绕接受和调用通用函数做一些事情即类型在调用站点上已知但可能因调用站点而异因此定义应该是跨参数通用的例如假设我有一个函数f A B C gt Z 其实这样的还有很多fs 我事先不知道所以我无法确定类型或数量A B C
PHP 在 IIS7 上未报告任何错误

我正在使用我们的 XAMPP 设置作为测试服务器来开发 PHP 应用程序一旦应用程序准备好部署我必须将其上传到客户端的服务器问题是客户端的服务器正在运行 IIS 7 每次出现 PHP 错误时它只会显示一个空白页面现在我的应用程序
在 Amazon EMR 上使用 java 中的 hbase 时遇到问题

因此我尝试使用作为 MapReduce 步骤启动的自定义 jar 来查询 Amazon ec2 上的 hbase 集群我的 jar 在地图函数内我这样调用 Hbase public void map Text key BytesWri

在 Amazon EMR 上使用 java 中的 hbase 时遇到问题

在 Amazon EMR 上使用 java 中的 hbase 时遇到问题 的相关文章

随机推荐

热门标签

在 Amazon EMR 上使用 java 中的 hbase 时遇到问题的相关文章