通过 SOCKS 代理使用 Hadoop?

2024-03-22

所以我们的Hadoop集群运行在一些节点上,并且只能从这些节点访问。您可以通过 SSH 连接到它们并完成您的工作。

因为这很烦人,但(可以理解)没有人会尝试配置访问控制,以便某些人可以从外部使用它,我正在尝试下一个最好的方法,即使用 SSH 在 SOCKS 代理中运行簇:

$ ssh -D localhost:10000 the.gateway cat

有传言说 SOCKS 支持(当然我没有找到任何文档),显然这涉及到core-site.xml:

<property>
  <name>fs.default.name</name>
  <value>hdfs://reachable.from.behind.proxy:1234/</value></property>
<property>
  <name>mapred.job.tracker</name>
  <value>reachable.from.behind.proxy:5678</value></property>
<property>
  <name>hadoop.rpc.socket.factory.class.default</name>
  <value>org.apache.hadoop.net.SocksSocketFactory</value></property>
<property>
  <name>hadoop.socks.server</name>
  <value>localhost:10000</value></property>

Except hadoop fs -ls /仍然失败,没有提到 SOCKS。

有小费吗?


我只是尝试运行作业,而不是管理集群。 我只需要通过 SOCKS 访问 HDFS 并提交作业(似乎在集群节点等之间使用 SSL/代理是完全独立的事情;我不希望这样,我的机器不应该成为集群的一部分,只是一个客户。)

有这方面有用的文档吗?为了说明我未能找到任何有用的东西:我通过运行 hadoop 客户端找到了配置值strace -f并检查它读取的配置文件。

是否有任何地方描述了它对哪些配置值做出反应? (我确实找到了零参考文档,只是过时的教程,我希望我遗漏了一些东西?)

有没有办法转储它实际使用的配置值?


实现此功能的原始代码已添加到https://issues.apache.org/jira/browse/HADOOP-1822 https://issues.apache.org/jira/browse/HADOOP-1822

但本文还指出,必须将套接字类更改为 SOCKS

http://rainerpeter.wordpress.com/2014/02/12/connect-to-hdfs-using-a-proxy/ http://rainerpeter.wordpress.com/2014/02/12/connect-to-hdfs-using-a-proxy/

with

<property> <name>hadoop.rpc.socket.factory.class.default</name> <value>org.apache.hadoop.net.SocksSocketFactory</value> </property>

编辑:请注意,属性位于不同的文件中:

  1. fs.default.name 和 hadoop.socks.server 和 hadoop.rpc.socket.factory.class.default 需要进入核心站点.xml
  2. mapred.job.tracker 和 mapred.job.tracker.http.address 配置需要进入mapred-site.xml(对于映射减少配置)
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

通过 SOCKS 代理使用 Hadoop? 的相关文章

随机推荐

  • Android TextView 文本不会居中

    我正在尝试进行 PIN 输入活动 但有一点不太适合我 我无法将文本置于屏幕截图顶部 TextView 的中心 它的工作方式是当用户输入 PIN 时 我将在每个 TextView 中放置一个星号以获取可见的反馈 问题是 我希望星星居中 我尝试
  • Eclipse + Ubuntu 箭头键和退格键不起作用

    我正在使用 Ubuntu 12 10 和 Eclipse Juno 这种情况经常发生 箭头键和退格键在编辑器中停止工作 解决该问题的唯一方法是重新启动计算机 重新启动 Eclipse 没有帮助 有人遇到过这个问题或者知道解决方案吗 谢谢 更
  • 生成签名 apk 任务 app:packageRelease 时出错

    错误 任务 app packageRelease 的配置出现问题 为属性 resourceFile 指定的文件 Volumes Data Android apps NammaKarnataka master app build interm
  • 使用 SessionLoginSample 时特定帐户的 OAuthException 代码 #2

    我们遇到了一个非常奇怪的情况 其中特定的 Facebook 帐户在成功登录后对 https graph facebook com me friends access token XXX 的请求失败 在我们的应用程序中发现这种情况后 我验证了
  • 根据您的最低稳定性设置,该软件包没有足够稳定的版本

    我不太明白 Composer 如何在最低稳定性设置下工作 我有两个包裹 比方说 PackageA and PackageB The composer json文件的PackageA看起来像这样 name vendor packagea mi
  • INNER JOIN 能否提供比 EXISTS 更好的性能

    我一直在研究如何改进一系列过程的性能 最近一位同事提到 他在使用 INNER JOIN 代替 EXISTS 时取得了显着的性能改进 作为调查原因的一部分 我想我会在这里问这个问题 So INNER JOIN 能否提供比 EXISTS 更好的
  • python urllib2文件发送问题

    我想通过 python 将文件发布到服务器 为此我需要将此文件命名为 xmlfile 以便服务器识别输入 import urllib2 url http somedomain to send open test xml read data
  • 在 Backbone 渲染方法中调用 jQuery 插件

    我在 Backbone 中有一个渲染方法 基本上是这样的 render function tmpl this template attrs appendTo this el return this 这是从路由器操作中调用的 action f
  • Azure-runbook 中的 New-PSSession (ARM)

    对于经典门户 ASM 中的 Azure VM 我能够获得 所需的凭据Get AutomationPSCredential and the ConnectionURI with Connect AzureVM ps1 https galler
  • vh 单元行为不一致

    我有一个伪元素 悬停时出现 height 0 4vh 高度不会改变 只有宽度会改变 然而 由于某种原因 在某些条件下 不同伪元素的高度不同 这里的两条深色线都有height 0 4vh 我用这个小提琴来演示 但意识到这种奇怪的情况是否发生取
  • 无法获取已安装模块的绝对路径

    我遇到了一个问题 我认为这与我的 package json 或 cordova 平台的版本有关 当我尝试运行ionic state restore它返回以下输出 Attempting to restore your Ionic applic
  • HTML5代码元素-语言类

    HTML5 code 元素有一个可选的 class language 属性 https html spec whatwg org multipage semantics html the code element定义代码片段的语言 规范中的
  • 像 Uber Android 一样在地图上旋转标记和移动动画

    我正在从事一个类似于 UBER Lyft 或 OLA 的项目 家里的地图上有可用的移动汽车 我正在寻找某种图书馆 它可以让汽车像 UBER 一样顺利移动和转弯 现在 我可以使用下面的代码将汽车从一个经纬度平稳地移动到另一个纬度经度 但棘手的
  • 在 Windows CE 5 上安装我的程序

    我正在完成 Windows CE 5 的应用程序 我想知道在 CE 5 设备上安装该应用程序的最简单方法是什么 在 VS8 中点击 发布 会生成一个安装程序 但该安装程序与 CE 5 不兼容 在 Windows CE 5 上安装应用程序的简
  • 在 QThread 中启动 QTimer

    我正在尝试在特定线程中启动 QTimer 但是 计时器似乎没有执行 也没有打印任何内容 与定时器 槽或线程有关吗 main cpp include MyThread h include
  • 在设定的字符数和长度下,可以有多少个唯一的字符串?

    如果我有两个角色 a b 和长度为三 aaa aab 我如何计算我可以用它组成多少个唯一的字符串 以及数学方法是什么 它是否正确 val 1 amountCharacters 2 length 3 for i 1 i lt length i
  • bash:〜/ .bash_profile:没有这样的文件或目录[关闭]

    Closed 这个问题是无法重现或由拼写错误引起 help closed questions 目前不接受答案 我不断收到此错误 bash bash profile No such file or directory 这是我的 bash pr
  • 如何忽略 Snakemake 的“自上次执行以来参数已更改”?

    由于 conda 环境不活跃 工作流程的一些非常晚的作业崩溃了 现在 当我尝试使用重新运行时snakemake deploy all ignore incomplete所有作业都会从头开始重新运行 原因如下 Reason Params ha
  • 如何在c++中显示实时时间

    有人可以告诉我如何在 C 中显示实时时间吗 我的意思是 当程序运行时 您可以看到秒和 或分钟倒计时 就像挂在墙上的真实时钟一样 这就是我所拥有的 int main time t rawtime creates and object of t
  • 通过 SOCKS 代理使用 Hadoop?

    所以我们的Hadoop集群运行在一些节点上 并且只能从这些节点访问 您可以通过 SSH 连接到它们并完成您的工作 因为这很烦人 但 可以理解 没有人会尝试配置访问控制 以便某些人可以从外部使用它 我正在尝试下一个最好的方法 即使用 SSH