我应该使用什么端口来访问 Google Dataproc 上的 Spark UI?
我尝试了端口 4040 和 7077 以及我发现使用的许多其他端口netstat -pln
防火墙配置正确。
Dataproc 在 YARN 之上运行 Spark,因此您不会找到典型的“Spark 独立”端口;相反,当运行 Spark 作业时,您可以访问端口8088
这将显示 YARN ResourceManager 主页。任何正在运行的 Spark 作业都可以通过Application Master
该页面上的链接。 Spark 应用程序主页面看起来与您通常在默认 Spark 设置的端口 8080 上找到的熟悉的 Spark 独立登录页面相同。
由于工作人员通过内部网络签入,YARN 的链接将使用集群内部主机名(主机名应包含您的 Dataproc 集群名称作为前缀),但这意味着如果您从外部网络访问,链接可能无法工作首先;如果您使用基于防火墙的方法,则必须将主机名替换为外部 IP 地址。
更简单的体验是使用 SOCKS 代理方法,如下所述:https://cloud.google.com/dataproc/cluster-web-interfaces https://cloud.google.com/dataproc/cluster-web-interfaces
在这种情况下,只需使用gcloud compute ssh
运行一个轻量级本地袜子代理,然后打开一个指向该代理的浏览器,您可以像平常一样单击所有 YARN 链接。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)