我是新来的Spark
and pyspark
.
我使用 pyspark,之后我rdd
处理中,我试图将其保存到hdfs
使用saveAsTextfile()
功能。
但我得到一个'没有权限' 错误消息,因为 pyspark 尝试写入hdfs
使用我的本地帐户“kjlee”,该帐户在hdfs
system.
我可以通过以下方式检查 Spark 用户名SparkContext().sparkUser()
,但是我找不到如何更改spark用户名。
如何更改spark用户名?
为此有一个环境变量:HADOOP_USER_NAME
所以只需使用export HADOOP_USER_NAME=anyuser
或者在 pyspark 中你可以使用os.environ["HADOOP_USER_NAME"] = "anyuser"
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)