在 pyspark 中运行一个简单的应用程序。
f = sc.textFile("README.md")
wc = f.flatMap(lambda x: x.split(' ')).map(lambda x: (x, 1)).reduceByKey(add)
我想使用 foreach 操作查看 RDD 内容:
wc.foreach(print)
这会引发语法错误:
SyntaxError: invalid syntax
我缺少什么?
在 Spark 2.0 中(我没有使用早期版本进行测试)。简单地:
print myRDD.take(n)
Where n是行数并且myRDD is wc在你的情况下。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)