我有一条简单的线:
line = "Hello, world"
我想将其转换为只有一个元素的 RDD。
我努力了
sc.parallelize(line)
但它得到:
sc.parallelize(line).collect()
['H', 'e', 'l', 'l', 'o', ',', ' ', 'w', 'o', 'r', 'l', 'd']
有任何想法吗?
尝试使用列表作为参数:
sc.parallelize(List(line)).collect()
它返回
res1: Array[String] = Array(hello,world)
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)