我有一个 json 文件列表,我想并行加载它们。
我不能使用read.json("*")
因为文件不在同一个文件夹中,并且没有我可以实现的特定模式。
我试过了sc.parallelize(fileList).select(hiveContext.read.json)
但正如预期的那样,执行程序中不存在配置单元上下文。
有任何想法吗?
看来我找到了解决方案:
val text sc.textFile("file1,file2....")
val df = sqlContext.read.json(text)
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)