发现从hdfs直接读取image文件response = Image.open(filepath)
会报错路径不存在,出现这个问题是因为PIL的Image.open(filepath)
只能打开本地路径里的文件,不能打开hdfs里的。
而且hdfs是相对路径,所以直接打开的话是找不到的。
所以要从hdfs读取,还是要用client那一套。
response = client.hdfs_client.open(filepath)
response读进来的是二进制文件,所以要再组合成ndarray
image_arr = cv2.imdecode(np.frombuffer(response.data, np.uint8), cv2.IMREAD_COLOR)
但现在是ndarry还不是Image啊,所以还要再组合一下
image = Image.fromarray(image_arr)
这样的image就是PIL支持的格式了
Done!
祝好!