我是 Apache NIFI 的新手,正在尝试构建一个 POC 流程。我也需要你的指导。
我有一个名为“sample.gz”的压缩“gz”文件,其中包含一个名为“sample_file”的文件。
我需要解压缩sample.gz 文件并将“sample_file”存储在hdfs 位置。
我使用 GetFile 处理器获取sample.gz 文件,使用处于解压缩模式的 CompressContent 处理器解压缩同一文件,使用 PutHDFS 处理器将解压后的文件放入 HDFS 位置。
运行流程后,我可以发现原始的sample.gz 文件仅复制到HDFS 位置,而我需要将sample_file 复制到gz 文件内。所以减压实际上对我来说不起作用。
我希望我能解释我面临的问题。请建议我是否需要改变我的方法。
我使用了相同的处理器序列,但进行了更改PutHDFS
to PutFile
.
GetFile --> CompressContent(decompress) --> PutFile
在 nifi v1.3.0 中它工作正常。
唯一的说明:如果我保留参数Update Filename = false
为了CompressContent
那么filename
解压后属性与之前一样(sample.gz
).
但内容已解压。
所以,如果您对文件名有疑问,那么:
- 可以通过设置参数来改变
Update Filename = true
in CompressContent
处理器。在这种情况下sample.gz
将更改为sample
减压期间。
- use
UpdateAttribute
处理器改变filename
属性
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)