Apache Nifi解压

2024-01-09

我是 Apache NIFI 的新手,正在尝试构建一个 POC 流程。我也需要你的指导。

我有一个名为“sample.gz”的压缩“gz”文件,其中包含一个名为“sample_file”的文件。 我需要解压缩sample.gz 文件并将“sample_file”存储在hdfs 位置。

我使用 GetFile 处理器获取sample.gz 文件,使用处于解压缩模式的 CompressContent 处理器解压缩同一文件,使用 PutHDFS 处理器将解压后的文件放入 HDFS 位置。

运行流程后,我可以发现原始的sample.gz 文件仅复制到HDFS 位置,而我需要将sample_file 复制到gz 文件内。所以减压实际上对我来说不起作用。

我希望我能解释我面临的问题。请建议我是否需要改变我的方法。


我使用了相同的处理器序列,但进行了更改PutHDFS to PutFile.

GetFile --> CompressContent(decompress) --> PutFile

在 nifi v1.3.0 中它工作正常。

唯一的说明:如果我保留参数Update Filename = false为了CompressContent那么filename解压后属性与之前一样(sample.gz).

但内容已解压。

所以,如果您对文件名有疑问,那么:

  1. 可以通过设置参数来改变Update Filename = true in CompressContent处理器。在这种情况下sample.gz将更改为sample减压期间。
  2. use UpdateAttribute处理器改变filename属性
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

Apache Nifi解压 的相关文章

  • 在存储到 mysql 数据库之前压缩文本

    我正在使用 php 和 MySQL 开发一个 Web 应用程序 在存储在 MySQL 数据库中 在数据库中存储压缩形式的文本之前 我使用 gzcompress php 函数压缩文本 我的问题是这样可以吗 存储压缩形式 或者这个方法会不会给我
  • 在 PHP 中压缩字符串的最佳方法[重复]

    这个问题在这里已经有答案了 我正在使用 gzcompress json encode arr 9 压缩数组 所以我使用 json encode 将数组转换为字符串 然后使用 gzcompress 进行压缩 但我找不到结果字符串大小的太大差异
  • 行程解压

    这里是CS学生 我想编写一个程序来解压缩根据游程编码的修改形式进行编码的字符串 我已经为其编写了代码 例如 如果字符串包含 bba10 它将解压缩为 bbaaaaaaaaaa 如何让程序识别字符串的一部分 10 是整数 谢谢阅读 一个简单的
  • nifi 中的 JSON 数组到多个 JSON 对象

    我想在 Nifi 中实现以下请求响应场景 我的目标是在更多不同的处理器中使用每个值作为数组 对象键 1 对象键 2 因此 如果我可以将其转换为多个 JSON 那么使用拆分 JSON 我可以稍后使用多个值 请为此提出各种解决方案 输入 JSO
  • 如何从 Compass 输出压缩的 CSS?

    如何配置指南针以输出较小或压缩的 CSS 文件 我试过compass s compressed但这没有用 In your config rb file output style compressed More at http compass
  • 解压大zst文件

    我有一个 16GB 的压缩 zst 文件 我该如何在windows上解压它 我没有内存来处理解压版本 因此需要将其直接写入文件 冒着听起来显而易见的风险 您需要一个支持 zstandard 的 Windows 解压缩器 At the zst
  • YSlow 为使用 mod_deflate 压缩的文件提供 F 级

    我在用着mod deflate on 阿帕奇2 2压缩级别设置为 9 我根据以下建议对网站的每个可能的方面进行了微调Y慢 v2 并在所有类别上均取得了总体 A 级 总分 91 除了 减少 HTTP 请求 Grade C 我还在进一步努力 图
  • 由于图像,应用程序尺寸较大。如何压缩 .PNG 图像?

    我正在开发一个应用程序 它有很多图像需要处理 因此我的应用程序的大小变得非常大 我想压缩或类似的东西来减小应用程序的大小 任何想法 png 放置在res drawable are 自动优化 http developer android co
  • Apache NIFI Jon 不会自动终止

    我是 Apache NIFI 工具的新手 我正在尝试从 mongo db 导入数据并将该数据放入 HDFS 中 我创建了 2 个处理器 第一个用于 MongoDB 第二个用于 HDFS 并且我正确配置了它们 该作业正在成功运行并将数据存储到
  • Apache NiFi ExecuteScript:通过映射文件替换 Json 值的 Groovy 脚本

    我正在 Groovy 脚本上使用 Apache NiFi 0 5 1 以将传入的 Json 值替换为映射文件中包含的值 映射文件如下所示 它是一个简单的 txt Header1 Header2 Header3 A some text A2
  • Apache NiFi 替换文本处理器以使用控制字符作为分隔符

    在将固定宽度文件转换为用普通字符 如 分隔时使用替换文本处理器 作为分隔符正在起作用 然而 考虑 u0001 或 A 或 A 并不能按预期工作 使用您可以使用的特殊字符literal unescapeXmlnifi表达函数 literal
  • Internet Explorer 8 + 放气

    我有一个非常奇怪的问题 我真的希望有人能给出答案 因为我不知道还能去哪里问 我正在用 C 编写一个 cgi 应用程序 它由 Apache 执行并输出 HTML 代码 我自己在 C 应用程序中压缩 HTML 输出 因为我的 Web 主机由于某
  • 使用 Android 创建 ZIP 文件

    如何从 XML 文件创建 ZIP 文件 我想以 XML 格式备份所有收件箱消息 并压缩 XML 文件并将其存储在SD card http en wikipedia org wiki Secure Digital 下面的代码解决了我的问题 p
  • C++ 压缩字节数组

    大家好 我加载一组图像并生成体积数据 我将此体积数据保存在 无符号字符 体积 array 现在我想将此数组保存在文件中并检索 但在保存之前我想压缩字节数组 因为卷数据很大 这方面有什么建议吗 提前致谢 volume在你的例子中不是一个数组
  • iOS 视频压缩 Swift iOS 8 损坏的视频文件

    我正在尝试压缩用户相机从 UIImagePickerController 拍摄的视频 不是现有视频 而是动态视频 以上传到我的服务器 并花费少量时间来完成此操作 因此较小的尺寸是理想的选择 而不是 30 较新质量的相机为 45 mb 这是在
  • 重新打包存储库对于大型二进制文件有用吗?

    我正在尝试将大量历史记录从 Perforce 转换为 Git 并且一个文件夹 现在是 git 分支 包含大量大型二进制文件 我的问题是运行时内存不足git gc aggressive 我的主要问题是重新打包存储库是否可能对大型二进制文件产生
  • 归档文件系统或格式

    我正在寻找一种文件类型来存储已退役系统的档案 目前 我们主要使用 tar gz 但从 200GB tar gz 存档中查找并提取几个文件是很麻烦的 因为 tar gz 不支持任何类型的随机访问读取规定 在你明白之前 使用 FUSE 安装 t
  • 十六进制字符串的运行长度编码(包括换行符)

    我正在使用以下方法实现游程长度编码GZipStreamC winforms 应用程序中的类 数据以一系列由换行符分隔的字符串形式提供 如下所示 FFFFFFFF FFFFFEFF FDFFFFFF 00FFFFFF 在压缩之前 我将字符串转
  • 如何在 Web 服务器上设置 gzip 压缩?

    我有一个嵌入式网络服务器 总共有 2 兆空间 通常 您使用 gzip 文件对客户端有利 但这会节省我们在服务器上的空间 我读到你可以只 gzip js 文件并将其保存在服务器上 我在 IIS 上测试过 但没有任何运气 为了使这项工作成功 我
  • .net 中的 deflate、gzip 和 zlib 的一个库

    首先 我们来定义一些容易混淆的术语 deflate compression algorithm zlib header deflate trailer gzip header deflate trailer 我正在寻找一个基本上可以让我执行

随机推荐

  • 我可以使用 Chrome DevTools 在客户端查看会话状态值吗?

    我只是好奇我们是否可以使用 Chrome DevTools 获取 查看网站的会话变量值 如果有人知道 请分享 不可以 您无法在客户端查看会话状态变量 Session状态存储在服务器端 客户端浏览器只知道SessionID存储在 cookie
  • 使用 JavaScript 更改 SVG 对象的高度和宽度

    我想在单击按钮时更改 svg 对象的高度和宽度 我尝试过但它不起作用 function modify document getElementById circle1 style height 10px document getElement
  • 展开宏中的宏

    给定以下宏 以函数调用方式访问编译器属性 例如spec section mysection void foo void define spec H spec H define spec section S attribute section
  • Java 中判断一个数是否为 Double

    我是 Java 新手 我试图弄清楚一个数字是否是 Double 如下所示 if typeof items elementAt 1 Double sum add i items elementAt 1 如果有人能告诉我如何重新排列语法以使其正
  • 使用正则表达式将字符串拆分为单词数组

    我正在尝试将字符串拆分为单词数组 但是我想在每个单词后面保留空格 这就是我正在尝试的 var re a z s gi var test test one two three four var results test match re 我期
  • 获取 Sitecore 中单个页面的个人资料关键分数

    我有关于 Sitecore Analytics 和用户个人资料密钥的问题 我需要能够获取单个页面的配置文件密钥的分数 例如 如果我有一个名为 traveler 的个人资料键 该键在给定页面上的值为 1 10 那么我需要能够获取内容作者分配的
  • messageBox.Show() 执行什么操作才能停止 UI 线程的执行?

    在 WPF 应用程序中 我将消息输出到文本框 并在这些消息之间调用一个设置仪器的函数 但是 这些消息都会同时出现 在函数调用结束时 我真的不知道如何清楚地解释我的问题 我会尽力 我有一个 WPF 应用程序 它使用串行端口从仪器获取数据 该应
  • 如何从祖父母标签继承CSS? [复制]

    这个问题在这里已经有答案了 我有一个两级嵌套的 div 我想应用包含类 c 的 div 其宽度与类 a 的 div 相同 如果它是父母 那么我想继承会完成这项工作 但这种情况下该怎么办呢 HTML 代码 div class a div cl
  • 如何将 Cassandra (>2.0) JVM 堆大小设置为 8GB?

    如何将 Cassandra gt 2 0 JVM 堆大小设置为 8GB 当我输入时free m它给了我以下内容 如何将 Cassandra JVM 堆大小设置为 8GB total used free shared buffers cach
  • 重命名 Pandas DataFrame 索引

    我有一个没有标题 带有日期时间索引的 csv 文件 我想重命名索引和列名 但使用 df rename 仅重命名列名 漏洞 我的版本是0 12 0 In 2 df pd read csv r D Data DataTimeSeries csv
  • 设置储值的 Svelte 用户注册问题

    helo 我正在尝试注册用户 成功后将 setContext 设置为新注册的用户 然后导航到主页 服务器正确响应并注册用户 但是当调用 setContext 时 我收到以下错误 index mjs 552 Uncaught 在承诺中 错误
  • EF 可以使用影子属性创建多列索引吗?

    我正在尝试使用影子属性创建多列唯一索引 我知道我只需添加一个属性就可以解决这个问题 但我想看看是否可以通过某种方式保持我的模型干净 要创建多列索引 您可以在 Fluent API 中使用以下选项 modelBuilder Entity
  • iOS/Swift:tableView cellForRowAtIndexPath 崩溃

    我在第 389 行遇到 EXC BREAKPOINT 崩溃 386 func tableView tableView UITableView cellForRowAtIndexPath indexPath NSIndexPath gt UI
  • Angular 4 Reactive Forms FormControl 错误为 null

    如果我通过 Tab 键浏览文本输入而不输入任何内容 则会显示错误消息 div 指示所需的验证器已正确触发 但是 如果我在其中一个字段中输入任何内容 控制台会立即抛出此错误 Cannot read property required of n
  • Tkinter Entry 小部件之后的事件回调

    从这里的第一个答案 堆栈溢出 6548837 https stackoverflow com questions 6548837 how do i get an event callback when a tkinter entry wid
  • 为什么按钮点击触发与setTimeout()触发不同?

    考虑以下几乎相同的两个片段 区别在于 第一个使用setTimeout 触发事件 第二个在单击按钮时触发事件 如果您检查控制台 您将看到代码段 1 中的最后两行是 App rendering 1 folder s Observed js 片段
  • 为什么 vector::clear 不从向量中删除元素?

    当我使用clear on a std vector 它应该摧毁里面的所有元素vector 但事实并非如此 示例代码 vector
  • 在公式中显示字符串,而不是在 lm fit 中显示为变量

    我无法解决当lm sformula 执行后 它不显示分配给的字符串sformula 我有一种感觉 这是 R 处理函数参数的通用方式 而不是特定于线性回归 下面通过例子来说明这个问题 示例 1 有不受欢迎的 output lm formula
  • 如何更改 Atom 键绑定

    我正在寻找更改 Atom 文本编辑器的键绑定 我熟悉Android Studio Atom 是否允许我们自定义按键绑定 您必须转到 编辑 gt 首选项 gt 按键绑定 在此选项卡中 您可以看到实际的绑定 如果您想更改它 您可以访问键盘映射文
  • Apache Nifi解压

    我是 Apache NIFI 的新手 正在尝试构建一个 POC 流程 我也需要你的指导 我有一个名为 sample gz 的压缩 gz 文件 其中包含一个名为 sample file 的文件 我需要解压缩sample gz 文件并将 sam