如何在 Azure 数据工厂 v2 中解压缩 zip 文件

2023-11-27

我正在尝试使用 Azure 数据工厂 v2 解压缩 zip 文件(内部有多个文件)。该 zip 文件位于 Azure 文件存储中。 ADF 复制任务仅复制原始 zip 文件而不解压缩它。关于如何进行这项工作有什么建议吗?

这是当前的配置:

  1. zip 文件源设置为压缩类型 = ZipDeflate 的二进制数据集。
  2. 目标文件夹也设置为二进制数据集,但压缩类型 = None。
  3. 创建了具有单个复制任务的管道,以将文件从 zip 文件移动到目标文件夹。

这可以通过在源数据集中设置“ZipDeflate”压缩类型来实现,并且在复制活动的接收器数据集中,不需要指定任何压缩配置(压缩类型为“无”)。

enter image description here

在复制活动接收器设置中,请将复制行为设置为“扁平化层次结构”以解压缩并写入各个文件。

enter image description here

当复制行为设置为“扁平化层次结构”时,通过将文件重命名为 data_SomeGUID.csv,将提取压缩源文件中的所有文件并将其作为单个文件写入接收器数据集中提到的目标文件夹。

如果您在复制活动中未指定复制行为(设置为“无”),则它将解压缩 ZipDeflate 文件并写入基于文件的接收器数据存储,文件将被提取到文件夹://。

请参阅此文档了解 Azure 数据工厂中的压缩支持:https://learn.microsoft.com/azure/data-factory/supported-file-formats-and-compression-codecs-legacy#compression-support

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

如何在 Azure 数据工厂 v2 中解压缩 zip 文件 的相关文章

随机推荐