我最近接触了一些 ETL 工具,例如 Talend 和 Apatar,我想知道这些工具通俗地说的用途/主要目标到底是什么。谁主要使用它们,如果你使用它们,它们(根据我的理解)比仅仅编写某种类型的脚本更好。
ETL 代表“提取/转换/加载”。这些工具从一个来源获取数据并将其转移到另一个来源。您可以以独特的方式将模式从源映射到目标,在数据移动到目标之前转换和清理数据,并以有效的方式加载目标。您可以将 ETL 作业安排为批处理。
这些数据源可以是关系数据库、电子表格、XML 文件等。
谁“使用”它们?取决于你所说的“用途”是什么意思。它们只是代码,大多数时候,它们被安排为常规操作的一部分。没有最终用户功能。它们完全是供程序员创建和操作的。
相对于脚本的优势?没有任何。它们是用特定于域的语言 (DSL) 编写的脚本,完全专注于从源“提取”、“转换”和“加载”到目标。脚本中最有趣的部分是每个阶段的逐字段映射。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)