Pentaho Spoon - 根据字段内容输出到多个文件

2023-12-08

我一直在尝试根据特定字段的值将 pentaho 转换的结果拆分为多个文件,但没有任何运气。

例如。包含以下内容的结果集:

姓氏、名字、国家/地区

奥巴马,巴拉克,美国

卡梅伦,大卫,英国

布莱尔,托尼,英国

将导致创建 2 个输出文件:

USA.txt - 包含奥巴马的详细信息和 UK.txt - 包含其他 2 行

任何指示将不胜感激。


您可以根据国家/地区字段构造一个字段作为输出文件名。在“文本文件输出”步骤中将新构造的字段作为输出文件名发送。

请参阅下面的流程截图:

enter image description here

您还可以从这里下载解决方案文件http://pentaho.phi-integration.com/kettle/kettle-files.

希望这可以帮助...

Dino

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

Pentaho Spoon - 根据字段内容输出到多个文件 的相关文章

  • 优化 JavaFX 中的内存泄漏

    我写了一段代码 让字母在我写的时候出现并飞翔 问题是它消耗大量内存 我已经对其进行了一些优化 分享path对象并在侦听器中更新其参数 每次打印新字母时调用 gc 但它仍然使用大量内存 那么关于如何减少其内存利用率有什么想法吗 提前致谢 pa

随机推荐

  • Web浏览器控制文件下载对话框绕过

    实际上我想使用 Webbrowser Control 从网站下载文件 但由于文件下载对话框 我无法自动执行下载过程 对于绕过它 我想使用 Web 客户端 并且需要将所有会话和 Cookie 从 Web 浏览器控件传输到 Web 客户端 或者
  • 获取“队列对象只能通过继承在进程之间共享”,但我没有使用队列

    我正在尝试使用 ProcessPoolExecutor 但收到错误 队列对象只能通过继承在进程之间共享 但我没有使用队列 至少没有明确使用 我找不到任何东西可以解释我做错了什么 这是一些演示该问题的代码 不是我的实际代码 from conc
  • 无法使用 Maven 执行 Junit5 测试 [重复]

    这个问题在这里已经有答案了 Maven执行 mvn clean test 我正在尝试使用junit5对于我的一个 Maven 项目 但无法在test阶段使用
  • 不规则间隔的热图

    我想根据下面的矩阵和边界创建一个热图 然后绘制数据 x1 x2 以查看属于各个类别的点 我能做的最好的事情就是使用seaborn 但是由于两个轴上的类间隔不均匀 因此很难读取两个轴上对应于点的值 有没有办法 使用seaborn或任何其他库
  • 从两个或多个现有表创建新表 (MySQL)

    问题 是否可以在 mySQL 中从两个或多个现有表创建一个表 Details 我可以创建一个像这样的表吗 CREATE TABLE IF NOT EXISTS USERNAME AGE INT NOT NULL CREATE TABLE I
  • 在 C# 中编译邮件的 HTML 正文

    我使用以下代码供用户向我的电子邮件发送报价 using System Net Mail MailMessage mail new MailMessage mail From new MailAddress Email Text mail T
  • 在无头模式下使用 Firefox 68.9.0esr 以及 GeckoDriver Selenium 和 Python 时出现 504 网关超时错误

    我用硒制作了一个容器图像 我用了一个ubi image来自 RedHat 作为基础镜像 我安装了以下版本的 geckodriver 和 Mozilla Firefox 壁虎驱动程序 0 26 0 e9783a644016 2019 10 1
  • 在 Windows 8.1 中安装 virtualenvwrapper-powershell,导入模块失败

    我正在尝试遵循指南here 我被困在Import Module virtualenvwrapper PowerShell 不断给我错误 import module 指定的模块 virtualenvwrapper 不是 已加载 因为在任何模块
  • 未找到 AWS ec2 winreg

    我正在尝试从亚马逊 EC2 大型实例运行 python 应用程序 然而 它在 scipy 中抱怨 因为它找不到名为 winreg 的东西 我不知道如何重新配置 它 所以它不再是问题 python2 app py Running on htt
  • Chrome 扩展如何在页面底部添加浮动栏?

    我正在创建一个需要注入浮动元素的 chrome 扩展 即position fixed 在页面底部 我的要求是 我需要从内容脚本访问其中的元素 这是因为我将事件附加到按钮 以便用户可以从浮动栏在当前选项卡上执行操作 我希望它的样式保持独立于当
  • 显示斯坦福 NER 置信度分数

    我使用斯坦福 NER CRFClassifier 从新闻文章中提取命名实体 为了实现主动学习 我想知道每个标记实体的类的置信度分数是多少 显示示例 地点 0 20 人员 0 10 组织 0 60 其他 0 10 这是我从文本中提取命名实体的
  • 启动 ASP.NET 表单身份验证

    我开始学习 ASP NET 表单身份验证 并且正在寻找一篇好文章来帮助我入门 我之前听说 ASP NET 表单身份验证使用大量数据库表 前面带有aspnet 但是我发现的任何例子都没有显示这一点 例如我认为有一个aspnet users t
  • 创建数据框时如何解决 scala.MatchError

    我有一个具有复杂结构行的文本文件 我正在使用客户转换器 它将给定的字符串 行 转换为 Pojo 类 countryInfo 转换后 我正在构建 DF POJO 类有一个字段 它是自定义类型列表 GlobalizedPlayTimeWindo
  • 调用unique_ptr子类继承的模板构造函数

    这不是关于模板构造函数甚至调用继承的模板构造函数的问题的重复 它具体是关于在 unique ptr 模板的类实例 的子类中调用继承的构造函数 问题 为了使代码更容易理解 我使用using在这个例子中 using B std unique p
  • 使用XSLT输出多个文件

    我正在尝试获取一个我发现的使用 XSLT 2 0 输出多个文件的示例 将 Saxon B 9 7 0 1 与 Java 1 6 一起使用时 出现以下错误 C Documents and Settings Administrator Desk
  • 以字节数组为键的ReduceByKey

    我想使用 RDD 对Tuple2
  • Tensorflow 将数据从 tfrecords 正确读取到小批量中

    我正在尝试将数据从 csv 转换为 tfrecords 然后以小批量读取它并执行一个简单的 MLP 但我遇到了一些我无法弄清楚的错误 运行时错误 尝试使用关闭的会话 其次是 TypeError 提要的值不能是 tf Tensor 对象 可接
  • Jenkins 使用 groovy 为作业添加权限

    我需要向特定用户添加一些权限 读取 构建 工作空间 取消等 到很多作业 我想知道是否有一种方法可以使用 groovy 脚本而不是手动执行此操作 我尝试了上述解决方案 他们nearly工作了 我的所有尝试都会导致当前内存中的权限反映新设置 但
  • 如何将 ORMLite 与抽象类一起使用?

    我有一个基类Peripheral 课程Sensor and Master是的扩展Peripheral 我需要 ORMlite 来实例化之前保存的 Peripheral 对象 显然任何实例化的尝试Peripheral反思将导致ClassIns
  • Pentaho Spoon - 根据字段内容输出到多个文件

    我一直在尝试根据特定字段的值将 pentaho 转换的结果拆分为多个文件 但没有任何运气 例如 包含以下内容的结果集 姓氏 名字 国家 地区 奥巴马 巴拉克 美国 卡梅伦 大卫 英国 布莱尔 托尼 英国 将导致创建 2 个输出文件 USA