如何强制增量 Foundry Transforms 作业以非增量方式构建而不影响语义版本？

2024-04-21

如何强制特定数据集以非增量方式构建而不更改转换存储库中的语义版本？

有关我们具体用例的详细信息：

我们有大约 50 个数据集，由单个增量 Python 通过手动注册和 for 循环定义。此转换的输入可以是 100 到 10000 个小 gzip 文件，因此当较大的数据集运行时，它最终会将所有这些文件划分为少数大小合适的 parquet 文件，这对于我们的下游作业来说是完美的。但是，在该作业增量运行数月后（文件每小时到达），输出中还会出现大量小 parquet 文件。我们希望能够强制构建此单个数据集的快照，而不必更改转换的语义版本，否则会触发所有 50 个数据集的快照构建。这可能吗？

我了解一个潜在的解决方法可能是在转换本身中定义“最大输出文件”，读取现有输出中的当前文件数，并在当前超过最大值时强制创建快照。然而，由于该管道对时间敏感（需要在一个小时内运行），这会给管道带来一定程度的不可预测性，因为快照构建需要更长的时间。我们希望能够将这些完整快照构建设置为每月周末运行一次。

在输出数据集上提交一个空的附加事务。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

palantirfoundry

foundrycoderepositories

如何强制增量 Foundry Transforms 作业以非增量方式构建而不影响语义版本？的相关文章

R 中的循环数组

我遇到以下问题我有一个尺寸为 dim x 46 13 30 的大数组 x 我正在尝试计算一个新的矩阵 M 30 598 它基本上包含第一列中每个切片的第一个元素第二列中的第二个元素依此类推最终我想与包含每个网格单元的所有元素的
使用 cURL 检查 FTPS 站点上是否存在文件

我正在使用 cURL 应用程序下载多个 csv 文件我想找到一种方法来在开始下载之前检查文件是否存在于 ftps 站点上如果它不存在我想找到一种方法让 cURL 定期再次检查我试图坚持使用 cURL 命令因为我真的不擅长 Net
如何在 jquery 中创建多维数组/对象并通过 AJAX post 传递

我正在创建一个订单表单其中包含用户可以购买的订单项目表输入使用数据属性来存储商品名称和每件价格如下所示
Android studio 3.2.1 ArtifactResolveException：无法解析配置“：classpath”的所有工件

在我的项目中将 Android Studio 更新到 3 2 1 和 gradle 版本后我收到以下构建错误我已经检查了很多与这个问题相关的问题但没有运气项目依赖Build gradle buildscript repositori
为什么 JavaScript 严格模式下不允许删除？

我对 javascript 还很陌生我注意到显然在使用严格模式下操作时您无法删除对象我不太喜欢删除某些东西因为从理论上讲作用域无论如何都应该处理这个问题但我想知道删除此功能背后的动机是什么 The delete在严格模式下
jQuery 插件：验证 - 标签被隐藏

我使用以下代码jQuery 插件验证 http bassistance de jquery plugins jquery plugin validation
如何在不使用内置函数的情况下将整数转换为字符串？

我想问如何在不使用内置函数的情况下将整数转换为字符串这是原来的问题写一个函数string ls 返回列表 ls 的字符串表示形式注意不要使用内置的str 此任务的方法我们正在尝试模仿它的行为 s string a b c a b

随机推荐

如何在后台保持 iphone ios xmpp 连接处于活动状态？

iPhone 的 XMPPFramework 功能强大我已经启动并运行了它但是如何在后台保持连接 10 分钟以上我希望获得更多有关如何实现此目标的文档操作方法因此用例非常简单且常见 Joe 在线并且正在使用 iPhone 聊天应
Gulp Jscs - 类型错误：无法将未定义或 null 转换为对象

我想在我的项目中使用 gulp jscs 所以我按照文档 https github com jscs dev gulp jscs npm install save dev gulp jscs 但是当我尝试运行 gulp 文件时出现以下错误
格式化 SQL IN 子句的字符串

我需要格式化一个字符串并将其作为 SQL IN 子句的参数传递例如 Select from Table Where X In param1 作为参数传入的文字字符串如下所示 Item1 Item2 Item3 这似乎不起作用有什么建议么
如何按顺序运行 Gulp 任务

在这样的片段中 gulp task coffee gt gulp src src server coffee pipe coffee bare true on error gutil log pipe gulp dest bin gulp
在javascript中计算日期差异

我写下面的代码 var MS PER Day 24 60 60 1000 var utc1 Date UTC 1900 1 1 var utc2 Date UTC 2014 11 16 var x Math ceil utc2 utc1 M
为什么JS假设没有时间的字符串日期如果填充0则为UTC，如果不填充则为本地？ [复制]

这个问题在这里已经有答案了这很奇怪但我确信有一个完美的解释我和我的团队最近在使用时发现java 本地日期并以默认的字符串格式将其发送回前端年月日 Javascript会自动创建一个日期假设字符串是UTC 因此生活在ET区它会
访问窗口资源内的命名元素

Problem 我正在尝试访问一个名为Runa 内的元素FlowDocument这是在窗口资源中定义的为了澄清我的意思请考虑以下代码
为什么 JValue 保存在“动态”变量中，可分配给字符串变量，但在调用采用字符串参数的方法时不可用？

这确实来自这个问题循环遍历 JSON 数组并将项目添加到列表 C https stackoverflow com questions 64483744 looping through json array and adding items
IF 在应该返回 TRUE 时返回 FALSE

我尝试做这样的事情 sub test a inputbox value1 b inputbox value2 c inputbox value3 if a b c then msgbox a else msgbox b msgbox c e
write.csv 精度 R

我正在处理非常精确的数字最大位数我注意到write csv x 在 R 中有时会对数字进行四舍五入有人注意到类似的事情吗默认保存的位数是多少正如文档中所写在几乎所有情况下数值量的转换都是受控制的通过选项 scipen see
Swagger 用于 Asp.Net Mvc 网站

我正在尝试构建一个微服务 Web 内容 api 它是一个简单的 ASP NET MVC Web 项目我的问题是如何创建一个主页该主页是路由文档就像 WEB API 的 swagger 一样我有一个如下所示的 RouteConfig
为什么 Hazelcast 尝试连接到另外两个端口

我使用 IP 127 0 0 1 和端口 5701 启动 Hazelcast 为什么它尝试连接另外两个端口 5702 和 5703 它们的用途是什么为什么连接失败以下是我以编程方式配置的方法 Config config new Conf
测试 React Redux - 无法读取未定义的属性或未定义的包装器

我在为我的测试套件在组件中设置 Redux 存储时遇到了一些问题问题是即使我尝试未连接的挂载测试也会在 authState 中查找变量时抛出错误我有以下组件 import React Component from react imp
预期间谍导航已使用 [ [ 'users' ] ] 调用，但在集成测试 Angular CLI 中从未调用过

我在一个项目上实现了一个简单的集成测试但它失败了因为expect 行是在component save 方法之前执行的当我将 Expect 行放在 setTimeout 上时它会成功没有setTimeout 如何成功 spec ts
Matlab多核

我正在运行一种占用大量资源并最大化 CPU 的算法问题是它只使用一个CPU 我怎样才能使MATLAB多线程计算并使用超过1个CPU 除非您专门使用并行结构即使用显式并行性或使用已经为您并行化的内置函数否则 Matlab 将不会在多核
（再次）在独立脚本中使用 Django ORM

我正在尝试在一些独立的屏幕抓取脚本中使用 Django ORM 我知道这个问题以前曾被问过但我无法为我的特定问题找到一个好的解决方案我有一个带有已定义模型的 Django 项目我想做的是在我的抓取脚本中使用这些模型和 ORM 我的目录
同步客户端-服务器数据库

我正在寻找一些通用策略用于将中央服务器上的数据与并不总是在线的客户端应用程序同步在我的特定情况下我有一个带有 sqlite 数据库的 Android 手机应用程序和一个带有 MySQL 数据库的 PHP Web 应用程序用户将能够在
如何避免选择 Internet Explorer 第一个按钮？

我有一张带有多个文本字段和一个按钮的表单当我输入其中一个文本字段时提交按钮会突出显示如果我在键入时按 Enter 键则会按下该按钮因此我会出现意外的行为因为我的页面已提交 Firefox 不会这样做是否有一些属性或配置可以避免
Xcode C++ 和 Objective-C 重构

有没有办法refactorXcode 中的混合 C Objective C 代码我正在使用 Cocos2D 和 Box2D 编写游戏而 Box2D 是用 C 编写的因此我编写的每个类都应该具有 mm 扩展名因此当我尝试例如重命名变量
如何强制增量 Foundry Transforms 作业以非增量方式构建而不影响语义版本？

如何强制特定数据集以非增量方式构建而不更改转换存储库中的语义版本有关我们具体用例的详细信息我们有大约 50 个数据集由单个增量 Python 通过手动注册和 for 循环定义此转换的输入可以是 100 到 10000 个小 gzip

如何强制增量 Foundry Transforms 作业以非增量方式构建而不影响语义版本？

如何强制增量 Foundry Transforms 作业以非增量方式构建而不影响语义版本？ 的相关文章

随机推荐

热门标签

如何强制增量 Foundry Transforms 作业以非增量方式构建而不影响语义版本？的相关文章