我有几个数据集想要在 Palantir Foundry 中合并。我提前知道数据集是什么。所有数据集的架构都是相同的(即它们具有相同的列名称和列类型)。
组合(联合)这些数据集的最佳方法是什么?
数据集A:
数据集B:
数据集C:
期望的输出:
col1 |
col2 |
1 |
a |
2 |
b |
2 |
c |
3 |
d |
1 |
e |
1 |
f |
您可以为此使用数据集视图。数据集视图是一个 Palantir Foundry 数据集,它不包含任何包含数据的文件,但在读取时由其他数据集(称为支持数据集)的联合组成。这意味着构建视图的速度非常快,并且视图可以节省空间,因为它们不会重复数据。
要创建视图:
- 导航到要创建视图的位置
- 点击绿色
+ New
按钮,然后在下拉菜单中选择“查看”
- 在新创建的视图中,查看“详细信息”选项卡。
- 点击
+ Add backing dataset
按钮并添加要合并的数据集
然后,您可以使用该视图,就好像它是数据集合并的结果一样。例如,您可以将其用作轮廓分析的基础数据集或支持本体对象。
有关视图的更多文档可以通过搜索“Views”产品在 Foundry 平台内文档中找到。
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)