Amazon Redshift 如何从 s3 复制并设置 job_id

2024-06-22

Amazon Redshift 提供使用“复制”命令从 s3 对象加载表数据的功能。他们是使用复制命令的一种方法，但也为每个插入的行设置额外的“col=CONSTANT”。

我想在每个复制的行上设置一个 job_id （不在源数据中），我认为当“copy”获取时，必须执行几百万次插入，以便每行都有一个作业属性，这将是一种耻辱我已经完成了 99%，并且表现更好。

也许有更聪明的解决方案？

如果您希望在单个 COPY 命令中添加的所有行都具有相同的 job_id 值，那么您可以将数据复制到临时表中，然后将 job_id 列添加到该表中，然后将临时表中的所有数据插入最终表中，如下所示：

CREATE TABLE destination_staging (LIKE destination);
ALTER TABLE destination_staging DROP COLUMN job_id;
COPY destination_staging FROM 's3://data/destination/(...)' (...)
ALTER TABLE destination_staging ADD COLUM job_id INT DEFAULT 42;
INSERT INTO destination SELECT * FROM destination_staging ORDER BY sortkey_column;
DROP TABLE destination_staging;
ANALYZE TABLE destination;
VACUUM destination;

ANALYZE 和 VACUUM 不是必需的，但强烈建议这样做，以便更新查询分析器并将所有新数据放入正确的位置。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

postgresql

amazonwebservices

amazonredshift

Amazon Redshift 如何从 s3 复制并设置 job_id 的相关文章

Spark 写入 S3 V4 SignatureDoesNotMatch 错误

我遇到S3SignatureDoesNotMatch尝试使用 Spark 将 Dataframe 写入 S3 时症状尝试过的事情代码失败有时但有效有时代码可以read从 S3 没有任何问题并且能够不时写入 S3 这排除了错误的配置
具有位变化的 PostgreSQL 位运算符“不能与不同大小的位字符串”

我有一个变化的位掩码字段我想对其执行按位与操作 PG Error ERROR cannot AND bit strings of different sizes SELECT groups FROM groups WHERE read r
boto3 搜索未使用的安全组

我正在使用 AWS Python SDK Boto3 我想知道哪些安全组未使用我用 boto2 做到了但我不知道如何用 boto3 做同样的事情 from boto ec2 connection import EC2Connection
PostgreSQL - 返回多列的函数

这是一个提供 2 列结果的函数在这个函数中有一个Loop被用来返回结果功能 Create Type Repeat rs as label text count bigint CREATE OR REPLACE FUNCTION Repe
Postgres Notify 不适用于逻辑复制

我正在使用逻辑复制将数据从 Postgres 10 4 复制到另一个 Postgres 10 4 实例订阅者有多个触发器将事件记录到单个表中该表有一个触发器该触发器执行另一个函数返回触发器来为下游侦听器调用 NOTIFY 审计表上
Amazon s3：直接上传与预签名 URL

我正在使用 AWS SDK for NET 并且正在寻找一种让用户直接上传到 s3 存储的方法我遇到过 aws 提供的两种不同的方式基于浏览器的上传 https docs aws amazon com AmazonS3 latest A
AWS API Gateway 默认响应和触发器 AWS Lambda

我一直在尝试使用 AWS API Gateway 和 AWS Lambda 来尝试无服务器架构一直在浏览博客和 AWS 文档已尝试过示例 GET POST 但是我有以下要求从我的自定义应用程序跟踪用户事件 Events are po
aws Lambda 在 S3 上传时使 CloudFront 失效

我同时上传 10 50 个文件 Lambda 会为每个更新的文件触发一个事件如果文件大小发生变化因此我不想一一失效 50x 而是想运行通配符上传结束时出现一次字符任何人都可以阐明如何实现这一目标谢谢如果我正确理解你的问题你的
如何配置AWS ELB以阻止某些IP地址？（已知的垃圾邮件发送者）[关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案这个问题似乎不是关于主要由程序员使用的特定编程问题软件算法或软件工具 help on topic 如果您认为该问题与主题相关另一个 St
如何获取表中所有列的计数（*）？使用 PostgreSql

我有一堆表其中几个有数百列我需要获取每列的非空值计数并且我一直在手动执行此操作我想找出一种方法来获取表中所有列的所有计数我查了 stackoverflow 和 google 但找不到答案我尝试了这个但它只是为每列返回 1 的值
Knex 与 PostgreSQL 选择查询在多个并行请求上性能极度下降

In brief 我正在开发一个梦想中的游戏我的后端堆栈是 Node js 和带有 Knex 的 PostgreSQL 9 6 我在这里保存所有玩家数据我需要经常请求它其中一个请求需要进行 10 个简单的选择来提取数据这就是问题
如何列出表外键

有没有办法使用 SQL 列出给定表的所有外键我知道表名称架构我可以将其插入您可以通过 information schema 表来完成此操作例如 SELECT tc table schema tc constraint name t
将 Python Lambda 函数导入 Eclipse AWS Toolkit

如何将 Lambda 函数导入 AWS Toolkit for Eclipse 我将函数从 AWS 控制台导出到 YAML 和 ZIP 包如何在 Eclipse 中使用这些内容有教程数量 https cloudacademy com b
如何在 PHP 中获取 AWS EC2 实例 ID

我在 AWS EC2 中有 2 个实例我想通过实例 id 检查请求 require once vendor autoload php use Aws Ec2 Ec2Client use Aws Rds RdsClient instance
Python postgreSQL sqlalchemy 查询 DATERANGE 列

我有一个预订系统并将预订日期范围保存在日期范围列中 booked date Column DATERANGE nullable False 我已经知道我可以通过以下方式访问实际日期booked date lower or booked
PostgreSQL 中有类似 SSIS 的功能吗？

我们正在使用SSIS SQL Server 集成服务 http msdn microsoft com en us library ms141026 aspx在 SQL 2008 R2 中将数据库表从 30 多个数据库在 SQL Serv
Aurora RDS 实例无法停止

我正在尝试 Amazon Aurora 实例但看不到停止它的选项唯一的选项是删除和重新启动我是不是错过了什么编辑 2018 09 25 Amazon Aurora 现在支持停止和启动数据库集群根据本公告 https aws ama
如何使用带有外键的时间尺度超表并保持一对多关系？

我正在尝试创建一个考虑到最小冗余的数据库我们想使用 timescaledb 超级表我运行 postgreSQL v 12 和 timescaledb v 1 7 4 创建表的 postgreSQL 代码如下您可以在此处查看 dbdia
Spring Cloud-SQS

我正在尝试使用 Spring Cloud 框架获得一个简单的队列处理程序但是我已成功让消息处理程序轮询队列我看到的问题是当我将消息发布到队列时我的处理程序无法将有效负载解组到所需的 java 对象中 MessageMapping
使用 pyscopg2 和 PostgreSQL 将日期时间插入数据库

我在使用 pyscopg2 的 insert 语句将日期时间戳插入 SQL 数据库时遇到问题下面的代码所做的是每次按下按钮时它都应该在数据库中插入一行其中包含buildingID 只是文本以及按下按钮时的日期和时间我只是不知道如何

随机推荐

网页过滤器破坏了 PrimeFaces 移动视图

在我使用 PrimeFaces 3 4 2 的 JSF2 1 Web 应用程序中我添加了一个新网页其中仅包含一个视图renderKitId PRIMEFACES MOBILE PFM 0 9 3 这个想法是过滤器将来自移动设备的请求重定
如何创建基于 y 值的梯度阶梯图？

在 Python matplotlib 中如何获得折线图或阶梯图中的线以显示基于 y 值的梯度示例图 https i redd it h3yxb4tmvgp41 png 在 Tableau 中制作带有根据 x 值改变梯度的线的阶梯图代
如何使嵌入的 hasMany 关系与 ember 数据一起使用

我无法得到embedded hasMany正确处理 ember 数据我有这样的东西 App Post DS Model extend comments DS hasMany App Comment App Comment DS Model
在 Excel 中，对每行的一列中的所有值求和，其中另一列是特定值

我想知道是否有一种简单的方法可以完成我正在寻找的事情基本上我在 Excel 2011 中有一个包含大量数据的资产负债表我一直希望看到的一项具体信息是尚未报销的金额换句话说我有一栏显示已支付的金额另一栏显示是否已报销是否我想
java.util.Collection 的经典集合操作

java util Collection 类上是否有用于经典集合操作的内置功能我的具体实现是针对 ArrayList 的但这听起来应该适用于 Collection 的所有子类我正在寻找类似的东西 ArrayList
从 TransformedBitmap 对象中“跨越”困境

我有一个 2208 x 3000 TransformedBitmap 对象其格式为 Indexed8 我正在对其进行 CopyPixels 操作我在用着 int formattedBitmap PixelWidth formattedB
析构函数必须对默认初始化的类成员仅可用（公共）还是完全有效？

请考虑一个结构体A有一个领域u类型的U
如何制作像毕加索一样的滑动显示？

我一直在使用 Picasso 的库将图像加载到我的应用程序中的 gridview 中它的工作原理和外观完全符合我的要求但用户告诉我图像加载速度非常慢我知道这是因为网络速度差毕加索正在加载非常大的完整图像然后调整它们的大小以适合我的
为什么嵌套权重对性能不利？备择方案？

我写了几个布局文件其中使用了layout weight属性来创建不同视图之间的比率在某些时候我开始收到有关嵌套权重的 lint 警告所以我想知道为什么嵌套权重对性能不利以及是否有一种更有效的方法来创建视图尺寸之间的恒定比率该比
如何在项目提交历史中找到已删除的文件？

曾几何时我的项目中有一个文件我现在希望能够获取它问题是我不知道我什么时候删除了它也不知道它在哪条路径上当该文件存在时如何找到该文件的提交如果您不知道可以使用的确切路径 git log all full history the
Windows 10 UWP 应用程序的记录器

我找不到任何适用于 Windows 10 通用应用程序的记录器我尝试过 log4net Microsoft 企业库 Nlog 但 Windows 10 通用平台均不支持它们谁能给我推荐适合 Windows 10 UWP 的优秀记录器您
SQL Server 2008 R2中ntext和varchar有什么区别

我想知道数据类型之间的基本区别ntext and varchar在 SQL Server 2008 R2 中我应该在什么情况下使用ntext and varchar From ntext 文本和图像 Transact SQL http m
C# 线程安全（特别是 MVVM/WPF）

我想知道我需要做什么才能使模型在 MVVM 中线程安全假设我有以下类它被实例化为单例 public class RunningTotal INotifyPropertyChange private int total public in
microsoft Visual Studio 2008 构建不断失败

我的构建不断失败并出现以下错误 Project error PRJ0002 Error result 31 returned from C Program Files Microsoft SDKs Windows v6 0A bin mt
使用 Web api 的 AngularJS 客户端路由和令牌身份验证

我想使用 asp net mvc webapi 作为后端和客户端路由无 cshtml 在 SPA angularjs 应用程序中创建一个身份验证和授权示例以下只是可用于设置完整示例的函数示例但我就是无法把它们放在一起任何帮助表示赞赏
如何使用递归函数返回 ArrayList

我是java新手我正在努力克服我必须做一些作业我从中解决了很多问题但有时我不知道该怎么做我的问题我必须为二叉树构建一些函数例如添加节点计数节点删除节点等其中大多数我都能找到自己的算法现在我正在努力解决递归方法我在其中
引起：java.lang.IllegalArgumentException：令牌（spring.cloud.vault.token）不能为空 - Hashicorp Vault

我正在跟进Vault Configuration示例引用自 https spring io guides gs vault config https spring io guides gs vault config 当我执行代码时出现以下
“*text=auto”和“*text=auto eol=lf”有什么区别？

我正在读关于 gitattributes文件和强制行结尾的规则some https rehansaeed com gitattributes best practices line endings教程是这样写的 text auto and
Prolog中统计一个列表中出现次数的方法

我必须编写一种方法可以计算一个列表在给定的另一个列表中出现的次数例如 reps a b c a b c a b c 0 R R 2 no 我试图编码它 incr X X1 X1 is X 1 reps C D incr C D reps
Amazon Redshift 如何从 s3 复制并设置 job_id

Amazon Redshift 提供使用复制命令从 s3 对象加载表数据的功能他们是使用复制命令的一种方法但也为每个插入的行设置额外的 col CONSTANT 我想在每个复制的行上设置一个 job id 不在源数据中我认为当 c

Amazon Redshift 如何从 s3 复制并设置 job_id

Amazon Redshift 如何从 s3 复制并设置 job_id 的相关文章

随机推荐

热门标签