AWS Glue 作业因连接超时错误而失败

2024-01-28

我是 AWS Glue 的新手。我创建了一个作业，它使用两个数据目录表并在它们之上运行简单的 SparkSQL 查询。作业在转换步骤失败并出现异常

pyspark.sql.utils.AnalysisException: 'java.lang.RuntimeException: com.amazonaws.SdkClientException: Unable to execute HTTP request: Connect to glue.us-east-1.amazonaws.com:443 [blah] failed: connect timed out;'

JDBC 源 (Redshift) VPC 安全组已配置入站和出站规则。

我在 SO 上看到了另一篇关于为 Glue 本身配置 VPC 端点的帖子，但我不太明白它应该是什么样子？它应该是glue.us-east-1.amazonaws.com:443 的接口还是其他东西？我很困惑。

UPD：自动生成的 pyspark 脚本

## @params: [TempDir, JOB_NAME]
args = getResolvedOptions(sys.argv, ['TempDir','JOB_NAME'])

sc = SparkContext()
glueContext = GlueContext(sc)
spark = glueContext.spark_session
job = Job(glueContext)
job.init(args['JOB_NAME'], args)
## @type: DataSource
## @args: [database = "redshift_catalog", redshift_tmp_dir = TempDir, table_name = "analytics_mongo_raw_conversations", transformation_ctx = "DataSource0"]
## @return: DataSource0
## @inputs: []
DataSource0 = glueContext.create_dynamic_frame.from_catalog(database = "redshift_catalog", redshift_tmp_dir = args["TempDir"], table_name = "analytics_mongo_raw_conversations", transformation_ctx = "DataSource0")
## @type: DataSource
## @args: [database = "redshift_catalog", redshift_tmp_dir = TempDir, table_name = "analytics_mongo_raw_messages", transformation_ctx = "DataSource1"]
## @return: DataSource1
## @inputs: []
DataSource1 = glueContext.create_dynamic_frame.from_catalog(database = "redshift_catalog", redshift_tmp_dir = args["TempDir"], table_name = "analytics_mongo_raw_messages", transformation_ctx = "DataSource1")
## @type: SqlCode
## @args: [sqlAliases = {"messages": DataSource1, "conversations": DataSource0}, sqlName = SqlQuery0, transformation_ctx = "Transform0"]
## @return: Transform0
## @inputs: [dfc = DataSource1,DataSource0]
Transform0 = sparkSqlQuery(glueContext, query = SqlQuery0, mapping = {"messages": DataSource1, "conversations": DataSource0}, transformation_ctx = "Transform0")
job.commit()

我能够解决这个问题，确实必须有一个 VPC 端点。除此之外，连接还应该使用带有 NAT 网关的私有子网。我最初的子网没有 NAT。

Terraform 中的 VPC 终端节点配置示例：

resource "aws_vpc_endpoint" "glue" {
  vpc_id            = var.vpc_id
  service_name      = var.glue_vpc_service_name
  vpc_endpoint_type = "Interface"

  security_group_ids = var.security_group_ids 
  subnet_ids = var.subnet_ids

  tags = { mytag = "mytag"}
}

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

amazonwebservices

awsglue

AWS Glue 作业因连接超时错误而失败的相关文章

使用 AWS API Gateway 和 Lambda 从 multipart/form-data 获取非文件正文

我正在尝试从multipart form data POST通过 API 网关连接到我的 AWS Lambda Web 服务超文本传输协议POST具有内容类型 multipart form data 和 URL 编码的正文文件数据也在
如何更改 Amazon Redshift 中的默认时区？

默认情况下将时间戳列设置为 SYSDATE 将其存储为UTC 是否可以更改时区以便 SYSDATE 将日期和时间存储到不同的时区到目前为止我已经检查了SET http docs aws amazon com redshift late
如何运行指定 node.js 版本 8 的 eb init？

I run eb init并部署我得到了node js版本6 如何在执行时指定我想要node js版本8eb init命令这是一个有趣的问题我很想知道是否有更简单的方法但我是这样实现的确定最新的SolutionStack名称如所列
亚马逊 AWS CloudFront 声称不存在这样的存储桶

我正在尝试设置 CloudFront 来提供图像但当前无法访问它并返回错误指定的存储桶不存在
使用 Terraform 管理访问 RDS 数据库的凭据时出现问题

我通过 Terraform 创建了一个秘密该秘密用于访问也在 Terraform 中定义的 RDS 数据库并且在秘密中我不想包含username and password 因此我创建了一个空密钥然后在 AWS 控制台中手动添加凭证
具有服务器端加密 s3 存储桶的 AWS Cloudfront

这是对这个问题 https stackoverflow com questions 50166557 how can a cloudfront distribution an aws kms key to get an s3 image e
从 Amazon API 网关终端节点输出纯文本内容

使用 Amazon 的 API Gateway 我可以创建一个端点该端点将调用输出纯文本的 lambda 函数但是当我在端点上发出请求时输出会返回默认内容类型 application json 这将输出用引号括起来的纯文本响应我想
每次在我的 AWS SQS 目标上推送通知时如何触发事件？

我正在将 AWS SQS 用于 Amazon MWS 订单 API 每当有人从已将我添加为其开发人员的卖家帐户订购时亚马逊都会将通知发送到我的 AWS SQS 应用程序我可以从那里提取通知但为此我必须创建一个调度程序来提取通知我是
使用S3上传但不允许公共访问

我的想法是创建一个 S3 存储桶以允许用户上传二进制对象下一步是确认上传然后 API 将启动文件处理为了使其更安全客户端将首先请求上传位置然后 API 会在 S3 上为此上传分配并预先创建一个一次性使用目录并在该目录上设置访问策
Amazon MWAA Airflow - 任务容器在没有日志的情况下关闭/停止/终止

我们使用 Amazon MWAA Airflow 很少有任务标记为 FAILED 但根本没有日志就好像容器在我们没有注意到的情况下被关闭了一样我找到了这个链接 https cloud google com composer docs h
X-Amz-Expires 是向 AWS 发出的请求所需的标头/参数吗？

Is X Amz Expires必需的标头参数官方文档不一致用在一些例子 http docs aws amazon com AmazonS3 latest API sigv4 query string auth html 虽然不在ot
如何修改 Amazon RDS 实例的 my.ini 参数

在启动 MySQL 5 5 RDS 实例时 Amazon 使用默认参数组来配置 my ini 参数但控制台不允许我修改它们我怎样才能实现这个目标例如默认将存储引擎设置为MyISAM或设置字符集此处记录了这一点 http aws am
在 Azure 上运行 .NET 应用程序

我拥有在 Amazon EC2 上运行应用程序的丰富经验它需要一台低端服务器我目前为该服务器支付大约 90 美元月是的我知道我并不真正需要可扩展性但我仍然使用 EC2 我想知道将这个纯粹的 NET 应用程序迁移到 Microso
从 API 网关自定义授权方返回的 401 缺少“Access-Control-Allow-Origin”标头

为了防止未登录的用户通过 AWS API Gateway 调用我的 lambda 函数我使用自定义授权者 lambda 解决方案如果请求被授权 200 并且我从被调用的 lambda 得到响应一切正常并且我得到Access Contr
AWS S3 GetObject 是否提供随机访问？

I can 提供 HTTP Range 标头 https docs aws amazon com AmazonS3 latest API API GetObject html API GetObject RequestSyntax到 AWS
在 Python 2.7 中出现“ImportError：无法导入名称 HTTPSConnection”错误

我正在尝试在 AWS ElasticBeanstalk 中部署 django 当我按照所示步骤操作时here http docs aws amazon com elasticbeanstalk latest dg create deploy
如何向 boto 中的联合用户授予 s3 存储桶的权限？

尝试从文档中找出答案但无法创建可以访问 s3 存储桶的联合用户首先是进口 gt gt gt from boto s3 connection import S3Connection gt gt gt from boto sts impor
使用 CognitoIdentityServiceProvider 的 adminCreateUser 方法的 AWS Lambda 函数突然失败

在过去的几天里我一直在使用 AWS Lambda 函数测试特定流程并且在 Cognito 用户池中预注册后触发的 lambda 函数工作正常并很好地返回回调函数但从昨天开始我就看到了以下错误 ntime node modules aw
如何在AWS中从快照创建Windows实例

我的公司想要在 Amazon Web Service 中拍摄窗口的每日快照我们可以毫无问题地拍摄快照但是当我尝试从快照创建实例时它总是创建一个 Linux ami 所以当服务器启动时它总是无法通过健康检查是否可以从快照创建 Win
Nginx url 限制 502 网关

我有一个问题但我接受绕过此功能的其他建议基本上我在 get 请求中向我的服务器发送大约 3000 个字符的大行文本然后服务器将其作为 url 中的参数发送到谷歌翻译问题当 url gt 1900 个字符时 Nginx 会抛出 5

随机推荐

Angular 2-在多个条件下使用 *ngIf

我无法有选择地在导航栏上显示链接根据登录者用户或管理员我想更改导航栏上显示的链接下面是用户管理员注销的一个此类实例的代码在 navbar component html 中 li a href Logout a li li li
如何使 VS Code 自动完成 Python 类属性初始化

我正在将 VS Code 用于 Python 项目当我写的时候 class User def init self name age group None 我希望 VS Code 自动完成以下内容 class User def init s
多点连接断开

我在使用 iOs7 中的多点连接框架保持连接时遇到问题目前我的应用程序正在使用 MCNearbyServiceAdvertiser 和 MCNearbyServiceBrowser 以编程方式处理浏览和广告我有一个警报视图询问用户他
将自行创建的 Web 用户控件列表添加到代码隐藏中的列表视图失败

我有一个列表视图我想用自己创建的用户控件填充它但问题是用户控件中的属性未设置显示了用户控件但未设置我输入的属性值这是为什么这是 aspx 代码 div class productsMain div class productsG
在 HTTPS 请求期间验证远程 SSL 证书

当向远程 Web 服务器发出 HTTPS 请求时我使用 WebRequest 它与远程 Web 服务器建立安全连接在开发过程中我在服务器上使用自签名证书并且 WebRequest 无法建立安全连接因为证书无效这是预期的行为我发
IFileOperation 在哪里实现（以及如何验证这一点）？

我想找出在哪里IFileOperation在 Windows 7 中实现据我了解MSDN 页面 http msdn microsoft com en us library bb775771 aspx它位于 shell32 dll 中因此
measure() 无法与动态布局和 textView 一起正常工作 - Android

我想将RelativeLaout 视图转换为位图我尝试了其他答案和不同的选项但没有成功我的 XML 视图是这样的 RelativeLayout ImageView TextView 每个人都有wrap content措施由于我需要视
HTTP 状态 415 - 请求实体的格式不受支持

我正在研究java Restful Web 服务我可以使用 GET 请求但是 POST 请求不起作用我的控制器类是RestController 到目前为止我已经做了这些 RequestMapping value api signup
单击另一个 DIV 后恢复翻转 DIV

看看这个link http ananiadis com gr index2 php page id 560 如果您单击某个产品它会翻转并显示一些信息您可以在给定时间翻转所有产品我希望只能拥有一件翻转产品每次有人点击另一个产品时我都
Firebase Android：使用许多侦听器“加入”速度缓慢，似乎与文档相矛盾

实现一个Android Firebase应用程序它具有多对多关系 User Widget Widget可以共享给多个用户注意事项列出用户拥有的所有小部件用户只能看到共享给他她的小部件能够查看共享给定小部件的所有用户单个小部件可
从根目录中包含 Wordpress 的子文件夹中的 Codeigniter URL 中删除 index.php

我的服务器子文件夹中的 Codeigniter 应用程序以及文档根目录中的 Wordpress 安装出现了一些问题如果我隐藏index phpCodeigniter URL 的 htaccess codeigniter htaccess
使用带有嵌入 HTML 的 link_to

我正在使用 Twitter 的 Bootstrap 内容并且有以下 HTML a class btn href i class icon ok icon white i Do it a 在 Rails 中执行此操作的最佳方法是什么我想用
Xcode 4.2 - 应用程序加载器：无法验证图标尺寸，未找到图标

在我开始使用 Xcode 4 2 之前我从未遇到过这个问题我在尝试上传我的应用程序时遇到以下错误无法验证图标尺寸未找到图标您的最低操作系统版本低于 3 2 因此您必须定义 CFBundleIconFile 或提供默认 Icon
为什么允许嵌套类模板的部分特化，而不允许完全特化？

template
如何使用 Python 将字符串列表转换为浮点数列表？

如果我有一个字符串列表 3 2 4 5 7 8 9 2 4 3 4 7 5 2 3 1 4 1 1 3 8 2 4 1 3 2 3 1 3 1 4 2 5 7 3 2 4 1 3 0 1 9 如何将其转换为浮点数列表以便我的结果如下所示
在touchesBegan之后调用viewDidLayoutSubviews - 一次又一次

In 一款 iPhone 文字游戏 https github com afarber ios newbie tree master Scroll我有一个UIScrollView 保持UIImageView 和 7 个可拖动自定义UIView
如何获取 Office.JS 中的绑定范围？

曾经有绑定 range或绑定 getRange 但两者都不适用于绑定并且没有类似的文档记录https learn microsoft com en us javascript api office office binding https
创建椭圆包络线数据的 D3 贴图

我有这个数据集其中有椭圆更具体地说是椭圆信封我想知道是否有人对我如何在 D3 地图上绘制这些有建议我已经有了墨卡托投影的地图设置这个 stackoverflow 答案有一个 createEllipse 函数 https stac
同时运行unittest测试用例和Robot Framework测试用例

我们的团队正在为我们的 QA 团队评估机器人测试框架不仅是为了 BDD 而且还可能满足我们的许多常规功能测试需求这无疑是一个引人注目的项目 Robot Framework 在多大程度上如果有基于 xunit unittest 架构
AWS Glue 作业因连接超时错误而失败

我是 AWS Glue 的新手我创建了一个作业它使用两个数据目录表并在它们之上运行简单的 SparkSQL 查询作业在转换步骤失败并出现异常 pyspark sql utils AnalysisException java lang

AWS Glue 作业因连接超时错误而失败

AWS Glue 作业因连接超时错误而失败 的相关文章

随机推荐

热门标签

AWS Glue 作业因连接超时错误而失败的相关文章