Amazon S3 上的 Presto

2024-01-24

我正在尝试在 Amazon S3 存储桶上使用 Presto，但在 Internet 上没有找到太多相关信息。

我已经在微型实例上安装了 Presto，但我无法弄清楚如何连接到 S3。有一个桶，里面有文件。我有一个正在运行的 hive 元存储服务器，并且我已在 presto hive.properties 中配置了它。但是当我尝试在配置单元中运行 LOCATION 命令时，它不起作用。

IT 抛出错误，指出找不到文件方案类型 s3。

而且我也不知道为什么我们需要运行 hadoop，但是如果没有 hadoop，hive 就不会运行。对此有什么解释吗？

This https://blog.mustardgrain.com/2010/09/30/using-hive-with-existing-files-on-s3/ and this https://prestodb.io/docs/current/connector/hive.html是我在设置时遵循的文档。

Presto 使用 Hive 元存储将数据库表映射到其底层文件。这些文件可以存在于 S3 上，并且可以以多种格式存储 - CSV、ORC、Parquet、Seq 等。

Hive 元存储通常通过 HQL（Hive 查询语言）发出 DDL 语句来填充，例如CREATE EXTERNAL TABLE ... with a LOCATION ...子句引用保存数据的基础文件。

为了让 Presto 连接到 Hive 元存储，您需要编辑 hive.properties 文件（EMR 将其放入/etc/presto/conf.dist/catalog/）并设置hive.metastore.uri适当 Hive 元存储服务的 Thrift 服务的参数。

如果您选择 Hive 和 Presto，Amazon EMR 集群实例将自动为您进行配置，因此这是一个很好的起点。

如果您想在独立的 ec2 实例上测试这一点，那么我建议您首先专注于获得与 Hadoop 基础设施配合使用的功能性 Hive 服务。您应该能够定义驻留在本地 hdfs 文件系统上的表。 Presto 补充了 hive，但确实需要功能正常的 hive 设置，presto 的本机 ddl 语句的功能不如 hive 完整，因此您将直接从 hive 进行大多数表创建。

或者，您可以为 mysql 或 postgresql 数据库定义 Presto 连接器，但这只是 jdbc 传递，我认为您不会获得太多收益。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Amazon S3 上的 Presto 的相关文章

AWS DMS 无法截断 SQL 事务日志

我们正在运行 AWS DMS 以 SQL 作为源以 DynamoDB 作为目标我们很难截断事务日志我们看到每个 AWS DMS 有 2 个 SQL 任务如下所示 begin transaction WVGLQ7HFWFWJCCPK4
Amazon EC2 实例上和本地的 RabbitMQ？

是否可以设置一个RabbitMQ服务器上的Amazon EC2 instance 并将我办公室的机器连接到此RabbitMQ服务器并向其发送接收消息我会被收取费用吗Amazon对于流入流出我的带宽消息RabbitMQ EC2 ins
自动递增 EC2 实例名称

我在 Stackoverflow 上看到很多问题询问是否有办法自动递增实例名称例如 foo1 foo2 fooN 我想看看是否有办法在 Powershell 中执行此操作我正在使用 AutoLaunchConfiguration AS
AWS LoadBalancer监听多个端口

我有一些应用程序在 aws 中作为微服务运行其中一些在端口 80 上运行一些在端口 3000 上运行我希望我的 ALB 侦听这两个端口上的流量然后我有一个ListenRules将流量引导至微服务我想实现如下所示的目标 Resour
AWS Cognito - 如何确定用户是否使用电子邮件或电话号码注册

我们已经按照描述实施了自定义身份验证触发器here https docs aws amazon com cognito latest developerguide user pool lambda challenge html 我们设置了用
在我们的 Rails3/Heroku 应用程序中设置 Paperclip + AWS S3 用于图像存储时遇到问题

我们已经构建了一个 Rails 应用程序它有多个用户和每个用户的图像在我们的本地主机上完成所有开发工作我们为用户和照片提供了工作种子但现在我们尝试使用 S3 进行图像存储我们在总是在种子期间遇到错误执行此操作时迁移的步骤耙
如何在docker的keycloak中添加SSL

我在将 SSL 证书添加到在 docker 上运行的 Keycloak 时遇到问题我通过负载均衡器从 AWS EC2 获得了 SSL 证书但不知道如何将其添加到 docker 上的 Keycloak 中我正在通过谷歌搜索但尚未找到任
AmazonServiceException：用户无权执行：dynamodb：DescribeTable 状态代码：400；错误代码：AccessDeniedException

我原本以为这个问题是由于区域不匹配造成的但是在更改区域后在尝试此处找到的 Amazon AWS 示例时我仍然遇到以下错误 DynamoDB映射器 https github com awslabs aws sdk android sam
如何更改 Amazon Redshift 中的默认时区？

默认情况下将时间戳列设置为 SYSDATE 将其存储为UTC 是否可以更改时区以便 SYSDATE 将日期和时间存储到不同的时区到目前为止我已经检查了SET http docs aws amazon com redshift late
解锁 Jenkins - 如何

我已经使用 putty 从 Windows 系统在我的 ec2 实例上安装了 jenkins 当我尝试通过网络访问 jenkins 时我使用 var lib jenkins secrets initialAdminPassword 解锁
DynamoDB 中的时间戳应使用什么数据类型？

我是 DynamoDB 新手我希望创建一个使用 DeviceID 作为哈希键时间戳作为范围键和一些数据的表 DeviceID 123 Timestamp 2016 11 11T17 21 07 5272333Z X 12 Y 35 在
亚马逊 AWS CloudFront 声称不存在这样的存储桶

我正在尝试设置 CloudFront 来提供图像但当前无法访问它并返回错误指定的存储桶不存在
在 Amazon Redshift COPY 命令中转义分隔符

我正在将数据从 Amazon S3 提取到 Amazon Redshift 中的表中该表包含多个列其中某些列数据可能包含特殊字符复制命令有一个选项称为Delimiter我们可以在将数据拉入表时指定分隔符问题有2个方面当我导出时 u
如何在我的 AWS EC2 实例上安装特定字体？

我有一个在 AWS EC2 Amazon Linux Elastic Beanstalk 实例上运行的 Python 应用程序该实例需要某些特定字体才能生成输出并且想知道如何在部署或实例启动过程中安装它们我的代码在本地计算机 OS X
我们能否知道回形针下载何时完成？

我有一个应用程序我需要知道用户的 Rails Paperclip 文件下载时间complete 我的应用程序设置为与 Amazon S3 交互当用户收到完整的文件时我需要运行 JavaScript 函数我怎样才能做到这一点跟踪天气
Amazon S3：静态网站：自定义域或子域

Amazon com 刚刚宣布可以在 S3 存储桶中托管静态网站我访问了他们的设置页面http docs amazonwebservices com AmazonS3 latest dev index html WebsiteHostin
Amazon MWAA Airflow - 任务容器在没有日志的情况下关闭/停止/终止

我们使用 Amazon MWAA Airflow 很少有任务标记为 FAILED 但根本没有日志就好像容器在我们没有注意到的情况下被关闭了一样我找到了这个链接 https cloud google com composer docs h
使用 C# 获取 ec2-instance 标签

我不是开发人员所以也许答案是有不同的解决方案但我无法真正从 python 或其他东西翻译它我尝试使用 AWS NET SDK 查找实例然后获取实例的标签我已经能够确定实例是否已启动并正在运行我还了解了如何创建和删除标签不在下面
如何修改 Amazon RDS 实例的 my.ini 参数

在启动 MySQL 5 5 RDS 实例时 Amazon 使用默认参数组来配置 my ini 参数但控制台不允许我修改它们我怎样才能实现这个目标例如默认将存储引擎设置为MyISAM或设置字符集此处记录了这一点 http aws am
如何使用具有自定义身份验证的 AWS cognito 创建临时 s3 上传安全令牌

因此我对 Cognito 的 Amazon 文档中有关其声明的用例之一的内容感到有点困惑使用您自己的身份系统允许您的应用程序将数据保存到 AWS 云就我而言我想给他们 aws 令牌以便他们从移动客户端直接上传到 s3 而无需将我

随机推荐

UIPopoverController 在“点击关闭”时关闭 - 如何检测此事件？

我在导航栏上使用 UIPopover 我有几个 UIBarButtonItems 弹出窗口从其中之一扩展当弹出窗口被激活时我将按钮的样式更改为UIBarButtonItemStyleDone 但是通过按预期点击 UIPopoverCo
AWS Lambda Python - 如何将模块从本地文件导入到app.py

这是使用 Docker 容器进行的基于 SAM 模板的简单部署文件系统结构 src app py mymodule py 在应用程序 py中 from mymodule import myfunction 结果调用时 Unable to
NSString 字符位置

NSString url http stackoverflow com questions ask 如何获取第4个的字符位置如果您只是想获取网址的最后一部分您应该可以使用 NSArray items url componentsSep
如何在我的 ASP.NET Core MVC 项目中引用 Microsoft.JQuery.Unobtrusive.Ajax

我正在尝试使用Microsoft JQuery Unobtrusive Ajax 我首先使用 NuGet 安装该包正如预期的那样我能够在我的依赖项中看到它我的问题是我找不到引用脚本的方法因此我可以在我的视图中使用它 Here htt
MCS/nodejs 中的 URI 参数验证

需要您的帮助来解决问题我正在 MCS 中编写一个自定义 API 方法类型为 GET 将参数与 URI 一起传递 service get mobile custom deviceVersion deviceType function req
确保 auto_cast 安全

GMan https stackoverflow com users 87234 gman已经发布了一个代码可口的auto cast 操作员 https stackoverflow com a 4027734 87234允许在 C 中编写如
用javascript编写的C解释器[关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案有没有用 javascript 或 java 编写的 C 解释器我不需要完整的解释器但我需要能够逐
Spring Security for URL 与 PermitAll() 和过期的身份验证令牌

我将 Spring 4 与 Spring Security 自定义 GenericFilterBean 和 AuthenticationProvider 实现结合使用除了用于创建新会话的 URL 之外我大部分都保护了 URL v2 会话
Jasmine 测试给出错误“Uncaught ReferenceError：require 未定义”

我正在尝试在我的 React 网站上使用 Karma 运行 Jasmine 测试我的测试之前是有效的我不确定发生了什么变化但现在我收到错误 Uncaught ReferenceError require is not defined
“顶部：0；左侧：0；底部：0；右侧：0；”是什么意思意思是？

我正在阅读此指南site http www smashingmagazine com 2013 08 09 absolute horizontal vertical centering css 关于使元素居中的技术我读了CSS代码 Abs
android 将xml转换为json

我正在使用 java json jar 将传入的 xml 转换为可用的 json 我现在遇到的唯一问题是当 xml 包含它崩溃并显示以下日志 03 26 16 54 56 176 30119 30119 nl avrotros opgeli
Scala 的 for 推导式：重要特征还是语法糖？

当我第一次开始研究 Scala 时我喜欢 for 推导式的外观它们似乎有点像我在 Java 5 中习惯的 foreach 循环但有功能限制和很多漂亮的语法但当我吸收了 Scala 风格后我发现每次我可以使用 for compres
Powershell 获取超过 x 天的文件并移动它们

我确信这个问题之前可能已经被问过一百万次了我对 Power Shell 非常陌生想问问我这样做是否正确在目录中我们有很多文件类型我想要完成的任务是仅移动超过一个月的 PDF 文件甚至不要碰其他文件扩展名文件夹中的扩展名是 pd
Spring事务管理器是否将连接绑定到线程？

我找到了以下线程 JdbcTemplate 与 TransactionManager 到底如何协同工作 https stackoverflow com questions 2250754 how exactly jdbctemplate w
为什么要使用处理程序？

我在一个非常基本的处理程序教程中遇到了这段代码代码工作正常但我不明白为什么我必须使用 HandlerprogressDialog dismiss 我删除了处理程序部分并放置progressDialog dismiss in the ru
是否可以在 C++ 运行时动态创建函数？

C 是一种静态的编译语言模板在编译时解析等等但是是否有可能在运行时创建一个函数该函数未在源代码中描述并且在编译期间未转换为机器语言以便用户可以向其抛出源代码中未预期的数据我知道这不可能以直接的方式发生但肯定是可能的有很多编程
如何使用 Bootstrap 3 在下拉列表中选择默认值？

我想添加一个下拉菜单来选择城市但不知道如何在选择之前选择默认值我正在使用 Bootstrap 3 这是 HTML 标记 div class btn group a class btn btn primary dropdown toggl
Android-Ndk 与交叉编译？两者都可以，但是当时需要 Android NDK 做什么呢？

我可以交叉编译任何 C C 应用程序静态链接 Linux 库并在 Android 上运行那么 Android ndk 的需求是什么 Android ndk 将我们限制为 Bionic 它具有 gnu libc 的一小部分直接交叉编译应
UIImage 的 jpg 或 png ——哪个更有效？

我从相机胶卷中抓取一张图像然后使用它一段时间并将其以 PNG 格式保存到 iPhone 的磁盘上我遇到了奇怪的崩溃可能是由于内存不足如果我将其保存为 PNG 或 JPG 假设我选择注释来降低 JPG 情况下的质量会有什么不同吗
Amazon S3 上的 Presto

我正在尝试在 Amazon S3 存储桶上使用 Presto 但在 Internet 上没有找到太多相关信息我已经在微型实例上安装了 Presto 但我无法弄清楚如何连接到 S3 有一个桶里面有文件我有一个正在运行的 hive 元存储

Amazon S3 上的 Presto

Amazon S3 上的 Presto 的相关文章

随机推荐

热门标签