Amazon S3 上的 Presto

2024-01-24

我正在尝试在 Amazon S3 存储桶上使用 Presto,但在 Internet 上没有找到太多相关信息。

我已经在微型实例上安装了 Presto,但我无法弄清楚如何连接到 S3。有一个桶,里面有文件。我有一个正在运行的 hive 元存储服务器,并且我已在 presto hive.properties 中配置了它。但是当我尝试在配置单元中运行 LOCATION 命令时,它不起作用。

IT 抛出错误,指出找不到文件方案类型 s3。

而且我也不知道为什么我们需要运行 hadoop,但是如果没有 hadoop,hive 就不会运行。对此有什么解释吗?

This https://blog.mustardgrain.com/2010/09/30/using-hive-with-existing-files-on-s3/ and this https://prestodb.io/docs/current/connector/hive.html是我在设置时遵循的文档。


Presto 使用 Hive 元存储将数据库表映射到其底层文件。这些文件可以存在于 S3 上,并且可以以多种格式存储 - CSV、ORC、Parquet、Seq 等。

Hive 元存储通常通过 HQL(Hive 查询语言)发出 DDL 语句来填充,例如CREATE EXTERNAL TABLE ... with a LOCATION ...子句引用保存数据的基础文件。

为了让 Presto 连接到 Hive 元存储,您需要编辑 hive.properties 文件(EMR 将其放入/etc/presto/conf.dist/catalog/)并设置hive.metastore.uri适当 Hive 元存储服务的 Thrift 服务的参数。

如果您选择 Hive 和 Presto,Amazon EMR 集群实例将自动为您进行配置,因此这是一个很好的起点。

如果您想在独立的 ec2 实例上测试这一点,那么我建议您首先专注于获得与 Hadoop 基础设施配合使用的功能性 Hive 服务。您应该能够定义驻留在本地 hdfs 文件系统上的表。 Presto 补充了 hive,但确实需要功能正常的 hive 设置,presto 的本机 ddl 语句的功能不如 hive 完整,因此您将直接从 hive 进行大多数表创建。

或者,您可以为 mysql 或 postgresql 数据库定义 Presto 连接器,但这只是 jdbc 传递,我认为您不会获得太多收益。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

Amazon S3 上的 Presto 的相关文章

随机推荐

  • UIPopoverController 在“点击关闭”时关闭 - 如何检测此事件?

    我在导航栏上使用 UIPopover 我有几个 UIBarButtonItems 弹出窗口从其中之一扩展 当弹出窗口被激活时 我将按钮的样式更改为UIBarButtonItemStyleDone 但是 通过按预期点击 UIPopoverCo
  • AWS Lambda Python - 如何将模块从本地文件导入到app.py

    这是使用 Docker 容器进行的基于 SAM 模板的简单部署 文件系统结构 src app py mymodule py 在应用程序 py中 from mymodule import myfunction 结果 调用时 Unable to
  • NSString 字符位置

    NSString url http stackoverflow com questions ask 如何获取第4个 的字符位置 如果您只是想获取网址的最后一部分 您应该可以使用 NSArray items url componentsSep
  • 如何在我的 ASP.NET Core MVC 项目中引用 Microsoft.JQuery.Unobtrusive.Ajax

    我正在尝试使用Microsoft JQuery Unobtrusive Ajax 我首先使用 NuGet 安装该包 正如预期的那样 我能够在我的依赖项中看到它 我的问题是我找不到引用脚本的方法 因此我可以在我的视图中使用它 Here htt
  • MCS/nodejs 中的 URI 参数验证

    需要您的帮助来解决问题 我正在 MCS 中编写一个自定义 API 方法类型为 GET 将参数与 URI 一起传递 service get mobile custom deviceVersion deviceType function req
  • 确保 auto_cast 安全

    GMan https stackoverflow com users 87234 gman已经发布了一个代码可口的auto cast 操作员 https stackoverflow com a 4027734 87234允许在 C 中编写如
  • 用javascript编写的C解释器[关闭]

    Closed 这个问题正在寻求书籍 工具 软件库等的推荐 不满足堆栈溢出指南 help closed questions 目前不接受答案 有没有用 javascript 或 java 编写的 C 解释器 我不需要完整的解释器 但我需要能够逐
  • Spring Security for URL 与 PermitAll() 和过期的身份验证令牌

    我将 Spring 4 与 Spring Security 自定义 GenericFilterBean 和 AuthenticationProvider 实现结合使用 除了用于创建新会话的 URL 之外 我大部分都保护了 URL v2 会话
  • Jasmine 测试给出错误“Uncaught ReferenceError:require 未定义”

    我正在尝试在我的 React 网站上使用 Karma 运行 Jasmine 测试 我的测试之前是有效的 我不确定发生了什么变化 但现在我收到错误 Uncaught ReferenceError require is not defined
  • “顶部:0;左侧:0;底部:0;右侧:0;”是什么意思意思是?

    我正在阅读此指南site http www smashingmagazine com 2013 08 09 absolute horizontal vertical centering css 关于使元素居中的技术 我读了CSS代码 Abs
  • android 将xml转换为json

    我正在使用 java json jar 将传入的 xml 转换为可用的 json 我现在遇到的唯一问题是当 xml 包含它崩溃并显示以下日志 03 26 16 54 56 176 30119 30119 nl avrotros opgeli
  • Scala 的 for 推导式:重要特征还是语法糖?

    当我第一次开始研究 Scala 时 我喜欢 for 推导式的外观 它们似乎有点像我在 Java 5 中习惯的 foreach 循环 但有功能限制和很多漂亮的语法 但当我吸收了 Scala 风格后 我发现每次我可以使用 for compres
  • Powershell 获取超过 x 天的文件并移动它们

    我确信这个问题之前可能已经被问过一百万次了 我对 Power Shell 非常陌生 想问问我这样做是否正确 在目录中 我们有很多文件类型 我想要完成的任务是仅移动超过一个月的 PDF 文件 甚至不要碰其他文件扩展名 文件夹中的扩展名是 pd
  • Spring事务管理器是否将连接绑定到线程?

    我找到了以下线程 JdbcTemplate 与 TransactionManager 到底如何协同工作 https stackoverflow com questions 2250754 how exactly jdbctemplate w
  • 为什么要使用处理程序?

    我在一个非常基本的处理程序教程中遇到了这段代码 代码工作正常 但我不明白为什么我必须使用 HandlerprogressDialog dismiss 我删除了处理程序部分并放置progressDialog dismiss in the ru
  • 是否可以在 C++ 运行时动态创建函数?

    C 是一种静态的编译语言 模板在编译时解析等等 但是是否有可能在运行时创建一个函数 该函数未在源代码中描述 并且在编译期间未转换为机器语言 以便用户可以向其抛出源代码中未预期的数据 我知道这不可能以直接的方式发生 但肯定是可能的 有很多编程
  • 如何使用 Bootstrap 3 在下拉列表中选择默认值?

    我想添加一个下拉菜单来选择城市 但不知道如何在选择之前选择默认值 我正在使用 Bootstrap 3 这是 HTML 标记 div class btn group a class btn btn primary dropdown toggl
  • Android-Ndk 与交叉编译?两者都可以,但是当时需要 Android NDK 做什么呢?

    我可以交叉编译任何 C C 应用程序 静态链接 Linux 库并在 Android 上运行 那么 Android ndk 的需求是什么 Android ndk 将我们限制为 Bionic 它具有 gnu libc 的一小部分 直接交叉编译应
  • UIImage 的 jpg 或 png ——哪个更有效?

    我从相机胶卷中抓取一张图像 然后使用它一段时间 并将其以 PNG 格式保存到 iPhone 的磁盘上 我遇到了奇怪的崩溃 可能是由于内存不足 如果我将其保存为 PNG 或 JPG 假设我选择注释来降低 JPG 情况下的质量 会有什么不同吗
  • Amazon S3 上的 Presto

    我正在尝试在 Amazon S3 存储桶上使用 Presto 但在 Internet 上没有找到太多相关信息 我已经在微型实例上安装了 Presto 但我无法弄清楚如何连接到 S3 有一个桶 里面有文件 我有一个正在运行的 hive 元存储