amazonathena

调用 StartQueryExecution 操作时出现错误“请求中包含的安全令牌无效”UnrecognizedClientException

我在使用 athena 凭证在 redash 中设置数据源连接时遇到错误我在 athena 中有有效的访问权限可以运行查询并从 S3 获取日志现在我想将 athena 与 redash 集成所以我收到错误调用 StartQuery

amazons3 amazonathena redash

Apache 超集：无法从 Athena 读取元数据

我正在尝试从超集访问 Athena 连接成功并且可以在 SQL 编辑器中看到所有架构和表启用在 SQL 实验室中公开此数据库在 SQL 编辑器上加载元数据时它返回以下错误获取表元数据时发生错误在 Athena 上它运行以下查询

amazonathena apachesuperset

AWS Athena 扁平化来自嵌套 JSON 源的数据

我想从 Athena 中的嵌套 JSON 创建一个表描述的解决方案here http docs aws amazon com athena latest ug json html使用 hive Openx JsonSerDe 等工具尝试在

amazonwebservices hive presto amazonathena

使用 pyarrow 与 pyspark 创建的 parquet 文件是否兼容？

我必须分两步将 JSON 中的分析数据转换为 parquet 对于大量现有数据我正在编写 PySpark 作业并执行 df repartition partitionby write partitionBy partitionby mod

python awslambda parquet amazonathena pyarrow

Athena date_parse 用于具有可选毫秒字段的日期

我在 S3 中有日期使用它创建了 Athena 表我在 S3 中有一些 json 格式的日期条目在运行查询时 Athena 不接受这些条目作为日期或时间戳使用 AWS Athena 它使用 Prestodb 作为查询引擎示例 js

sql amazonwebservices amazonathena presto

您可以在 Amazon Athena 中创建视图吗？

是否可以在 Amazon Athena 中创建视图由于外部表本质上是存储在 S3 上的文件中的数据的元数据因此不涉及任何转换因此您无法处理数据不一致问题通常这可能会导致表被定义为包含大量字符串字段您能否在外部表的顶部创建一个包

amazonathena

Presto/Athena 中嵌套日期分区的比较查询

我将 parquet 数据存储在 S3 上以 Hive 理解的格式进行分区 s3

hive presto amazonathena

AWS Glue：爬网程序将时间戳误解为字符串。 GLUE ETL 旨在将字符串转换为时间戳，使它们为 NULL

我一直在玩AWS Glue按照教程进行一些快速分析here https aws amazon com blogs big data build a data lake foundation with aws glue and amazon

amazonwebservices amazons3 amazonathena awsglue

在 AWS Glue pySpark 脚本中使用 SQL

我想使用 AWS Glue 将一些 csv 数据转换为 orc 我创建的 ETL 作业生成了以下 PySpark 脚本 import sys from awsglue transforms import from awsglue utils

amazonwebservices PySpark apachesparksql amazonathena awsglue

当我们从 s3 中的 csv 文件读取数据并在 aws athena 中创建表时如何跳过标题。

我正在尝试从 s3 存储桶读取 csv 数据并在 AWS Athena 中创建一个表我的表在创建时无法跳过 CSV 文件的标题信息查询示例 CREATE EXTERNAL TABLE IF NOT EXISTS table name e

csv amazonwebservices amazons3 amazonathena

既然QuickSight可以直接查询S3，那么什么时候我们需要使用Athena作为QuickSight的数据源呢？ [关闭]

Closed 这个问题是基于意见的 help closed questions 目前不接受答案可能我错过了一些东西但我无法理解如果我将 Athena 与 QuickSight 连接而不是直接将 QuickSight 连接与 S3 我会得

amazons3 amazonathena amazonquicksight

解析 AWS Athena/AWS Glue 目录中某一列中包含换行符的 csv 文件

我有如下示例数据 id log code sequence 100 sample lt gt lt gt O sample PILE UP 3 sample 20 7 M 101 sample 4 52 sample CM 21 7 M 1

amazonwebservices amazonathena awsgluedatacatalog

将 Unix 纪元时间转换为扩展 ISO8601

我有 3 个表我想使用日期来处理但是其中一个表包含 unix 纪元格式的日期以下是 3 个字段的示例 Table1 2017 02 01T07 58 40 756031Z Table2 2017 02 07T10 16 46Z Tab

datetime Hadoop presto amazonathena

当输入数据格式更改时，Athena 将数据放入错误的列中

我们有一些管道分隔的 txt 报告进入 S3 中的一个文件夹我们在其中运行 Glue 爬网程序来确定 Athena 中的架构和查询报告的格式最近发生了变化因此中间有两个新列旧文件 Columns A B C D E F Data a

amazonwebservices amazonathena awsglue

日期列与字符串的 Athena 分区投影

我希望使用 Athena Partition Projection 来分析来自 AWS 应用程序负载均衡器的日志文件和 Firehose 发出的日志 S3 中的数据以年月日为前缀也可能以小时为前缀我已经能够使用消防水带示例 http

amazonwebservices amazonathena

如何使用python中的lambda函数在通过S3连接的AWS athena中进行查询

我将 csv 文件保存在 S3 存储桶中我可以使用AWS Athena查询S3的数据有什么方法可以将 lambda 函数连接到 athena 并从 lambda 函数查询数据请帮忙 Thanks 正如 Chris Pollard 所说

python amazonwebservices amazons3 boto3 amazonathena

如何在sql中找到运行序列的峰值和谷值

我在 athena 中有一个数据集因此出于此目的您可以将其视为 postgres 数据库数据样本可以在这里看到sql小提琴 http www sqlfiddle com 17 4b3732 2 这是一个示例 create table

sql amazonathena presto

在 R 中，即使安装了 Boto3，也没有 Boto3 连接 Athena 时出现错误

我正在尝试从 R 连接到 Athena 设置 RAthena 并连接后我收到此错误 Error Boto3 is not detected please install boto3 using either pip install bot

python r boto3 amazonathena pyathena

(AWS) Athena：查询结果似乎太短

我的 Athena 查询的结果似乎太短试图找出为什么 Setup 胶水目录尺寸为 118 6 G 数据以 CSV 和 JSON 格式存储在 S3 中 Athena Query 当我查询整个表的数据时每次查询只得到 40K 条结果一

amazonwebservices amazons3 amazonathena awsglue

如何处理 AWS Athena 中的嵌入换行符

我在 AWS Athena 中创建了一个表如下所示 CREATE EXTERNAL TABLE IF NOT EXISTS default test line breaks col1 string col2 string ROW FORM

amazonwebservices amazonathena