Python
Java
PHP
IOS
Android
Nodejs
JavaScript
Html5
Windows
Ubuntu
Linux
如何处理 AWS Athena 中的嵌入换行符
我在 AWS Athena 中创建了一个表 如下所示 CREATE EXTERNAL TABLE IF NOT EXISTS default test line breaks col1 string col2 string ROW FORM
amazonwebservices
amazonathena
协助刷新 athena 表中的数据
我编写了从 S3 上的多个外部表读取数据的查询 应用必要的过滤器 连接 然后将结果加载到目标表中以在 Athena 中进行分析 但是 随着源表中的数据刷新 我想刷新目标表 所以我打算删除并重新创建该表 但它似乎不起作用 我能够删除目标表 但
amazonwebservices
amazons3
presto
amazonathena
生成最小和最大日期之间的日期范围 Athena presto SQL 序列错误
我正在尝试使用 Presto SQL Athena 生成一系列日期unnest and sequence类似的东西generate series在 postgres 中 我的桌子看起来像 job name run date A 2021 0
sql
amazonathena
presto
trino
为 athena 选择特定文件
在 Athena 中创建表时 我无法使用特定文件创建表 有没有办法从给定的存储桶中选择以 year 2019 开头的所有文件 例如 s3 bucketname prefix year 2019 csv 文档对此说得很清楚 这是不允许的 Fr
amazonathena
在 Amazon Athena 中显示带有 order by 的分区
我有这样的疑问 SHOW PARTITIONS tablename 结果是 dt 2018 01 12 dt 2018 01 20 dt 2018 05 21 dt 2018 04 07 dt 2018 01 03 这给出了每个表的分区列表
amazonathena
如何从 AWS 中的 Athena 获取结果格式 JSON?
我想从 AWS 中的 Athena 获取结果值格式 JSON 当我从 Athena 中选择时 结果格式如下 test value report 1 test report 2 normal report 3 hard 有没有办法获得 JSO
hive
presto
amazonathena
来自字符串字段的 AWS Athena json_extract 查询返回空值
我在 athena 有一张具有这种结构的表 CREATE EXTERNAL TABLE json test col0 string col1 string col2 string col3 string col4 string ROW FO
json
amazons3
hive
amazonathena
presto
AWS Athena:“HIVE_BAD_DATA:解析列'X'时出错:空字符串”
我想使用 OpenCSVSerde 在 AWS Athena 上基于 CSV 文件创建外部表 CREATE EXTERNAL TABLE table name string value double group string ROW FOR
amazonwebservices
hive
amazonathena
Athena 在 S3 上查询数据的替代方案
我身边有300 GBs的数据S3 假设数据如下 S3 Bucket Country Month Day 1 csv S3 Countries Germany 06 01 1 csv S3 Countries Germany 06 01 2
在 aws athena 中按日期时间查询解析 alb 日志时出错
我已按照链接中提到的步骤在 Athena 中创建 ALB 表 我试图根据日期时间查询日志 但出现以下错误 Query SELECT client ip sum received bytes FROM default alb logs WHE
timestamp
amazonathena
presto
amazonalb
AWS Glue 爬网程序无法提取 CSV 标头
我已经无计可施了 我有 15 个 csv 文件 它们是通过直线查询生成的 例如 beeline u CONN STR outputformat dsv e SELECT gt data csv I chose dsv因为某些字符串字段包含逗
csv
amazonathena
awsglue
无法通过 Amazon Athena 读取 json 文件
尝试在示例 JSON 文件 90MB 上测试 Athena 我已将文件放入 S3 中 并尝试了以下操作 使用 Amazon Glue 爬网 JSON 文件所在的文件夹 一切似乎都按顺序进行 但是当我尝试在 Athena 上查询时 出现 内部
amazonathena
如何配置 AWS Athena 结果的文件格式
目前 Athena 查询结果在 S3 中为 tsv 格式 有没有办法配置 Athena 查询以返回 Parquet 格式的结果 Answer 目前无法直接与 Athena 进行此操作 在配置 Athena 查询结果时 您只能设置查询结果位置
amazonwebservices
csv
amazons3
parquet
amazonathena
Athena 无法使用 OpenCSVSerde 解析日期
我在 S3 上有一个非常简单的 csv 文件 i d f s 1 2018 01 01 1 001 something great 2 2018 01 02 2 002 something terrible 3 2018 01 03 3 0
csv
hive
opencsv
amazonathena
presto
从 athena aws 中单独字段中的整数创建日期
我对 athena 非常陌生 所以请耐心等待 我将数据以整数形式存储在年 月和日的三个单独的列中 如下所示 year month day 2020 7 10 2020 7 11 2020 7 12 我想将这三个字段变成一个日期 我怎么做 提
sql
amazonwebservices
amazonathena
Spark 数据框列命名约定/限制
我现在多次遇到 Py Spark 列名称的默认命名 从收到的 csv 文件导入 的问题 混合大小写和 或 在列名称中 所以我决定找出实际保存的列名 并发现以下内容 这个网站 https medium com an chee why usin
apachespark
hive
PySpark
namingconventions
amazonathena
athena 跳过以下划线开头的键
我正在尝试与 aws athena 合作 对我们存储在 s3 中的 json 文件进行一些查询 因此 我设法创建了一个简单的模式 一切似乎都很好 直到我注意到我的一些文件没有被考虑在内 文件的键是用户 ID 其中一些以 开头 所有这些都在雅
amazonathena
AWS Athena 对于 api 来说太慢了?
计划是从 aws 数据交换获取数据 将其移动到 s3 存储桶 然后通过 aws athena 查询数据 api 一切正常 只是感觉有点慢 无论数据集还是查询 athena 响应时间都不能低于 2 秒 对于 API 来说 这已经太多了 我检查
amazonwebservices
amazonathena
如何在 athena 上的字符串数据类型上提取月份名称
SELECT sales invoice date MONTH DATE TRUNC month CASE WHEN TRIM sales invoice date THEN DATE 1999 12 31 ELSE DATE PARSE
sql
presto
amazonathena
Athena 在不同账户的表之间查询
我可以使用两个不同的 IAM 角色单独访问两个不同的 Athena 表 因为每个角色位于不同的账户中 有没有办法运行从两者中提取的单个查询 即 INNER JOIN 在引擎盖下 Athena 表数据位于 S3 存储桶中 Athena 支持跨
amazoniam
amazonathena
«
1
2
3
4
»