如何获取 S3 存储桶中所有不同前缀的列表？

2023-12-14

如果我有如下目录结构并且前缀是/folder1，

/folder1/folder11/folder12/folder13/*.files
               /folder21/folder22/folder23/*.files
               /folder31/folder32/*.files

我想动态循环这些目录，以便分别读取每个叶文件夹中的文件，即我需要一个列表

[
 /folder1/folder11/folder12/folder13/, 
 /folder1/folder21/folder22/folder23/,
 /folder1/folder31/folder32/
]

除了递归地循环每个前缀、获取下一级前缀、连接、获取下一级等等，直到到达最后一个（叶）文件夹之外，是否有更好的方法来获取它？

列出来自 Amazon S3 的对象时，如果您指定Delimiter='/'，那么它将返回一个列表CommonPrefixes。这实际上是给定子目录的列表Prefix.

但是，我建议您不要考虑目录。相反，只需循环遍历all对象并查看Key了解物体的路径。

如果您只想要包含文件的路径列表，请使用以下命令：

import boto3

BUCKET = 'my-bucket'

s3_resource = boto3.resource('s3')
folders = set()

# Find paths of all non-empty objects (to exclude zero-length 'folder' objects)
for object in s3_resource.Bucket(BUCKET).objects.all():
    if object.size > 0 and '/' in object.key:
        folders.add(object.key[:object.key.rfind('/')])

print (folders)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

amazonwebservices

amazons3

boto3

pythons3fs

如何获取 S3 存储桶中所有不同前缀的列表？的相关文章

ipdb 和 pdb++ 之间的区别？

Python 有一个名为 pdb 的默认调试器但社区创建了一些替代品其中两个是ipdb https github com gotcha ipdb and pdb https github com pdbpp pdbpp 它们似乎迎合了相
Celery计划任务中的打印语句不会出现在终端中

当我跑步时celery A tasks2 celery worker B我想看到每秒打印芹菜任务目前没有打印任何内容为什么这不起作用 from app import app from celery import Celery from
带有指针数组的 cython

我在 python 中有一个 numpy ndarrays 列表具有不同的长度并且需要非常快速地访问 python 中的列表我认为指针数组就可以解决问题我试过 float type t list of arrays no of ar
如何使用 pandas 选择所有非 NaN 列和非 NaN 最后一列？

如果标题有点令人困惑请原谅我假设我有test h5 下面是使用读取该文件的结果df read hdf test h5 testdata 0 1 2 3 4 5 6 0 123 444 111 321 NaN NaN NaN 1 12 2
带括号的上下文管理器

我试图了解新的新内容带括号的上下文管理器Python 3 10 中的功能新功能中的顶部项目here https docs python org 3 10 whatsnew 3 10 html 我的测试示例是尝试编写 with open f
帮助需要在可选条件下编写正则表达式[关闭]

我有一个日志文件包含如下内容 log Using data from yyyy mm dd 2011 8 3 0 files queued for scanning Warning E test H ndler pdf File not F
使用信号时出现 django TransactionManagementError

我有一个与 django 的用户和 UserInfo 一对一的字段我想订阅用户模型上的 post save 回调函数以便我也可以保存 UserInfo receiver post save sender User def saveUse
有条件填写 pandas 数据框

我有一个数据框df列中包含浮点值A 我想添加另一列B这样 B 0 A 0 for i gt 0 B i if np isnan A i then A i else Step3 B i if abs B i 1 A i B i 1 lt 0
在 keras 中使用自定义张量流操作

我在张量流中有一个脚本其中包含自定义张量流操作我想将代码移植到 keras 但我不确定如何在 keras 代码中调用自定义操作我想在 keras 中使用tensorflow 所以到目前为止我发现的教程描述了与我想要的相反的内容 htt
Pyinstaller --onefile 警告文件已存在但不应存在

跑步时Pyinstaller onefile 并开始得到结果 exe 会出现多个弹出窗口并显示以下警告 WARNING file already exists but should not C Users myuser AppData L
使用 ecs-cli 在 AWS 上部署 docker 时遇到问题

我在 ECS 上有一个存储库已使用 ecs cli 创建了一个集群 ecs cli configure region us west 2 profile
当 DetailView 遇到时更新模型字段。 [姜戈]

我有一个类似的 DetailViewviews py views py class CustomView DetailView context object name content model models AppModel templa
如何在matplotlib中基于x轴更改直方图颜色

我有根据 pandas 数据框计算出的直方图我想根据 x 轴值更改颜色例如 If the value is 0 the color should be green If the value is gt 0 the color shoul
使用python中的mysql连接器正确从mysql数据库获取blob

当执行以下代码时 import mysql connector connection mysql connector connect connection params here cursor connection cursor curso
x11 - 导入错误：没有名为“kivy.core.window.window_x11”的模块

目前我正在尝试构建一个我通过 buildozer 用 Python 和 Kivy 编写的应用程序无论我在做什么我都会遇到 window x11 的问题即使我在代码中注释掉所有与 Windows 相关的内容或执行本文中描述的所有操作这
请求response.iter_content()获取不完整的文件（1024MB而不是1.5GB）？

您好我一直在使用此代码片段从网站下载文件到目前为止小于 1GB 的文件都很好但我注意到 1 5GB 文件不完整 s is requests session object r s get fileUrl headers headers
在 scrapy 中将基本 url 与结果 href 结合起来

下面是我的蜘蛛代码 class Blurb2Spider BaseSpider name blurb2 allowed domains www domain com def start requests self yield self ma
在 Tensorflow 2.0 中的简单 LSTM 层之上添加 Attention

我有一个由一个 LSTM 和两个 Dense 层组成的简单网络如下所示 model tf keras Sequential model add layers LSTM 20 input shape train X shape 1 trai
如何使用 Python 将我的 GoPro Hero 4 相机直播连接到 openCV？

我在尝试从我的新 GoPro Hero 4 相机捕获实时流并使用 openCV 对其进行一些图像处理时遇到麻烦这是我的试用创建的窗口上没有显示任何内容 import cv2 import argparse import time imp
Selenium Python 使用代理运行浏览器[重复]

这个问题在这里已经有答案了我正在尝试编写一个非常简单的脚本该脚本从 txt 文件获取代理不需要身份验证并用它打开浏览器然后沿着代理列表循环此操作一定次数我确实知道如何打开 txt 文件并使用它我的主要问题是让代理正常工作我见

随机推荐

如何使用 Ruby 将阿拉伯/波斯数字翻译成英语？

如何将一些具有阿拉伯波斯数字的字符串转换为英语就像如果我有 str1 str2 12 str3 some string that contains persian digits like 是否有任何函数将其编码为英语如果字符串包含这样
调用局部视图

我有一个渲染两个下拉列表的视图下拉列表的控制器工作正常他们调用存储库类中的方法来进行数据库选择在下拉列表下方我尝试在部分视图中呈现数据表以响应下拉列表选择视图中的下拉菜单使用单个模型 model BudgetDemo Model
将数据表中的行选择限制为 3

我目前正在使用 jQuery 数据表插件想知道是否有任何方法可以将行选择限制为 3 现在用户可以选择无限数量的行这是我的代码的 jsfiddle http jsfiddle net EfFA2 JS document ready fun
Ingress 与负载均衡器

我对 Kubernetes 中 Ingress 和 Load Balancer 的角色很困惑据我了解 Ingress 用于将来自互联网的传入流量映射到集群中运行的服务负载均衡器的作用是将流量转发到主机在这方面 ingress 与负载均
如何在 SVG 中不缩放图像

所以我有一个 SVG 图像如下所示
Vuetify，如何设置默认道具

我已经开始使用 Vuetify 但我正在寻找一种修改某些组件上的默认 props 的方法有没有办法做到这一点即不必不断地写
“]”附近的语法不正确。？

我已经对我的 sql 进行了一些调试但我无法弄清楚我遇到的令人抓狂的错误我已将其缩小到几行我看不出问题是什么请有人给我一些帮助我收到这个错误我在这里2 消息 102 第 15 级状态 1 第 1 行附近语法不正确我在这里3
如何将 Font Awesome 图标添加到输入字段？

如何使用 Font Awesome 中包含的搜索图标进行输入我的网站上有一个搜索功能基于 PHPmotion 我想将其用于搜索这是代码 div div
Java Restful服务eclipse tomcat HTTP错误404

我尝试跟上 java 休息服务所以我找到了一些教程它们的解释总是相同的但我无法让它运行我在eclipse中制作了2 5版本的Dynamic Web Project和Tomcat 7 0 然后我将以下 jar 加载到 WEB INF
Spring Security - 如何启用方法安全注释？

StackOverflow 上有很多类似的问题但我找不到任何答案我有 web xml 像
在 Python 中创建 jTDS 连接字符串

我正在尝试使用 Python 建立 jTDS 连接谁能帮我完成这个任务吗在 SQL Server 中我通常使用以下连接字符串进行连接 jdbc jtds sqlserver DBServer port DBInstance useNT
这个方法怎么给我一个-61错误？

这是我正在使用的一个名为 Mirth 的应用程序但它似乎来自 Apache Commons 库内部的一个方法该方法检查某些内容是否确实是 Base64 编码的所有文档都说唯一的返回是 true 或 false 那么我怎么得到 61 呢
任何用于显示来自相机的实时图像的快速 Python GUI

我正在尝试显示 1394 相机的实时图像目前我的代码能够从相机循环获取图像并且我正在寻找任何可以动态更新的快速 GUI 作为单独的线程我可以在 PyQt 中使用 QThreads 来做到这一点但是有没有任何建议或更快的方法来做到这
如何从 unicode (utf-8) csv 文件导入 numpy 数组

我并不是想聪明或快速地做到这一点只是想完全做到这一点我有一个如下所示的文件 cat all user token counts csv 5raphaels in 15 5raphaels for 15 5raphaels unless
应用内购买是否适用于电子书/有声读物？

我们是一家销售精装书电子书和有声读物的书店我们有一个网站接受客户使用信用卡进行在线支付我们还有一个 iOS 和 Android 应用程序用户可以在其中阅读收听购买的书籍现在我们想通过我们的 iOS 本机应用程序以及将来的 A
将 Wordpress 与 Symfony 集成

我有一个用 Symfony 1 2 构建的网站我正在尝试将 Wordpress 2 8 4 集成到其中以支持我的博客我按照以下说明进行操作http www theodo fr blog 2009 03 integrate wordpre
Google Cloud Messaging 中泄露的 IntentReceiver

我已经在我的应用程序中实现了 GCM 并且正在使用GSM注册器按照建议here 不我在 logcat 中收到错误 7 02 23 35 15 830 E ActivityThread 10442 Activity com abc xyz
如何在nativescript中使用原生android小部件类型定义？

我通过添加安装了平台定义 tns platform declarations 2 5 2 但是当我使用中的定义时tns platform declarations android d ts我无法访问 API 的某些部分例如我无法访问a
Python数字格式化[重复]

这个问题在这里已经有答案了可能的重复字符串格式选项优点和缺点有什么区别 2f x and 2f format x 我对应该使用哪种方法以及哪个版本的 Python 有点困惑一般来说您想使用第二种形式 format 它是较新的另
如何获取 S3 存储桶中所有不同前缀的列表？

如果我有如下目录结构并且前缀是 folder1 folder1 folder11 folder12 folder13 files folder21 folder22 folder23 files folder31 folder32 file

如何获取 S3 存储桶中所有不同前缀的列表？

如何获取 S3 存储桶中所有不同前缀的列表？ 的相关文章

随机推荐

热门标签

如何获取 S3 存储桶中所有不同前缀的列表？的相关文章