Pandas read_csv 指定 AWS 配置文件

2023-11-27

熊猫（v1.0.5）使用s3fs用于连接 AWS S3 并读取数据的库。默认情况下，s3fs 使用在以下位置找到的凭据~/.aws/credentials文件输入default轮廓。如何指定 pandas 在从 S3 读取 CSV 时应使用哪个配置文件？

Eg.

s3_path = 's3://mybucket/myfile.csv'
df = pd.read_csv(s3_path)

$ cat ~/.aws/credentials
[default]
aws_access_key_id = ABCD
aws_secret_access_key = XXXX
[profile2]
aws_access_key_id = PQRS
aws_secret_access_key = YYYY
[profile3]
aws_access_key_id = XYZW
aws_secret_access_key = ZZZZ

Edit :

当前的黑客/工作解决方案：

import botocore
import s3fs
session = botocore.session.Session(profile='profile2')
s3 = s3fs.core.S3FileSystem(anon=False, session=session)
df = pd.read_csv( s3.open(path_to_s3_csv) )

上述解决方案的唯一问题是您需要导入 2 个不同的库并实例化 2 个对象。保持问题的开放性，看看是否有另一种更干净/简单的方法。

df = pd.read_csv(s3_path, storage_options=dict(profile='profile2'))

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

pythons3fs

Pandas read_csv 指定 AWS 配置文件的相关文章

指定的可执行文件不是该操作系统平台的有效应用程序。

我不断收到错误消息System ComponentModel Win32Exception The specified executable is not a valid application for this OS platform 当
Conda 无法在 Powershell 中激活

我已经在我的 Windows 10 笔记本电脑上安装了 anaconda 我正在尝试激活名为的Python环境pyenv 首先我检查conda env list在我的笔记本电脑中这是 powershell 上的输出 PS C Users
pygraphviz，导入错误：未定义的符号：Agundirected

import pygraphviz Traceback most recent call last File
Pandas 过滤 - 非索引列上的 Between_time

我需要过滤掉特定时间的数据 DataFrame 函数 Between time 似乎是执行此操作的正确方法但是它仅适用于数据帧的索引列但我需要原始格式的数据例如数据透视表期望日期时间列具有正确的名称而不是索引这意味着每个过滤器
Ttk Treeview：跟踪键盘选择

这是一个带有 ttk 树视图的 Tk 小部件当用户单击该行时会执行某些功能此处仅打印项目文本我需要的是以下内容最初的重点是文本输入当用户按下 Tab 键时焦点应该转到第一行并且应该执行绑定到 Click 事件的函数当用户使
Python ttk.combobox 强制发布/打开

我正在尝试扩展 ttk 组合框类以允许自动建议我到目前为止的代码运行良好但我想让它在输入一些文本后显示下拉列表而不从小部件的输入部分移除焦点我正在努力解决的部分是找到一种强制下拉的方法在 python 文档中我找不到任何提及这一点
BeautifulSoup 抓取街道地址

我正在使用最底部的代码来获取weblink 以及清真寺名称不过我也想得到面值 and 街道地址请帮助我被困住了目前我得到以下信息 Weblink div class subtitleLink a href http www salat
散景服务器获取鼠标位置

我正在开发一个带有散景 0 12 2 的交互式应用程序它根据特定的交互更新绘图现在我使用滑块来更改图中字形的位置但实际上我想访问鼠标在特定图中的位置数据集是一个多维矩阵张量密集数据每个图在特定位置显示一个维度如果我更改一个
从 python 的单词列表中查找最长的常见单词序列

我搜索了很多解决方案确实发现了类似的问题这个答案 https stackoverflow com questions 21930757 longest repeated substring返回可能不属于输入列表中所有字符串的最长字符序列
为线条指定颜色

我试图在 matplotlib 中绘制可变数量的行其中 X Y 数据和颜色存储在 numpy 数组中如下所示有没有办法将颜色数组传递到绘图函数中这样我就不必采取额外的步骤来单独为每条线分配颜色我是否应该将 RGB 颜色数组转换为另
为什么 1.__add__(2) 不起作用？ [复制]

这个问题已经存在了可能的重复访问 python int 文字方法 https stackoverflow com questions 10955703 accessing a python int literals methods 在P
UTF-8 在 Python 日志记录中，如何？

我正在尝试使用 Python 的日志记录包将 UTF 8 编码的字符串记录到文件中作为一个玩具示例 import logging def logging test handler logging FileHandler home ted
在Python中使用Counter()来构建直方图？

我在另一个问题上看到我可以使用Counter 计算一组字符串中出现的次数所以如果我有 A B A C A A I get Counter A 3 B 1 C 1 但现在我如何使用该信息来构建直方图对于您的数据最好使用条形图而不是直方
如何使用 Misc.imread 将图像分割为红色、绿色和蓝色通道

我正在尝试将图像切片为 RGB 但在绘制这些图像时遇到问题我使用此函数从某个文件夹获取所有图像 def get images path image type image list for filename in glob glob pat
使用 PyQt5 拖放 QLabels

我正在尝试使用 PyQt5 将 Qlabel 拖放到另一个 Qlabel 上 from PyQt5 QtWidgets import QApplication QWidget QToolTip QPushButton QMessageBox
按工作日分组的熊猫 (M/T/W/T/F/S/S)

我有一个 pandas 数据框其中包含 YYYY MM DD arrival date 形式的时间序列作为索引我想按每个工作日周一到周日进行分组以便计算其他日期列是平均值中位数标准差等我最终应该只有七行到目前为止我只知道
有没有办法只从 python 列表中输出数字？

简单的问题 list 1 asdada 1 123131 131 blaa adaraerada 0 000001 34 12451235265 stackoverflow is awesome 我想创建一个list 2这样它只包含数字 l
如何更改 PyGame 中声音或音乐的音量？

如何更改 PyGame 中的音量例如通过设置更改音量我制作了 UI 元素只需要知道如何更改音量即可我知道我说不清楚但你可以理解我请帮忙更改音量取决于您是否正在播放pygame mixer Sound https www pyg
如何在 Windows 上为“flask run”设置环境变量？

我刚刚开始学习 Flask 我一直停留在设置 Flask 环境变量上我不知道如何设置环境变量每当我使用flask run命令我遇到以下错误错误消息无法找到 Flask 应用程序您没有提供 FLASK APP 环境变量并且在当前
如何在Python中从stdin中逐行读取

每个人都知道如何在 C 中计算 STDIN 中的字符但是当我尝试在 python3 中执行此操作时我发现这是一个难题计数器 py import sys chrCounter 0 for line in sys stdin readl

随机推荐

在java中发送电子邮件时抛出javax.mail.AuthenticationFailedException

我是java初学者我想用java发送电子邮件因为我在Java中使用这段代码但我的代码抛出了异常我需要注意为什么这是异常的堆栈跟踪 javax mail AuthenticationFailedException 534 5 7 1
cakephp 一种表单，多个模型，不显示一个模型的验证消息

我有一个注册表单我正在用户和身份表中创建一条记录用户有许多身份表格看起来像这样 fieldset legend legend fieldset
Sql SMO：如何获取数据库物理文件名的路径？

我正在尝试返回数据库的 mdf ldf 文件的物理文件路径我尝试使用以下代码 Server srv new Server connection Database database new Database srv dbName strin
Chrome 渲染颜色的方式与 Safari 和 Firefox 不同

由于某种原因 Chrome 将 FF3A00 渲染为 FF0000 我包含了来自的屏幕截图jsfiddle来说明这一点色度计报告的颜色以及我看到的颜色与 CSS 所说的颜色不同其他颜色也会发生这种情况例如 FFAF00 根据色度计
使用 Assembly.LoadFrom 和 Assembly.Load 混合加载程序集时的奇怪行为

使用混合加载程序集时的奇怪行为Assembly LoadFrom and Assembly Load 我在加载程序集时遇到了奇怪的行为Assembly LoadFrom稍后与Assembly Load 我正在使用加载程序集Assembly
ASP.NET Web API 返回可查询的 DTO？

我使用 ASP NET Web API 构建了一个不错的小 API 但我想从我的上下文实体框架 AsQueryable 返回实体是不正确的因此我将所有内容映射到 DTO 对象然而我不太明白如何保持上下文可查询但仍然只返回 DTO
“计算附加信息”是什么意思？

Eclipse Helios 定期开始运行显示计算附加信息的作业这段时间 Eclipse 非常迟缓几乎无法使用这份工作是做什么的我可以把它关掉吗我只是希望 JDT 团队中有人能够意识到并摆脱它让它运行得更快或者至少将其更改
允许所有远程连接，MySQL

我一直在使用 SQL Server 现在在一个项目中使用 MySQL 使用 SQL Server 如果我们的开发人员知道主机用户名和密码他们就可以连接到本地计算机上的远程数据库不过对于 MySQL 为了让开发人员能够从本地计算机进行
在类构造函数中包含参数是否可以接受？

我正在编写一个 ruby gem 它对于计算文本中单词的出现次数很有用我选择在类构造函数中放置 3 个参数代码可以工作但我想重构它以使其美观根据您的经验作为 API 读取维护使用一个带有没有参数的构造函数和大量 setter
OpenCV：FFMPEG：编解码器不支持标签 0x34363268/'h264'

像在 Mac OS 10 13 6 上一样安装 opencv 后 conda install c conda forge ffmpeg conda install c conda forge opencv 并使用fourcc cv2 Vid
OCaml 类型推断算法如何工作？

我目前正在学习 OCaml 我很好奇 OCaml 如何进行类型推断我知道这是通过一个称为统一的过程完成的我尝试阅读已发表论文中的算法但符号让我失望谁能为我描述一下分步过程实际上可以说统一是算法的实现细节类型系统只是一组规则这
使用 ng-click 在 angularJs 中添加和删除类

我正在尝试如何使用 ng Click 添加课程我已经将我的代码上传到plunker中点击这里查看角度文档我无法弄清楚应该完成的确切方法下面是我的代码片段有人可以引导我走向正确的方向吗 div class block div 控制器
将矩导入 Angular 会出现错误

我收到以下错误 Module node modules moment moment has no exported member default 当我使用 import as moment from moment import defaul
如何在 SQLAlchemy 中加载 SQLite3 扩展？

我构建了一个 SQLite 扩展即 so 库我想使用 SQLAlchemy 在我的应用程序中使用它它是一个 Flask 应用程序但我不认为 Flask 在这里发挥作用该扩展可以从 CLI 加载并且似乎可以工作 sqlite3 SQ
P0522R0如何破码？

今天我正在阅读 clang 的 C 17 支持页面我注意到一些奇怪的事情特点将模板模板参数与兼容的参数相匹配 P0522R0 被标记为部分因为它必须通过开关激活他们的笔记says 尽管是缺陷报告的解决方案但该功能在所有语言版本中默
取消设置字中的最高有效位 (int32) [C]

如何取消设置一个字的最高有效位例如 0x00556844 gt 0x00156844 有一个 builtin clz在 gcc 中但它只计算零这对我来说是不需要的另外我应该如何替换 msvc 或 intel c 编译器的 buil
SQL 查询获取结果集最后一行中所有列值的总和以及行总和（分组依据）

有人可以帮我编写一个查询来获取 TCS 和 TRS 吗 ID Jan Feb Mar TRS 1 4 5 6 15 2 5 5 5 15 3 1 1 1 3 TCS 10 11 12 TCS 总列总和和TRS 总行总和分别是新的列和行
setTimeout 是使用 javascript 执行异步函数的好解决方案吗？

在网上搜索有关异步函数的信息我发现很多文章使用 setTimeout 来完成这项工作 window setTimeout function console log second 0 console log first Output fir
绘制金字塔图

我需要画一个金字塔图如所附的我找到了一个使用 R 但不是 ggplot 的示例here 任何人都可以给我一些使用 ggplot 执行此操作的提示吗谢谢我用了一些解决方法而不是使用 geom bar 而是使用了 geom liner
Pandas read_csv 指定 AWS 配置文件

熊猫 v1 0 5 使用s3fs用于连接 AWS S3 并读取数据的库默认情况下 s3fs 使用在以下位置找到的凭据 aws credentials文件输入default轮廓如何指定 pandas 在从 S3 读取 CSV 时应使用哪个

Pandas read_csv 指定 AWS 配置文件

Pandas read_csv 指定 AWS 配置文件 的相关文章

随机推荐

热门标签

Pandas read_csv 指定 AWS 配置文件的相关文章