如何通过 Python 将 csv 数据帧上传到 azure？

2024-04-22

我正在使用 Python 和 Pyspark，并且想要将 CSV 文件上传到 azure blob 存储。我已经有一个由代码生成的数据框：df.我想做的是接下来的事情：

# Dataframe generated by code
df

# Create the BlockBlockService that is used to call the Blob service for the storage account
block_blob_service = BlockBlobService(account_name='name', account_key='key') 

container_name ='results-csv'

d = {'one' : pandas.Series([1., 2., 3.], index=['a', 'b', 'c']), 'two' : pandas.Series([1., 2., 3., 4.], index=['a', 'b', 'c', 'd'])}
df = pandas.DataFrame(d)


writer = pandas.ExcelWriter(df, engine='xlsxwriter')

a = df.to_excel(writer, sheet_name='Sheet1', index=False, engine='xlsxwriter')


block_blob_service.create_blob_from_stream(container_name, 'test', a)

我收到错误：

ValueError: stream should not be None.

所以我想将数据帧的内容作为 blob 上传到上面提供的存储位置。有没有办法在不首先在本地计算机中生成 CSV 文件的情况下执行此操作？

我们想要做的是使用dataset.to_csv函数创建一个文件流，然后将该流发送到 azure blob。另一种方法是我们直接将字符串数据集存储到 azure。代码：

    blob_client = service.get_blob_client(container=container_name, blob=local_file_name)
    print(str(dataset.to_csv()))
    blob_client.upload_blob(str(dataset.to_csv()))

这会将文件存储到 blob 中。目前任何其他解决方案都不起作用。现在的问题仍然是 blob 数据不是 csv 格式，这部分我们仍然需要弄清楚。

编辑：添加了以 csv 格式发送的代码

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

Azure

DataFrame

PySpark

blob

如何通过 Python 将 csv 数据帧上传到 azure？的相关文章

如何用spaCy获取依赖树？

我一直在尝试寻找如何使用 spaCy 获取依赖树但我找不到任何有关如何获取树的信息只能在如何导航树 https spacy io usage examples subtrees 如果有人想轻松查看 spacy 生成的依赖关系树一种解决
如何在算术表达式的结果上添加 SQLAlchemy 标签？

我如何将这样的东西翻译成 SQLAlchemy select x y as difference 我知道该怎么做 x label foo 但我不确定在哪里放置下面的 label 方法调用 select table c x table c y
返回不包括指定键的字典副本

我想创建一个函数返回字典的副本不包括列表中指定的键考虑这本词典 my dict keyA 1 keyB 2 keyC 3 致电without keys my dict keyB keyC 应该返回 keyA 1 我想用一行简洁的字典理
为 PyCharm 中的所有配置设置相同的环境变量

我有一个与 Celery 和很多不同的工作人员一起的项目如何避免每次将 PyCharm 中的环境变量复制粘贴到每个运行调试配置有什么方法可以在项目设置中设置它们吗找到解决方案here https stackoverflow com
使用 Python 抓取维基百科数据

我正在尝试从以下内容中检索 3 列 NFL 球队球员姓名大学球队维基百科页面 http en wikipedia org wiki 2008 NFL draft 我是 python 新手一直在尝试使用 beautifulsoup 来
以编程方式将列名称添加到 numpy ndarray

我正在尝试将列名称添加到 numpy ndarray 然后按名称选择列但这不起作用我无法判断问题是在添加名称时出现还是在稍后尝试调用它们时出现这是我的代码 data np genfromtxt csv file delimiter
在 GAE/Python 中放置一次性代码和每次代码的最佳位置在哪里？

我是 Google App Engine 和 Python 的新手我无法理解有关在 Google App Engine 上运行的 Python 应用程序的一些基本问题如果我想要执行代码对于每个传入的请求我应该将其放在哪里我们正在捕
这可能是因为 cuDNN 初始化失败，因此请尝试查看上面是否打印了警告日志消息。 [操作：Conv2D]

我在 anaconda 中安装了 TensorFlow GPU 2 0 当我安装它并导入包然后运行我的 CNN 模型时它工作正常但当我尝试运行训练模型时出现错误这是我的错误报告 Epoch 1 50 UnknownError Tr
如何在 Keras 中使用部分输入进行训练，其余部分用于损失函数

我是 Keras 新手正在尝试实现神经网络机器学习模型输入张量看起来像 X1 X2 和输出 Y 注意 X1 和 X2 是相关的在模型中只有 X1 将用于训练但 X1 和 X2 都将传递给损失函数该损失函数是 X1 X2 y pr
别碰我的女人

我讨厌的一件事迪斯图尔斯 http docs python org distutils 我猜他是邪恶的人他这样做了 https github com python cpython blob 300dd552b15825abfe0e367a
将具有不同大小的行的数据加载到 Numpy 数组中

假设我有一个包含如下数据的文本文件 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 如何将它加载到 numpy 数组中使其看起来像这样 1 2 3 4 5 0 6 7 8 0 0 0 9 1
如果 node_modules 目录存在，Azure 模拟器无法启动 Web 角色

我想我只是偶然发现了一个非常奇怪的问题我有一个相当大的解决方案包括一个具有 3 个角色两个工作角色和一个 Web 角色的 Azure 项目 Web角色基于asp net mvc和web api 昨天尝试 gulp 用于编译和捆绑较少的
如何将reportlab与Google应用程序引擎一起使用

我无法在谷歌应用程序引擎下正确导入reportlab 根据以下guide http blog notdot net 2010 04 Generating PDFs on App Engine Python and introducing M
Docker 日志中的 Python 异常标记为流：stdout

我想解析和处理来自 docker 容器的所有错误但当我期望 stderr 时 Python 异常标记为 stdout 举个简单的例子app py raise Exception 然后我在 docker 容器中运行这个文件但在 var l
Python：如何从文件中的一行读取字符并将它们转换为浮点数和字符串，具体取决于它们是数字还是字母？

我有一个如下所示的文件 1 1 C C 1 9873 2 347 3 88776 1 2 C Si 4 887 9 009 1 21 我想逐行读取文件的内容当我使用的行上只有数字时 for line in readlines file d
Scikit Learn - K-Means - 肘部 - 标准

今天我想学习一些关于 K means 的知识我已经了解该算法并且知道它是如何工作的现在我正在寻找正确的 k 我发现肘部准则作为检测正确的 k 的方法但我不明白如何将它与 scikit learn 一起使用在 scikit learn
向伪 shell (pty) 发出命令

我尝试使用 subprocess popen os spawn 来运行进程但似乎需要伪终端 import pty master slave pty openpty os write master ls l 应该发送 ls l 到从属终端
SpaCy 中的自定义句子边界检测

我正在尝试在 spaCy 中编写一个自定义句子分段器它将整个文档作为单个句子返回我编写了一个自定义管道组件它使用以下代码来执行此操作here https github com explosion spaCy issues 1850 但
如何使用 FastAPI 在 HTMX 前端中使用 HX-Redirect？

我试图在登录后在前端重定向我像这样从我的 htmx 前端发出请求
bool() 和operator.truth() 有什么区别？

bool https docs python org 3 library functions html bool and operator truth https docs python org 3 library operator htm

随机推荐

基于订阅的 Web 服务业务/网站的最佳框架？ [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我们正在开发一项新的网络服务该服务对于低流量用户免费对于高流量用户则基于订阅大多数用户可能会通过
Spring Integration DSL - 可访问标头的出站网关

我在 Spring 集成方面遇到了问题我正在使用 Spring Boot 1 4 0 RELEASE Spring Integration 4 3 1 RELEASE Spring Integration DSL 1 2 0 M1 我正在
gcc 链接的默认库？

假设我有一个非常简单的 C 文件称为 foo c int main printf foo return 0 现在我调用 gcc gcc foo c 当我调用 gcc 时没有选项如上面的示例默认链接哪些库以及它们位于何处在 Mac
为什么 Hibernate Envers 忽略我的自定义 RevisionEntity？

我正在使用 JPA 2 1 由 hibernate 4 2 11 支持和 spring 4 0 2 开发一个应用程序我们正在使用 Envers 来审核项目实体的变更效果很好当我们尝试使用自定义修订实体时问题就出现了正如 Enve
使用凭证进行跨源资源共享

我有一个跨多个子域 example com blog example com 和 app example com 的通用身份验证表单登录表单必须将此数据提交到 example com 无论它显示在哪里所以我想到使用 CORS 但是这样
将选择值关联到 Angular 4 中的 ngModel

我正在使用 Angular 4 尝试将 Value 关联到 ngModel 但得到Null 请帮助我连接ngValue to ngModel
在AVPlayer中获取averagePowerForChannel

我怎样才能得到averagePowerForChannel in AVPlayer为了在我的音乐应用程序上制作音频可视化我已经完成了可视化部分但我卡在了它的引擎实时音量通道中我知道通过使用AVAudioPlayer它可以很容易地使
auto、0 和无 z-index 之间的区别？

有什么区别 z index auto z index 0 no z index at all 以上所有场景均针对div包含两个divs div1 and div2每个都有一个z index这是9 and 10分别封闭的div位于 HTML
分布式版本控制系统[关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案我想和我的程序员同事一起实现分布式版本控制系统他们分散在周围全部使用不同的 IDE 或不使用 IDE 也使用不同的操作系统我对整个场
Matlab更新子图并坚持下去

我在更新子图时遇到问题我将我的问题归结为以下示例 win figure 1 win sub1 subplot 2 2 1 win sub2 subplot 2 2 2 win sub3 subplot 2 2 3 win sub4 sub
无法访问控制器中的获取发布数据：Codeigniter

我正在我的 codeigniter 项目中使用 fetch 发出发布请求请求看起来像这样 fetch myurl mycontroller method POST headers Content Type application json
VSCode 终端任务不使用 zsh 配置文件

我正在尝试在 VSCode 中的窗口加载上运行任务其中终端打开并且nvm use yarn dev默认运行但是运行此 shell 任务似乎不会加载我的 zsh 配置文件我运行任务得到的输出是 The terminal process
Chome 61、ChromeDriver 2.32 单击移动设备模拟器的元素会抛出 WebDriverException：未知错误：元素在该点不可单击

我的测试在 Chrome 60 和 ChromeDriver 2 31 中完美运行但在 Chrome 更新到 61 版本后我必须将 ChromeDriver 更新到 2 32 现在我收到零星的 org openqa selenium W
IFrame 事件在 HTML 中可以正常执行，但在 HTA 中则不行

单击 iframe 内的按钮时此 HTML 文件会显示消息对话框
如何在 Strapi 中安全地设置数据库密码？

Strapi 框架据我了解要求在启动时提供数据库密码通常密码在database js文件像这样 module exports env gt defaultConnection default connections default
托管对象中的标量类型仅适用于 iPhone 5

属性 Latitude 是 LatitudeLongitude 类的标量类型无法为其生成 setter 方法当我为托管对象生成代码时我收到一条消息询问是否需要原始数据类型的标量属性我应该使用它吗我想让这个应用程序与 iPhone
使用php获取两个时间/日期之间的差异？

我想使用 php 找出两个日期之间的时差以分钟为单位其格式为 d m Y H i 14 04 2009 12 15 使用 strtotime 将时间解析为时间戳然后简单地从另一个中减去一个之后您可以使用数学函数获取分钟数天数等
当高阶参数保留时，如何删除模型中的低阶参数？

问题只要高阶参数即交互作用保留在模型中我就无法删除模型中的低阶参数例如主效应参数即使这样做模型也会被重构并且新模型不会嵌套在更高的模型中请参阅以下示例因为我来自我使用的方差分析 contr sum d lt data f
.NET 有成功的 profibus 通信吗？

有没有人聊成功了profibus http www profibus com 来自 NET 应用程序如果您这样做了您使用什么设备卡来完成此操作应用程序是什么以及您是否使用任何类型的预先存在或可用的代码我们没有使用过Profibu
如何通过 Python 将 csv 数据帧上传到 azure？

我正在使用 Python 和 Pyspark 并且想要将 CSV 文件上传到 azure blob 存储我已经有一个由代码生成的数据框 df 我想做的是接下来的事情 Dataframe generated by code df Creat

如何通过 Python 将 csv 数据帧上传到 azure？

如何通过 Python 将 csv 数据帧上传到 azure？ 的相关文章

随机推荐

热门标签

如何通过 Python 将 csv 数据帧上传到 azure？的相关文章