将 Matplotlib 输出保存到 Databricks 上的 Blob 存储

2024-05-08

我正在尝试使用此处提供的方法将 matplotlib 图形写入 Azure blob 存储：将 Matplotlib 输出保存到 Databricks 上的 DBFS https://stackoverflow.com/questions/57203817/saving-matplotlib-output-to-dbfs-on-databricks/60188964?noredirect=1#comment106459449_60188964.

但是，当我将代码中的路径替换为

path = 'wasbs://[email protected] /cdn-cgi/l/email-protection/'

我收到这个错误

[Errno 2] 没有这样的文件或目录：'wasbs://[电子邮件受保护] /cdn-cgi/l/email-protection/'

我不明白这个问题...

根据我的研究，您无法将 Matplotlib 输出直接保存到 Azure Blob 存储。

您可以按照以下步骤将 Matplotlib 输出保存到 Azure Blob 存储：

Step 1:您需要首先将其保存到 Databrick 文件系统 (DBFS)，然后将其复制到 Azure Blob 存储。

将 Matplotlib 输出保存到 Databricks 文件系统 (DBFS)：我们使用以下命令将输出保存到 DBFS：plt.savefig('/dbfs/myfolder/Graph1.png')

import pandas as pd
import matplotlib.pyplot as plt

df = pd.DataFrame({'fruits':['apple','banana'], 'count': [1,2]})
plt.close()
df.set_index('fruits',inplace = True)
df.plot.bar()
plt.savefig('/dbfs/myfolder/Graph1.png')

Step 2:将文件从 Databricks 文件系统复制到 Azure Blob 存储。

有两种方法可将文件从 DBFS 复制到 Azure Blob 存储。

方法 1：直接访问 Azure Blob 存储

通过设置“Spark.conf.set”直接访问 Azure Blob 存储，并将文件从 DBFS 复制到 Blob 存储。

spark.conf.set("fs.azure.account.key.< Blob Storage Name>.blob.core.windows.net", "<Azure Blob Storage Key>")

使用 dbutils.fs.cp 将文件从 DBFS 复制到 Azure Blob 存储：

dbutils.fs.cp('dbfs:/myfolder/Graph1.png', 'wasbs://<Container>@<Storage Name>.blob.core.windows.net/Azure')

方法 2：将 Azure Blob 存储容器挂载到 DBFS

您可以将 Blob 存储容器或容器内的文件夹装载到 Databricks 文件系统 (DBFS)。挂载是指向 Blob 存储容器的指针，因此数据永远不会在本地同步。

dbutils.fs.mount(
  source = "wasbs://[email protected] /cdn-cgi/l/email-protection/Azure",
  mount_point = "/mnt/chepra",
  extra_configs = {"fs.azure.sas.sampledata.chepra.blob.core.windows.net":dbutils.secrets.get(scope = "azurestorage", key = "azurestoragekey")})

使用 dbutils.fs.cp 将文件复制到 Azure Blob 存储容器：

dbutils.fs.cp('dbfs:/myfolder/Graph1.png', '/dbfs/mnt/chepra')

通过执行方法 1 或方法 2，您可以成功将输出保存到 Azure Blob 存储。

欲了解更多详情，请参阅“Databricks - Azure Blob 存储 https://docs.databricks.com/data/data-sources/azure/azure-storage.html".

希望这可以帮助。如果您还有任何疑问，请告诉我们。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

将 Matplotlib 输出保存到 Databricks 上的 Blob 存储的相关文章

matplotlib 后端对渲染格式有什么限制？

我对 matplotlib 使用的后端在确定可以呈现哪些格式方面所扮演的角色感到困惑例如文件说 http matplotlib org faq usage faq html what is a backend agg 后端生成 PNG
python matplotlib 使用按钮事件添加和删除图形中的文本

我试图在调用button press event 时将文本添加到鼠标指针位置的图形中并在调用button release event 时将其删除我已成功添加文本但无法将其删除这是我使用的代码的一部分 def onclick even
Tkinter：通过多处理启动进程会创建不需要的新窗口

我计划围绕数值模拟编写一个小型 GUI 这就是我现在使用 Tkinter 的原因模拟应在单独的进程中从 GUI 启动为了玩一下我定义了一个函数 random process 来生成成对的 randn 数字这应该是一个真正的模拟过程
当传递命名参数时，matplotlib 不会绘图

有人可以解释这种行为吗 import matplotlib pyplot as plt plt plot x 0 05 0 1 0 15 y 102 211 393 plt show import matplotlib pyplot as
seaborn 箱线图的子图

我有一个像这样的数据框 import seaborn as sns import pandas as pd pylab inline df pd DataFrame a one one two two one two one one one
为什么 matplotlib 默认不保存整个图形？

这可能是几乎每个使用 matplotlib 的人都会遇到的问题如果您生成一个图形通常包含轴标签和图例并使用默认设置保存它您将获得裁剪后的图像演示代码 import matplotlib pyplot as plt def plot
如何在seaborn热图标签中使用科学计数法？

我正在尝试在 python 中使用seaborn 获取热图不幸的是即使数字非常大它也没有使用科学记数法我想知道是否有任何简单的方法可以转换为科学记数法或任何其他合理的格式这是显示问题的一段代码 import seaborn as
避免“散点/点/蜂群”图中的数据点重叠

使用绘制点图时matplotlib 我想偏移重叠的数据点以使它们全部可见例如如果我有 CategoryA 0 0 3 0 5 CategoryB 5 10 5 5 10 我想要每一个CategoryA 0 数据点并排设置而不是彼此重叠
删除流图（matplotlib）而不清除图形

到目前为止我总是在这里找到帮助我长期以来一直在寻找问题的解决方案现在我可能已经失明了我希望你能帮助我解决这个问题我已经构建了一个 python 程序可以绘制方向场颤动或流图由于图表中可能还有其他数据例如轨迹我不能只是清除
matplotlib xkcd 无法在 Mac 上运行

我在可视化 matplotlib xkcd 图时遇到小问题通过简单地尝试执行上找到的示例matplotlib org http matplotlib org examples showcase xkcd html 当我执行 xkcd py
如何在 Seaborn 中的热图轴上表达类

我使用 Seaborn 创建了一个非常简单的热图显示相似性方阵这是我使用的一行代码 sns heatmap sim mat linewidths 0 square True robust True sns plt show 这是我得到的
Matplotlib loglog 的错误刻度/标签（双轴）

我正在使用 matplotlib 创建对数图如下图所示默认刻度选择得很糟糕充其量是这样右边的 y 轴甚至根本没有在线性等效中确实如此而两个 x 轴都只有一个有没有办法获得合理数量的带有标签的刻度 without为每个情节手动指
将自定义误差线添加到 seaborn regplot 和 residplot

有没有一种方法可以将自定义错误栏添加到seaborn regplot和residplot中就像使用yerr对matplotlib错误栏所做的那样例子在这里如果我只是添加 yrr 参数就会发生错误 import seaborn as s
matplotlib 图形的乳胶渲染文本中的中心标题

我想将 Matplotlib 图形的标题居中其中在渲染 LaTeX 样式时包含换行符返回在标题中间插入 Latex 的简单返回代码可以工作但不会使其居中从而导致换行符从第一行尴尬地移动 from matplotlib import
Pandas 堆积条形图中元素的排序

我正在尝试绘制有关某个地区 5 个地区的家庭在特定行业赚取的收入比例的信息我使用 groupby 按地区对数据框中的信息进行排序 df df orig groupby District Portion of income value co
更改 3D 图形颜色 (matplotlib)

我使用以下代码在 matplotlib 中绘制了 3D 图形 Previously defines lists of data to plot fig plt figure ax fig add subplot 111 projection
使用 matplotlib 滑块小部件更改图像中的 clim

我几乎没有使用 python 的经验但我正在尝试创建一个简单的脚本该脚本加载图像并使用滑块小部件来调整颜色条的最小值和最大值并相应地重新绘制图像数据我正在尝试遵循这个例子 http matplotlib sourceforge ne
错误：未找到线条魔术函数“%matplotlib”

我刚刚按照 anaconda 的说明在 Mac MacOS 10 7 5 上安装了 IPythonhttp ipython org install html http ipython org install html 没有明显的错误我现在
Seaborn 将 xticks 从 float 更改为 int

我正在绘制一个图表其中seaborn为sns pylab为plt plt figure figsize 10 10 sns barplot y whatever y x whatever x data mydata plt xticks
来自 pandas 数据帧的烛台图，用日期替换索引

此代码给出了带有移动平均线的烛台图但 x 轴位于索引中我需要 x 轴位于日期中需要做什么改变 import numpy as np import pandas as pd import matplotlib pyplot as plt

随机推荐

PostgreSQL 触发器不返回任何内容

我在创建时有一个 PostgreSQL 触发器它基本上将插入重定向到子表中插入记录后我想中止请求以避免重复数据据我所知执行此操作的唯一方法是返回NULL在触发器中问题是我需要返回记录才能获取 ID 如果我回来NULL 我得到 N
DataGridView：如何让回车键添加新行而不是更改当前单元格？

如何让 Enter 键在 Winforms 中起作用DataGridViewTextBoxCell就像在普通 Winform 中一样TextBox 向文本添加新行而不是更改当前单元格嗯我知道如何解决这个问题了首先创建一个类名为C
Node Js：Redis 作业在完成其任务后未完成

希望你们做得很好我在我的 Nodejs 项目中实现了 BullMQ Bull 的下一个主要版本来安排发送电子邮件的作业例如发送忘记密码请求的电子邮件所以我编写了如下所示的代码用户服务 await resetPasswordJo
login_required 装饰器不起作用，flask-Login 允许匿名用户

我装饰了一个方法login required 但令我惊讶的是它不是执行完全允许匿名用户进入打印current user方法内返回
随机打乱列表[重复]

这个问题在这里已经有答案了可能的重复在 C 中随机化 List https stackoverflow com questions 273313 randomize a listt in c sharp 随机播放随机重新排列 List
在 servlet 中的 URL 中使用变量的最简单方法

在 servlet 中的 URL 中使用变量的最简单方法是什么 Eg http somesite com MyServlet ID 这就是所谓的路径信息您可以使用HttpServletRequest getPathInfo http ja
如何在没有 WSGI 的情况下为 Gunicorn 配置 ExecStart？

Systemd 和 Gunicorn 需要某种 wsgi 文件作为最后一个参数ExecStart http docs gunicorn org en latest deploy html highlight ExecStart system
React i18next Backend-Path 在本地和生产环境中不同

我正在使用一个反应应用程序react i18next并加载翻译i18next xhr backend i18n use Backend use initReactI18next passes i18n down to react i18ne
Bash 中的 Shellshock 漏洞背后的行为是有记录的还是有意为之？

最近的一个漏洞 CVE 2014 6271 http web nvd nist gov view vuln detail vulnId CVE 2014 6271 如何Bash http en wikipedia org wiki Bash
leaflet.js 符合 GDPR 的集成

是否有可能以符合 gdpr 的方式使用 leaflet js 原因是 leaflet js 对地图服务器的所有大多数 api 调用都会创建第 3 方 cookie 在访问者决定使用地图 API osm gmaps 等之前 GDPR 法律
如何对 Laravel Mailable 进行断言

在测试中我想使用以下方法对 Mailable 做出一些断言Mail assertSent 像这样 Mail assertSent MyMailable class function mail use user return mail gt
用于预乘 ARGB 的 SSE alpha 混合

我正在尝试编写一个支持 SSE 的 alpha 合成器这就是我想出的首先混合两个 4 像素向量的代码 alpha blend two 128 bit 16 byte SSE vectors containing 4 pre multi
当我通过 shell 脚本创建 .txt 文件时，为什么文件名末尾出现问号？ [复制]

这个问题在这里已经有答案了我正在编写一个 shell 脚本我应该在其中创建 1 个文本文件当我这样做时文件名末尾出现一个问号是什么原因我正在 bash 脚本中尝试以下方法 1 grep ERROR a1 gt text txt
WebView 是否需要 WebViewClient 才能工作？

我正在浏览 android 教程并尝试了WebView例子这就是我最终得到的结果 Web应用程序活动 public class WebAppActivity extends Activity Called when the activit
Play async/await 中会话/上下文丢失

看来await 方法失去上下文 public static action session put key value await someAsyncCall Now for some reason the session doesn t h
scipy.stats....rvs 和 numpy.random 随机抽取之间的区别

看起来是否是相同的分布从中抽取随机样本numpy random比这样做更快scipy stats rvs 我想知道是什么原因导致两者之间的速度差异 scipy stats uniform实际上使用了numpy 这里是stats中对应的函数
共享类与 swagger 生成的类

我有一个包含三个项目的 asp net Blazor VS 解决方案 Shared ASP NET核心API Blazor 网络组件我创建了一堆课程Shared项目和其他两个项目参考了Shared项目到目前为止一切都很好然后我用了S
如何使用sklearn Pipeline和FeatureUnion选择多个（数字和文本）列进行文本分类？

我开发了一个用于多标签分类的文本模型这OneVsRest分类器 http scikit learn org stable modules generated sklearn multiclass OneVsRestClassifier h
async/await 中的 return 语句在哪里

我可能已经让自己陷入了相当不成熟的困惑之中请参考下面的代码控制台应用程序 namespace Tasks101 class Program static void Main string args Program p new Progr
将 Matplotlib 输出保存到 Databricks 上的 Blob 存储

我正在尝试使用此处提供的方法将 matplotlib 图形写入 Azure blob 存储将 Matplotlib 输出保存到 Databricks 上的 DBFS https stackoverflow com questions 57

将 Matplotlib 输出保存到 Databricks 上的 Blob 存储

将 Matplotlib 输出保存到 Databricks 上的 Blob 存储 的相关文章

随机推荐

热门标签

将 Matplotlib 输出保存到 Databricks 上的 Blob 存储的相关文章