AnalysisException：路径不存在：dbfs:/databricks/python/lib/python3.7/site-packages/sampleFolder/data；

2024-03-21

我将以下代码打包到 whl 文件中：

from pkg_resources import resource_filename
def path_to_model(anomaly_dir_name: str, data_path: str):
    filepath = resource_filename(anomaly_dir_name, data_path)
    return filepath
def read_data(spark) -> DataFrame:
    return (spark.read.parquet(str(path_to_model("sampleFolder", "data"))))

我确认whl文件正确包含sampleFolder/data/目录下的镶木地板文件。当我在本地运行它时，它可以工作，但是当我将此 whl 文件上传到 dbfs 并运行时，我收到此错误：

AnalysisException: Path does not exist: dbfs:/databricks/python/lib/python3.7/site-packages/sampleFolder/data;

我确认这个目录实际上不存在：dbfs:/databricks/python 知道这个错误可能是什么吗？

Thanks.

默认情况下，Databricks 上的 Spark 可以处理 DBFS 上的文件。

但是如果你想使用databricks中的spark.read.parquet函数读取文件，你可以使用前缀file:接下来是文件的完整路径例如-

spark.read.parquet('file:/home/user1/file_name')
                    ^^^^

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

Databricks

parquet

pythonwheel

pkgresources

AnalysisException：路径不存在：dbfs:/databricks/python/lib/python3.7/site-packages/sampleFolder/data；的相关文章

Python包不安装子模块

我在 dev 分支中创建了一个具有以下结构的包在验证包安装正确之前不会合并到 main mypackage init py setup py requirements txt module py subpackage one init p
为什么Python有最大递归深度？

Python有最大递归深度但没有最大迭代深度为什么递归受到限制把递归当成迭代来对待而不限制递归调用的次数不是更自然吗我只想说这个问题的根源来自于尝试实现流参见这个问题 https stackoverflow com questi
Pip install 导致此错误“ cl.exe' failed with exit code 2 ”

我已经阅读了有关此错误的所有其他问题但令人沮丧的是没有一个给出有效的解决方案如果我跑pip install sentencepiece在命令行中它给出了以下输出 src sentencepiece sentencepiece wra
如何在Python中的BeautifulSoup4中使用.next_sibling时忽略空行

由于我想删除 html 网站中重复的占位符因此我使用 BeautifulSoup 的 next sibling 运算符只要重复项位于同一行就可以正常工作参见数据但有时它们之间有一个空行所以我希望 next sibling 忽略它
有条件填写 pandas 数据框

我有一个数据框df列中包含浮点值A 我想添加另一列B这样 B 0 A 0 for i gt 0 B i if np isnan A i then A i else Step3 B i if abs B i 1 A i B i 1 lt 0
Django 如何从 ManyToManyField 序列化并列出全部

我正在使用 Django 1 9 1 开发移动应用程序后端我实现了关注者模型现在我想列出用户的所有关注者但目前我不得不这样做我还使用 Django Rest 框架这是我的 UserProfile 模型 class UserProf
对图像使用 Pixellib 自定义训练时出现 input_image 元形状错误

我正在使用 Pixellib 来训练自定义图像实例分割我创建了一个数据集可以在下面的链接中看到数据集 https drive google com drive folders 1MjpDNZtzGRNxEtCDcTmrjUuB1ics
使用 Python 的文本中的词频但忽略停用词

这给了我文本中单词的频率 fullWords re findall r w allText d defaultdict int for word in fullWords d word 1 finalFreq sorted d iterit
在ansible中合并字典

我目前正在构建一个使用 ansible 安装 PHP 的角色并且在合并字典时遇到一些困难我尝试了多种方法来做到这一点但我无法让它像我想要的那样工作 A vars file my default values key value my
如何使用 python 操作系统更改驱动器？

我正在尝试更改当前目录C to Y 我试过 import os os chdir Y 但我不断收到错误消息提示无法找到驱动器本质上我正在寻找相当于 cd d cmd 中的命令你确定吗Y 确实是有效的驱动器号吗 Try os chdir
如何使用 jira-python 设置 fixVersions 字段

我正在尝试使用 jira python 模块 http jira python readthedocs org en latest 更新现有的 JIRA 具体来说我正在尝试设置问题的fixesVersion 列表我已经尝试了一段时间但没
在 MATLAB 中创建共享库

一位研究人员在 MATLAB 中创建了一个小型仿真我们希望其他人也能使用它我的计划是进行模拟清理一些东西并将其变成一组函数然后我打算将其编译成C库并使用SWIG https en wikipedia org wiki SWIG创建一
Floyd-Warshall 算法：获取最短路径

假设一个图由一个表示n x n维数邻接矩阵我知道如何获得所有对的最短路径矩阵但我想知道有没有办法追踪所有最短路径 Blow是python代码实现 v len graph for k in range 0 v for i in range
x11 - 导入错误：没有名为“kivy.core.window.window_x11”的模块

目前我正在尝试构建一个我通过 buildozer 用 Python 和 Kivy 编写的应用程序无论我在做什么我都会遇到 window x11 的问题即使我在代码中注释掉所有与 Windows 相关的内容或执行本文中描述的所有操作这
Flask SQLAlchemy 与 MyPy - 模型类型错误

我遇到了以下组合问题flask sqlalchemy and mypy 当我定义一个新的 ORM 对象时例如 class Foo db Model pass where db是使用创建的数据库SQL炼金术应用于flask app mypy
向量化 numpy bincount

我有一个 2d numpy 数组 A我要申请np bincount 到矩阵的每一列A生成另一个二维数组B由原始矩阵每列的 bincounts 组成A 我的问题是 np bincount 是一个采用一维数组的函数它不是像这样的数组方法B A
如何将 pytest 装置与 django TestCase 一起使用

我如何在TestCase方法类似问题的几个答案似乎暗示我的例子应该有效 import pytest from django test import TestCase from myapp models import Category py
django 组合对两个不同基本模型的查询

我有两个不同的查询集我想将两个查询集合并 q1 tbl nt 123 objects values list id value geometry filter restriction height exclude condition id
Jinja2中获取请求参数

如何检索请求参数a在 Jinja2 模板中 http foo bar a 1 我这个答案有点晚了但其他解决方案并没有真正考虑到您对 Flask 的使用事实上您将 Flask 与 Jinja2 一起使用这使得您的情况与其他框架有点不同
Selenium Python 使用代理运行浏览器[重复]

这个问题在这里已经有答案了我正在尝试编写一个非常简单的脚本该脚本从 txt 文件获取代理不需要身份验证并用它打开浏览器然后沿着代理列表循环此操作一定次数我确实知道如何打开 txt 文件并使用它我的主要问题是让代理正常工作我见

随机推荐

Python 中的循环命名

我最近读过这个问题 https stackoverflow com questions 886955 breaking out of nested loops in java 886979 886979其中有一个关于 Java 中标记循环的
丢失 .idea 文件夹后如何在 Android Studio 中重新创建项目？

我一直试图通过尝试一些东西来了解 Android Studio IDE 的工作原理我从 Google 存储库导入了示例项目之一 Android DataLayer 它附带了一些配置的模块然后我删除了 idea文件夹并想再次打开该项目但
我们可以使用 data.table 按组设置顺序吗？

简单的问题我想用data table setorder在我的 DT 上但我不能按组执行此操作是否可以在此示例中我订购了整个 DT DT data table a rep c C A D B E each 4 b sample 1
在自定义格式化程序中访问 rowObejct

在 jqgrid wikki 中我读到虽然使用 xml 数据类型 rowobject 将不是一个数组在 json 中我使用 rowobject 1 2 等获取了列值但是如何使用 xml 数据类型来实现这一点请提供使用 xml 数
确定在哪个表视图中按下了单元格按钮？

我有像测验这样的表格视图单元格在每个单元格中我都有一个按钮我如何识别按下了哪个单元格按钮也许通过 IndexPath 这就是我将按钮连接到的方式 func tableView tableView UITableView cellFor
带有 SDK 4.2 的 Xcode 始终启动 iPad 模拟器

为什么 Xcode 在更新到 SDK 4 2 后总是在 iPad Simulator 而不是 iPhone 中运行我的应用程序如果我选择 iPhone Simulator 作为活动可执行文件它不会存储我的首选项并在任何新的构建和运行
应用程序关闭后无法保持 Android 服务处于活动状态

我正在尝试生成一个始终保持活动状态的服务即使用户关闭应用程序也是如此根据这些线程当应用程序关闭时保持位置服务处于活动状态 https stackoverflow com questions 21441232 keep location
如何判断在touchesBegan中哪个对象被触摸了？

我知道这是一个非常常见的问题但每个网站上的所有答案都不起作用如果你还是不明白我的意思那么也许这行代码会帮助你理解 void touchesBegan NSSet touches withEvent UIEvent event UITo
有没有办法将 Google Sheets 工作簿中的值绘制到 TradingView pinescript 中？

我正在尝试将 GoogleSheets 工作簿中计算的值绘制在交易视图图表上我无法在 Tradingview 中进行相同的计算因为这些值来自动态网页所以我在 excel 中进行计算并且想知道是否可以以某种方式将这些值发送到 Trad
PySpark 时间戳的毫秒数

我试图获取两个时间戳列之间的差异但毫秒消失了如何纠正这个问题 from pyspark sql functions import unix timestamp timeFmt yyyy MM dd HH mm ss SSS data 1
在 C# 中实现套接字侦听器的最佳方法

我已经搜索过答案但找不到类似的东西我对 C 相当陌生我需要使用 WinForms 在 C 中创建一个程序它基本上有 2 个组件 UI 然后我需要一个永久侦听套接字 TCP 端口的进程如果收到任何内容那么我需要引发一个事件或类似的
计算一年中第一周的星期一的最简单方法是什么

我想过去一年并得到一个代表第一周第一个星期一的日期 so 如果一个传入2011 我会回来的2011 年 1 月 3 日如果一个传入2010 我会回来的2010 年 1 月 4 日 private DateTime GetFirstMond
Images.xcassets 违反目标法则

好吧所以我正在为这个问题拔牙我真诚地希望我犯了一个愚蠢的错误涉及到一些深夜简短的背景故事我们正在构建一个需要品牌化的产品因为多个客户将共享 90 相同的 UI 和代码并使用一些配置选项来打开关闭以及不同的颜色字体和图像等
当我第二次运行测试时，为什么在 Mongoose 中出现错误“无法覆盖编译后的模型”？

我读过相关帖子编译 Mongoose 后无法覆盖模型 https stackoverflow com questions 19051041 cannot overwrite model once compiled mongoose 问题是
改变排序对象行为

使用映射到 Linux 共享的驱动器时文件名区分大小写 PowerShell 按预期处理此问题但我想以类似于 C 语言环境中使用的排序顺序的方式对输出进行排序这意味着按字符值从 U 0000 一直到 U 升序排序10FFFF 例如 0
HTML 标签的正则表达式 [重复]

这个问题在这里已经有答案了我有一个 HTML 页面 tr 类我需要捕获这些标签之间的文本我尝试过Regex i tr
Javascript：拖放图像标签

我想知道如何使用 javascript 拖放图像标签我知道 html5 每个元素都可以拖动但我想让它在旧浏览器上工作我已经使用javascript进行了拖放操作除了在ie和firefox中当鼠标按下时它工作得很好除非用户单击它
Flutter：为什么这个流构建器不起作用？

所以我刚刚开始从事一个 flutter 项目对整个体验还很陌生我刚刚通过创建几个更新删除和添加文档的按钮成功地将 firebase firestore 集成到我的项目中但是我还想添加一个 Streambuilder 以及在同一
Tkinter 按钮的突出显示对我不起作用

根据已接受的答案这个帖子 https stackoverflow com a 53648642 7475225指某东西的用途 configure highlightbackground red 按钮上应该在按钮周围应用颜色但是在测试中我无
AnalysisException：路径不存在：dbfs:/databricks/python/lib/python3.7/site-packages/sampleFolder/data；

我将以下代码打包到 whl 文件中 from pkg resources import resource filename def path to model anomaly dir name str data path str filep

AnalysisException：路径不存在：dbfs:/databricks/python/lib/python3.7/site-packages/sampleFolder/data；

AnalysisException：路径不存在：dbfs:/databricks/python/lib/python3.7/site-packages/sampleFolder/data； 的相关文章

随机推荐

热门标签

AnalysisException：路径不存在：dbfs:/databricks/python/lib/python3.7/site-packages/sampleFolder/data；的相关文章