azuredatabricks

Azure Databricks 中 DBFS 的数据大小限制是多少

I read here https forums databricks com questions 8331 is there a size limit on files i put into dbfs fil htmlAWS Databr

Azure Databricks azuredatabricks

Databricks 连接失败，方案没有文件系统：abfss

我已经设置了数据块连接 https docs databricks com dev tools databricks connect html这样我就可以在本地进行开发并获得 Intellij 的好处同时利用 Azure Databric

apachespark azuredatabricks databricksconnect

如何使用 terraform 输出作为 Azure DevOps 管道中的变量

我试图将使用 Azure DevOps 的 terraform 部署生成的 databricks 工作区名称作为变量传递到另一个步骤但不知道该怎么做所以我在我的output tf中定义了输出 output workspace name

如何使用笔记本中的某些命令在 databricks 集群上安装库？

实际上我想在我的 Azure databricks 集群上安装一个库但我无法使用 UI 方法因为每次我的集群发生变化并且在转换过程中我无法使用 UI 将库添加到其中是否有任何 databricks 实用程序命令可以执行此操作 CHE

Databricks azuredatabricks

如何将一个databricks笔记本导入另一个？

我在 Azure Databricks 中有一个 python 笔记本 A 其导入语句如下 import xyz datetime 我在笔记本 A 中导入了另一个笔记本 xyz 如上面的代码所示当我运行笔记本A时它抛出以下错误 Impo

python pythonimport azuredatabricks sparknotebook

如何使用PySpark读取目录下的Parquet文件？

我在网上搜索了一下网上提供的解决方案并没有解决我的问题我正在尝试读取分层目录下的镶木地板文件我收到以下错误无法推断 Parquet 的架构必须手动指定我的目录结构如下 dbfs mnt sales region country

python PySpark apachesparksql Databricks azuredatabricks

如何在 NoteBook 之外的 pyspark 作业中使用 dbutils 命令

我想使用 dbutils 命令来访问通过 Databricks 上的作业内的 Spark Submit 提交的 pyspark 作业中的机密使用 dbutils 命令时出现错误 dbutils not Defined 除了笔记本之外还

PySpark Databricks azuredatabricks

Azure databricks 存储库：如何通过 API 拉取

我正在使用 Azure DevOps 存储库将 Azure databricks 连接到我在 DevOps 中的存储库我需要从 Azure DevOps 管道自动拉取为此我尝试使用 databricks API 来拉取但参考这个链接

Databricks azuredatabricks databricksrepos

Databricks SQL 和 Spark SQL 有什么区别？

Databricks SQL 和 Spark SQL 有什么区别 Data SQL 只是 Databricks 上的 Spark SQL 吗 Databricks SQL 主要基于 Spark SQL 现在正在慢慢收敛到 ANSI SQL

apachespark Databricks azuredatabricks databrickssql

在 pyspark databricks 中并行执行多个笔记本

问题很简单 master dim py calls dim 1 py and dim 2 py并行执行这在 databricks pyspark 中可能吗下图解释了我想要做什么由于某种原因它出错了我在这里遗漏了什么吗仅供其他人使用

检查Databricks中是否存在该路径

我尝试使用 Python 检查 Databricks 中是否存在该路径 try dirs dbutils fs ls my path pass except IOError print The path does not exist 如果路

python Databricks azuredatabricks DButils

使用 Azure Databricks 和 Scala 从 Azure Sql 表中删除行

我将 Azure Databricks 与 Scala 结合使用我的目标是从 Azure SQL 表中删除一些行为了实现这一点我使用 JDBC 进行下推查询如下所示 val pushdown query s DELETE FROM

sql scala Azure azuresqldatabase azuredatabricks

通过 Azure Databricks 连接到本地 SQL Server

Azure Databricks 是否支持连接到本地 SQL Server 您可以按照 scsimon 的建议使用 JDBC 驱动程序但是除非您的数据库可以通过互联网访问否则它将无法连接要解决此问题您需要将 databricks

sqlserver azuredatabricks

Terraform databricks 无法配置默认凭据

我们正在通过 Azure 管道运行 terraform 以创建 databricks 工作区和相关资源但是当 Terraform 的应用阶段到达获取最新版本的 Spark 的阶段时该过程会引发错误错误是 Error default a

将 Pickle 文件记录为 Mlflow 运行的一部分

我正在运行 MLflow 实验作为其中的一部分我想将一些工件记录为 python pickle 例如尝试不同的分类编码器因此想将编码器对象记录为 pickle 文件有办法实现这一点吗那里有两个功能日志工件 https mlflo

python Databricks azuredatabricks mlflow mlops

Databricks：SQL 查询的等效代码

我正在寻找查询的等效数据块代码我添加了一些示例代码和预期的代码但特别是我正在 Databricks 中寻找等效的代码query 目前我陷入了交叉应用字符串分割部分 SQL 数据示例 CREATE TABLE FactTurnover

sql apachesparksql Databricks azuredatabricks

Databricks JDBC 集成安全性

帮助我需要使用我的 Azure AD 凭据从 Azure databricks 集群连接到 SQL Azure 实例我已经测试过了我可以通过我的 Azure AD 凭据使用 SSMS SQL Server Management Stu

python3x azuresqldatabase Databricks azuredatabricks

如何使用 Databricks 将 CSV 写回 Azure Blob 存储？

我正在努力写回 Azure Blob 存储容器我可以使用以下内容从容器中读取内容 storage account name expstorage storage account key 1VP89J container source sp

pandas scala Databricks azuredatabricks

使用 databricks-connect 时打开 dbfs 上的文件

我正在使用 databricks connect 将本地 PyCharm IDE 连接到 Azure Databricks 群集在我尝试在没有 Spark 上下文的情况下访问文件之前这一切都工作得很好例如 dbutils fs put

python Databricks azuredatabricks databricksconnect

什么是好的 Databricks 工作流程

我使用 Azure Databricks 以及笔记本和管道进行数据处理我对当前的工作流程不满意在不中断生产的情况下无法对生产中使用的笔记本进行修改当我想要开发更新时我会复制笔记本更改源代码直到我满意为止然后用新笔记本替换生产笔

Azure azuredatabricks