Hive 表是从 Spark 创建的，但在 Hive 中不可见

2024-04-07

从火花使用：

DataFrame.write().mode(SaveMode.Ignore).format("orc").saveAsTable("myTableName")

表正在保存我可以使用下面命令的 hadoop 看到fs -ls /apps/hive/warehouse\test.db' where test是我的数据库名称

drwxr-xr-x - psudhir hdfs 0 2016-01-04 05:02 /apps/hive/warehouse/test.db/myTableName

但是当我尝试检查 Hive 中的表时，我也无法使用命令查看它们SHOW TABLES来自 hiveContext。

sudo cp /etc/hive/conf.dist/hive-site.xml /etc/spark/conf/

这在 Cloudera 快速启动 Virtual Box 中对我有用。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

apachespark

hive

HiveQL

hivecontext

Hive 表是从 Spark 创建的，但在 Hive 中不可见的相关文章

Hadoop：读取ORC文件并放入RDBMS中？

我有一个以 ORC 文件格式存储的配置单元表我想将数据导出到 Teradata 数据库我研究了 sqoop 但找不到导出 ORC 文件的方法有没有办法让 sqoop 为 ORC 工作或者有什么其他工具可以用来导出数据 Thanks
使用 pyspark 连接 PostgreSQL

我正在尝试使用 pyspark 连接到数据库并且使用以下代码 sqlctx SQLContext sc df sqlctx load url jdbc postgresql hostname database dbtable SELECT
Spark 按列重新分区，每列动态分区数

如何根据列中的项目数对 DataFrame 进行分区假设我们有一个包含 100 人的 DataFrame 列是first name and country 我们希望为一个国家地区的每 10 个人创建一个分区如果我们的数据集包含 80
Python Spark DataFrame：用 SparseVector 替换 null

在 Spark 中我有以下名为 df 的数据框其中包含一些空条目 id features1 features2 185 5 0 1 4 0 1 0 null 220 5 0 2 3 0 1 0 10 1 2 6 0 1 225 null
如何过滤 pyspark 列表中值的列？

我有一个数据框原始数据我必须在 X 列上应用值 CB CI 和 CR 的过滤条件所以我使用了下面的代码 df dfRawData filter col X between CB CI CR 但我收到以下错误 Between 恰好需要 3
从 pandas udf 记录

我正在尝试从 python 转换中调用的 pandas udf 进行日志记录因为在执行器上调用的代码不会显示在驱动程序的日志中我一直在寻找一些选项但到目前为止最接近的选项是这个one https stackoverflow com q
如何使用 Scala 在 Spark 中漂亮地打印 JSON 数据帧？

我有一个数据帧我想将其作为有效的 json 写入 json 文件我当前的代码如下所示 val df DataFrame myFun df toJSON saveAsTextFile myFile json 输出的格式为如何将文件内容组
如何将多行标签 xml 文件转换为 dataframe

我有一个包含多个行标签的 xml 文件我需要将此 xml 转换为正确的数据帧我使用了spark xml 它只处理单行标签 xml数据如下
Spark Scala：按小时或分钟计算两列的 DateDiff

我在数据框中有两个时间戳列我想获取它们的分钟差异或者小时差异目前我可以通过四舍五入获得日差 val df2 df1 withColumn time datediff df1 ts1 df1 ts2 但是当我查看文档页面时https
Spark：替换嵌套列中的空值

我想更换所有n a以下数据框中的值unknown 它可以是scalar or complex nested column 如果它是一个StructField column我可以循环遍历列并替换n a using WithColumn 但我希
通过过滤对 Pyspark Dataframe 进行分组

我有一个数据框如下 cust id req req met 1 r1 1 1 r2 0 1 r2 1 2 r1 1 3 r1 1 3 r2 1 4 r1 0 5 r1 1 5 r2 0 5 r1 1 我必须观察客户看看他们有多少要求看看
在 Hive 中获取数据的交集

我在配置单元中有以下数据 userid cityid 1 15 2 15 1 7 3 15 2 8 3 9 3 7 我只想保留具有 cityid 15 和 cityid 7 的用户 ID 在我的示例中它将是用户 ID 1 和 3 我试过
如何使用 PySpark 预处理图像？

我有一个项目需要为 1 设置大数据架构 AWS S3 SageMaker 的概念验证使用 PySpark 预处理图像 2 执行 PCA and 3 训练一些机器或深度学习模型我的问题是了解如何使用 PySpark 操作图像数据但无法在
当从 HDFS 手动删除分区数据时，如何更新 Hive 中的分区元数据

自动更新Hive分区表元数据的方法是什么如果新的分区数据被添加到HDFS 不执行alter table添加分区命令然后我们可以通过执行命令 msck Repair 来同步元数据如果从HDFS中删除了大量分区数据没有执行alter t
我们可以预测 Hive SELECT * 查询结果的顺序吗？

是否有可能a的结果的顺序SELECT query no ORDER BY 如果使用相同的 DBMS 作为 Metastore 那么总是相同的吗所以只要使用MySQL作为Metastore 结果的顺序就为aSELECT 查询将始终相同如
HashPartitioner 是如何工作的？

我阅读了文档HashPartitioner http spark apache org docs 1 3 1 api java index html org apache spark HashPartitioner html 不幸的是除了
Hive - 线程安全的自动递增序列号生成

我遇到一种情况需要将记录插入到特定的 Hive 表中其中一列需要是自动递增的序列号即在任何时间点都必须严格遵循 max value 1 规则记录从许多并行的 Hive 作业插入到这个特定的表中这些作业每天每周每月批量运行现在
获取 int() 参数必须是字符串或数字，而不是“Column”- Apache Spark

如果我使用以下代码我会收到此异常 int argument must be a string or a number not Column df df withColumn FY F when df ID substr 5 2 isin
将 IndexToString 应用于 Spark 中的特征向量

Context 我有一个数据框其中所有分类值都已使用 StringIndexer 进行索引 val categoricalColumns df schema collect case StructField name StringType
Spark 中的 Distinct() 函数如何工作？

我是 Apache Spark 的新手正在学习基本功能有一个小疑问假设我有一个元组键值的 RDD 并且想从中获取一些唯一的元组我使用distinct 函数我想知道该函数基于什么基础认为元组是不同的是基于键值还是两者 di

随机推荐

获取 rfc7517 格式的 JWKS for Firebase

我正在使用 Firebase 对我的应用程序中的用户进行身份验证 Firebase 生成一个 JWT 令牌我需要在我的服务器上对其进行身份验证我使用 tyk io 来做到这一点 Tyk 支持这些令牌但要求公钥的数据源位于https w
Swagger 将 IFormFile 参数列为“对象”类型

我有一个控制器它请求一个包含 IFormFile 作为其属性之一的模型对于请求描述 Swagger UI 我使用 Swashbuckle 和 OpenApi 3 0 for NET Core 将文件属性的类型列出为类型对象有没有办法让
为什么 PeekMessage 总是返回 TRUE？

Main message loop MSG msg ZeroMemory msg sizeof msg while msg message WM QUIT if PeekMessage msg NULL 0U 0U PM REMOVE Tr
将 XSLT 转换作为构建步骤执行

在 Visual Studio 构建期间我需要从另一个 XML 文件生成一个 XML 文件对我来说很明显 XSLT 模板和转换正是我所需要的我更喜欢实现此目的的方法是使用项目文件中的自定义工具属性是否已经有一个内置工具可以用于
如何在 Jetpack Compose 中实现这种布局

我正在尝试使用新的 Jetpack Compose UI 框架但遇到了问题我想实现这个布局在 xml 中很容易实现但我无法弄清楚如何使垂直分隔线占用可用的垂直空间而不指定固定的高度我尝试过的这段代码似乎不起作用 Composab
使用 Python ElementTree 迭代多个（父、子）节点

Python 2 6 的 ElementTree 标准实现不提供从子节点指向父节点的指针因此如果需要父母建议循环父母而不是孩子考虑我的 xml 的形式
Facebook API - 如何获取用户的地址、电话号码？

有谁能够使用 FQL 或 Graph api 获取 facebook 用户的地址电话号码吗已尝试以下 FQL 并且能够获取基本信息下的当前城市和家乡但无法获取联系信息下的地址或电话 SELECT name firs
在“同一行”显示 Django 表单字段

我想在同一行上显示两个表单字段而不是一个接一个地显示目前我得到 Choice a theme Datasystems Cameroun 但我想显示这个表格例如 Choice a theme Datasystems Cameroun
如何从 Android 设备获取 GMT 中的时区偏移量（如 GMT+7:00）？

我正在得到timezone使用此代码的 Android 设备 TimeZone tz TimeZone getDefault String current Time Zone TimeZone getTimeZone tz getID ge
HTML5 画布/Flash。如何访问儿童影片剪辑并使其转到AndPlay？

在 Flash 中我的主时间轴中有 2 帧第一个是选择语言第二个包含导航栏该导航栏是一个影片剪辑其中包含项目影片剪辑这些 item movieclips 包含 2 个帧每种语言一个在 navigation bar movi
如何将 iPhone 音频路由到蓝牙耳机

我正在尝试使用 AVAudioPlayer AVAudioSession 和 AudioSessionSetProperty 将音频输出到蓝牙耳机不是 A2DP 似乎有选择蓝牙耳机作为输入的函数 kAudioSessionProperty
删除Laravel 6/7中的相关模型

有很多相关问题但不幸的是我找不到有效的解决方案我有 Laravel 模型当删除该模型时我想要删除一些相关模型删除模型时运行自定义 SQL 查询我的 Laravel 模型类看起来像如您所见模型可以有不同的关系类型 class
使用 PHP 来像数据库一样使用 Fusion Table 以及如何在使用 oauth 时关闭提示页面

我正在开发一个 PHP 应用程序它仅使用 Google Fusion Tables 作为后台数据库该应用程序包括一个用于基本安全的简单登录部分我下载了 google api php client 并使用 oAuth 成功建立了与我的
如何将对象从 MongoDB 发送到 jade？

我正在尝试使用客户端 JS 访问从 MongoDB 检索的对象具体来说我希望能够循环并使用对象内的数组这是我的服务器端 JS 成功找到了results并将它们记录到终端 app get post id function req res
为什么Excel在VBA代码的公式中添加@？ [复制]

这个问题在这里已经有答案了我想问一下excel公式中的我在下面写了公式根据某些条件计算出中位数当我直接在单元格中手动编写公式时该公式有效但每次我尝试通过下面的 VBA 代码填充公式时 ThisWorkbook Sheets Pi
WPF：组织结构图 TreeView 条件格式

该公司具有传统的复杂组织结构使用字母 n 而不是实际数字来定义级别数量我将尝试用等宽字体表达我想要实现的结构 Alice Bob Fred Jack Kim Lucy Charlie Greg Darren Henry Eric 正如您
在烛台图上方绘制移动平均线

我使用以下方法计算了移动平均线pandas DataFrame rolling 所以我的数据框看起来像这样 CurrencyPair TimeStamp Open High Low Close MA50 40 EURUSD 2017 07
Rider - .editorconfig：不尊重文件范围的命名空间

我正在使用 Rider 2021 3 3 最新版本并且当我的计算机上有最新的 NET SDK NET 6 时在的里面 editorconfig文件中我添加了以下内容 csharp namespace body file scoped
Vega-lite 线标记在远处显示工具提示

我在 VegaLite 中有以下图表在 Vega 编辑器中打开 https vega github io editor url vega lite N4IgJAzgxgFgpgWwIYgFwhgF0wBwqgegIDc4BzJAOjIEt
Hive 表是从 Spark 创建的，但在 Hive 中不可见

从火花使用 DataFrame write mode SaveMode Ignore format orc saveAsTable myTableName 表正在保存我可以使用下面命令的 hadoop 看到fs ls apps hive w

Hive 表是从 Spark 创建的，但在 Hive 中不可见

Hive 表是从 Spark 创建的，但在 Hive 中不可见 的相关文章

随机推荐

热门标签

Hive 表是从 Spark 创建的，但在 Hive 中不可见的相关文章