PySpark - 从 Numpy 矩阵创建 DataFrame

2024-03-03

我有一个 numpy 矩阵:

arr = np.array([[2,3], [2,8], [2,3],[4,5]])

我需要创建一个 PySpark Dataframearr。我无法手动输入值,因为长度/值arr将动态变化,所以我需要转换arr进入数据框。

我尝试了以下代码但没有成功。

df= sqlContext.createDataFrame(arr,["A", "B"])

但是,我收到以下错误。

TypeError: Can not infer schema for type: <type 'numpy.ndarray'>

import numpy as np

#sample data
arr = np.array([[2,3], [2,8], [2,3],[4,5]])

rdd1 = sc.parallelize(arr)
rdd2 = rdd1.map(lambda x: [int(i) for i in x])
df = rdd2.toDF(["A", "B"])
df.show()

输出是:

+---+---+
|  A|  B|
+---+---+
|  2|  3|
|  2|  8|
|  2|  3|
|  4|  5|
+---+---+
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

PySpark - 从 Numpy 矩阵创建 DataFrame 的相关文章

随机推荐

  • 以干净的方式打破 javascript 承诺链

    我正在尝试将承诺串联起来 这样如果一个承诺被拒绝 链条就会断裂 我跟随一个人的线索上一个SO问题 https stackoverflow com questions 20714460 break promise chain and call
  • (413) 请求实体太大 |上传预读大小

    我使用 NET 4 0 编写了一个 WCF 服务 该服务托管在我的 Windows 7 上x64带有 IIS 7 5 的终极系统 其中一个服务方法有一个 对象 作为参数 我正在尝试发送一个包含图片的字节 只要该图片的文件大小小于约 48KB
  • 使用 webpack 配置 CSS 模块时出错

    我正在尝试使用 webpack 配置 CSS 模块 但出现错误 我已经检查了 stackoverflow 上的其他答案 但到目前为止 没有一个解决方案对我有用 我已经按照文档的建议添加了加载程序 但它仍然显示错误 这是我的 webpack
  • 在 jQuery mobile 中创建侧边栏

    通常 当您使用 jQuery mobile 创建 data role page 元素时 它会占据整个查看区域 因此 我不明白如何创建侧边栏 我想模拟以下内容 但查看源代码没有多大帮助 http jquerymobile com demos
  • 嵌套字典到 MultiIndex pandas DataFrame(3 级)

    我想对 3 级嵌套字典执行相当于此操作 嵌套字典到多索引数据框 其中字典键是列标签 https stackoverflow com questions 24988131 nested dictionary to multiindex dat
  • 来自 CALayer 的 CGImage(或 UIImage)

    我创建了一个CALayer 我向图层添加了几个形状 但最终我只有一个 CALayer 并且将其添加到 CGImage 时遇到了很多麻烦 我找到了一些参考资料 CALayer renderInContext ctx 但我不知道如何实现它 以前
  • 我可以拥有在单个 js 文件中发出 Angular 元素的 Angular 库吗?

    我开始接触 Angular 6 位 并且对 Angular Elements 以及新的库项目非常感兴趣 我即将开展一个项目 可能需要这两个新功能 我需要创建可跨 Web 框架重用的自定义 UI 组件 但我也希望获得在 Angular 项目中
  • 忽略版本控制上的文件夹元文件

    Unity 创建和删除元文件folders在资源文件夹内 在使用版本控制时 这可能会产生令人烦恼的情况 您可以跳过并转到问题 有人创建了一个将被忽略的文件文件夹 但忘记忽略该文件夹的元文件 Unity 创建元文件 此人将元添加到版本控制中
  • Android 获取设备区域设置

    安装 Android 程序后 我检查设备区域设置 String deviceLocale Locale getDefault getLanguage 如果 deviceLocale 在我支持的语言 英语 法语 德语 内 我不会更改区域设置
  • 如何在 where 子句中使用别名?

    我试图在多列文本和备忘录中搜索我不想看到的某些短语和黑名单短语 假设如下表 stories id title author publisher content 前任 我想找到所有提到 在任何领域 苹果 但将 苹果酱 列入黑名单的故事 SEL
  • Apple Silicon 上的 ARCHFLAGS 值正确吗?

    在我以前的基于 Intel 的 Mac 上 我曾经包含 export ARCHFLAGS arch x86 64 在我的 shell 资源文件中 新的基于 ARM 的 Apple 芯片上的正确编译标志是什么 arm arm64 arm 64
  • WPF:OnCollectionChanged 未触发

    使用 VS 2102 NET 4 0 和 MVVM Light 我有以下代码 可将 XML 文件中的项目读取到 ObservableCollection 中 然后 如果集合发生更改 使用 IsDirty 标志 但 OnCodeCollect
  • 如何将 pandas 列的值除以其他列

    我有一个数据框 gt gt gt dt COL000 COL001 QT STK ID RPT Date STK000 20120331 2 6151 2 1467 1 20120630 4 0589 2 3442 2 20120930 4
  • 如何从 django 选择字段中的值检索键?

    示例代码如下 REFUND STATUS S SUCCESS F FAIL refund status models CharField max length 3 choices REFUND STATUS 我知道在模型中我可以使用 get
  • GitHub:是否可以搜索内部代码并按星号排序

    我不确定这是否是解决这个问题的正确论坛 在 GitHub 上看到不少与搜索相关的 Q A 故在此发帖 例如 在 Github 项目中搜索代码 https stackoverflow com q 3616221 781695 GitHub 高
  • 带有 Swift 和 iOS 8 Storyboard 的登录屏幕

    我在处理 iOS 应用程序的登录流程时遇到了很多麻烦 我想要实现的故事板的图像如下 我正在尝试实现一个可选的登录屏幕 仅当用户首次打开应用程序且尚未登录时才会显示该屏幕 目前 我将选项卡栏控制器设置为根视图控制器 然而 我不知道如何处理这些
  • 添加CSS边框改变HTML5网页中的定位

    当我在 HTML 5 文档中添加边框时 我遇到了页面元素移动的问题 我期望包含标题元素 灰色 出现在屏幕顶部 但它似乎占用了内部 div 红色 的边距 但是 如果我向标题添加边框 它就会出现在我期望的位置 并且红色内部 div 只会稍微移动
  • sap.ui.core.routing.Router.navTo() 和 sap.m.routing.Targets.display() 有什么区别?

    假设我们有一条路线和一个目标 routes pattern modify name modify target master modify targets modify viewName Modify viewId modify viewL
  • 在ansible模板中生成元组变量

    我正在尝试设置一个剧本来部署 influxdb 集群 一切正常 除了我们使用INfluxDB集群客户端 http influxdb python readthedocs org en latest api documentation htm
  • PySpark - 从 Numpy 矩阵创建 DataFrame

    我有一个 numpy 矩阵 arr np array 2 3 2 8 2 3 4 5 我需要创建一个 PySpark Dataframearr 我无法手动输入值 因为长度 值arr将动态变化 所以我需要转换arr进入数据框 我尝试了以下代码