从列表 PySpark 的列表中创建单行数据框

2024-04-04

我有一个这样的数据data = [[1.1, 1.2], [1.3, 1.4], [1.5, 1.6]]我想创建一个 PySpark 数据框

我已经使用了

dataframe = SQLContext.createDataFrame(data, ['features'])

但我总是得到

+--------+---+
|features| _2|
+--------+---+
|     1.1|1.2|
|     1.3|1.4|
|     1.5|1.6|
+--------+---+

我怎样才能得到如下结果？

+----------+
|features  |
+----------+
|[1.1, 1.2]|
|[1.3, 1.4]|
|[1.5, 1.6]|
+----------+

我发现思考这个论点很有用createDataFrame()作为元组列表，其中列表中的每个条目对应于 DataFrame 中的一行，元组的每个元素对应于一列。

您可以通过将列表中的每个元素设为元组来获得所需的输出：

data = [([1.1, 1.2],), ([1.3, 1.4],), ([1.5, 1.6],)]
dataframe = sqlCtx.createDataFrame(data, ['features'])
dataframe.show()
#+----------+
#|  features|
#+----------+
#|[1.1, 1.2]|
#|[1.3, 1.4]|
#|[1.5, 1.6]|
#+----------+

或者，如果更改源很麻烦，您也可以等效地执行以下操作：

data = [[1.1, 1.2], [1.3, 1.4], [1.5, 1.6]]
dataframe = sqlCtx.createDataFrame(map(lambda x: (x, ), data), ['features'])
dataframe.show()
#+----------+
#|  features|
#+----------+
#|[1.1, 1.2]|
#|[1.3, 1.4]|
#|[1.5, 1.6]|
#+----------+

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

apachespark

PySpark

apachesparksql

从列表 PySpark 的列表中创建单行数据框的相关文章

检测到通过 ChromeDriver 启动的 Chrome 浏览器

我正在尝试在 python 中使用 selenium chromedriver 来访问 www mouser co uk 网站然而从第一次拍摄开始它就被检测为机器人有人对此有解释吗此后我使用的代码 options Options
将 transaction.commit_manually() 升级到 Django > 1.6

我继承了为 Django 1 4 编写的应用程序的一些代码我们需要更新代码库以使用 Django 1 7 并最终更新到 1 8 作为下一个长期支持版本在一些地方它使用旧风格 transaction commit manually and
从 Python 下载/安装 Windows 更新

我正在编写一个脚本来自动安装 Windows 更新我可以将其部署在多台计算机上这样我就不必担心手动更新它们我想用 Python 编写这个但找不到任何关于如何完成此操作的信息我需要知道如何搜索更新下载更新并从 python 脚本安
无故运行测试时 PyCharm 抛出“AttributeError: 'module' object has no attribute”

因此我有一个 Django REST Framework 项目有一天它无法在 PyCharm 中运行测试从命令行我可以使用它们来运行它们paver or the manage py直接地曾经有一段时间当我们没有在文件顶部导入类的超
cv2.drawContours() - 取消填充字符内的圆圈（Python，OpenCV）

根据 Silencer的建议我使用了他发布的代码here https stackoverflow com questions 48244328 copy shape to blank canvas opencv python 482465
Python 使用 Gstreamer 访问 USB 麦克风时遇到问题，以便在 Raspberry Pi 上使用 Pocketsphinx 执行语音识别

所以Python的表现就好像它根本听不到我的麦克风发出的任何声音问题就在这里我有一个Python 2 7 假设使用的脚本Gstreamer通过以下方式访问我的麦克风并为我进行语音识别口袋狮身人面像我在用着脉冲音频我的设备是树莓派我的
ImportError：运行 jupyter Notebook 时没有名为 IPython.paths 的模块？

我通过以下方式安装了 jupyter usr local opt python bin python2 7 m pip install jupyter 这将安装 ipython 版本 4 1 2 但是当我运行 jupyter Notebo
Python tkinter.filedialog Askfolder 干扰 clr

我主要在 Spyder 中工作构建需要弹出文件夹或文件浏览窗口的脚本下面的代码在spyder中完美运行在 Pycharm 中 askopenfilename工作良好同时askdirectory什么都不做卡住了但是如果在调试模式
Python中列表中两个连续元素的平均值

我有一个偶数个浮点数的列表 2 34 3 45 4 56 1 23 2 34 7 89 我的任务是计算 1 和 2 个元素 3 和 4 5 和 6 等元素的平均值在 Python 中执行此操作的快捷方法是什么 data 2 34 3 45
更改 x 轴比例

我使用 Matlab 创建了这个图使用 matplotlib x 轴绘制大数字例如 100000 200000 300000 我想要 1 2 3 和 10 5 之类的值来指示它实际上是 100000 200000 300000 有没有一
Pandas：如何将数据框插入 Clickhouse

我正在尝试将 Pandas 数据框插入 Clickhouse 这是我的代码 import pandas import sqlalchemy as sa uri clickhouse default localhost default ch
对使用 importlib.util 导入的对象进行酸洗

我在使用Python的pickle时遇到了一个问题我需要通过将文件路径提供给 importlib util 来加载一些 Python 模块如下所示 import importlib util spec importlib util sp
Python Django-如何从输入文件标签读取文件？

我不想将文件保存在我的服务器上我只想在下一页中读取并打印该文件现在我有这个 index html
使用 pybtex 将 bibtex 转换为格式化的 HTML 参考书目，例如哈佛风格

我正在使用 Django 并将 bibtex 存储在我的模型中并且希望能够以格式化 HTML 字符串的形式向我的视图传递引用使其看起来像哈佛引用样式使用中描述的方法Pybtex 无法识别 bibtex 条目 https stackov
从 python 检测 macOS 中的暗模式

我正在编写一个 PyQt 应用程序我必须添加一个补丁以便在启用暗模式的 Macos 上可以读取字体 app QApplication Fix for the font colours on macos when running dark
falcon，AttributeError：“API”对象没有属性“create”

我正在尝试测试我的猎鹰路线但测试总是失败而且看起来我把所有事情都做对了 my app py import falcon from resources static import StaticResource api falcon API
从列表python的单个列表中删除子列表

我已经经历过从列表列表中删除子列表 https stackoverflow com questions 47209786 removing sublists from a list of lists 但当我为我的数据集扩展它时它不适用于我
计算互相关函数？

In R 我在用ccf or acf计算成对互相关函数以便我可以找出哪个移位给我带来最大值从它的外观来看 R给我一个标准化的值序列 Python 的 scipy 中是否有类似的东西或者我应该使用fft模块目前我正在这样做 xcor
如何使用Python保存“完整的网页”而不仅仅是基本的html

我正在使用以下代码来使用 Python 保存网页 import urllib import sys from bs4 import BeautifulSoup url http www vodafone de privat tarife r
使用Multiprocessing和Pool时如何访问全局变量？

我试图避免将变量冗余地传递到dataList e g 1 globalDict 2 globalDict 3 globalDict 并在全球范围内使用它们 global globalDict然而在下面的代码中并不是这样做的解决方案是否有

随机推荐

在 Python 中读取 JSON 对象时遇到问题

我有一个 JSON 对象我试图使用 Python 读取它但遇到一些问题我有一个名为 test txt 的文件其中包含收到的 JSON 对象 test txt 的内容如下 Sections Now Thursday 3 Februar
如果不分配给变量，为什么 Powershell Array of Array 显示不同的内容

如果 cmdlet 返回数组的数组例如 function test results New Object System Collections ArrayList array for idx 0 idx lt 3 idx obj New
AFHTTPClient.m 不再出现在 AFNetworking 中？

我正在遵循教程 http bit ly 1dbLaPh http bit ly 1dbLaPh 使用 AFNetworking 它说要创建一个从 AFHTTPClient 派生的新类这个选项没有出现在 SubClass Of 字段中我检
何时使用“raise_for_status”与“status_code”测试

我一直用 r requests get url if r status code 200 my passing code else anything else if this even exists 现在我正在解决另一个问题并决定允许其他错
出现异常：指定的网络名称不再可用。（0x80070040）尝试使用 ReadToEndAsync() 读取 HttpRequest Body 时

我有一个 API post Web 方法尝试使用 StreamReader 获取请求正文ReadToEndAsync 大多数情况下它工作正常但是对于非常随机的请求我收到以下异常客户端已断开连接有内在的例外指定的网络名称不再可用
Mat-accordion 不是已知元素

我正在开发一个 angular10 应用程序我尝试在我的项目中使用 mat accordion 每个组件使用模块每个组件都有自己的 module ts 文件下面是我的模块文件代码 import NgModule from angula
根据 hcharter 中给定的序列设置热图颜色范围

在这里我尝试使用创建热图highcharter hcharter where 小于 1应该是一种颜色粉红色 1 to 1应该是透明或白色的并且大于 1应该是另一种颜色紫色目前我已经使用编写代码hchart 并使用color stop
在 jquery 选择器中使用 rel 属性中的变量

我使用 rel 属性将 div 与按钮匹配我在相应 div 的 rel 字段中使用按钮的 id 有多个按钮单击按钮时我想使用 show 方法显示相应的 div 并隐藏其他 div 按钮工作正常但 div 没有响应我的直觉告诉我我
C Win32：从 HBITMAP 保存 .bmp 图像

我正在使用图像采集卡需要从计算机内存中获取图像并将其保存在图像文件中经过几天的尝试我最终得到了以下两个函数它创建了一个文件 Windows操作系统能够运行 bmp文件但位图文件是黑色的图像大小为900KB 640 480 有人知
Android 追加文本文件

我试图将对话框选择器中的唤醒时间和睡眠时间记录到这样的文本文件中但是对方法 commitToFile2 的调用不会附加文本文件 savedData txt 我知道这段代码非常非常肮脏我是 Java 新手所以任何其他建议将不胜感激 pa
在标签内运行 JavaScript？

我有一个处理选项卡切换的 JavaScript 文件这是来源 var tCount 0 function SwitchToTab id if id lt 0 id gt tCount id 0 for var i 0 i lt tCoun
在 ASP.NET Identity 2 中通过 UserManager.Update() 更新用户

I use ASP NET Identity 2 in an MVC 5项目我想更新Student数据通过使用UserManager Update 方法然而正如我继承自ApplicationUser类我需要映射Student to
@EnableGlobalMethodSecurity 与 @EnableWebSecurity

我正在使用 Spring 4 开发 REST API 我想使用 Spring Security 来保护一些端点但根据我所读到的内容可以使用以下任一方法来完成 EnableGlobalMethodSecurity or EnableWeb
如何在 iPhone PhoneGap jQuery Mobile 中将文件附加到邮件

我已经实施了Phone Gap 中使用 jQuery Mobile 的 iPhone 应用程序作为我的应用程序的一部分我需要单击邮件按钮发送电子邮件为此我添加了EmailComposer plug in 在 www 文件夹中添加了
是否有一种有效的算法来进行有限数量的整数分区？

我必须创建一个接受两个整数的方法让它们成为n and m 并返回有多少种求和方法m得到正数n 例如像这样的方法调用partition 6 2 应该返回 3 因为有 3 种可能的方法他们是5 1 4 2 and 3 3 顺便一提 4 2
如何在并行进程（python）中将项目追加到列表中？

这是我正在使用的更复杂代码的一个非常简单的版本问题是我想将 method 函数中计算的项目附加到稍后可以显示的某个列表中但是当运行此代码时列表对象为空而结果数组已满 import multiprocessing as mp glo
Chrome 中意外的令牌默认值 ({}).default

我收到错误 SyntaxError 意外的默认令牌在 Chrome Opera 中的任何对象上获取或设置属性默认时 default 有人可以解释为什么会发生这种情况吗 upd 请大家注意这对 FF 没有意义因此在测试时您可能会错过
选择未聚合的变量，功能上依赖于 GROUPing 变量

背景我正在一个非常受限的 T SQL 环境中工作其中只能定义一个对象的主体 VIEW 大概是 in CREATE VIEW My View AS 在引擎盖下这是我的 VERSION https learn microsoft com
如何获取多选框的所有选定值？

我有一个
从列表 PySpark 的列表中创建单行数据框

我有一个这样的数据data 1 1 1 2 1 3 1 4 1 5 1 6 我想创建一个 PySpark 数据框我已经使用了 dataframe SQLContext createDataFrame data features 但我总是得

从列表 PySpark 的列表中创建单行数据框

从列表 PySpark 的列表中创建单行数据框 的相关文章

随机推荐

热门标签

从列表 PySpark 的列表中创建单行数据框的相关文章