在 pyspark 中找不到 col 函数

2024-03-31

在pyspark 1.6.2中，我可以导入col函数由

from pyspark.sql.functions import col

但当我尝试在GitHub 源代码 https://github.com/apache/spark/blob/branch-1.6/python/pyspark/sql/functions.py我发现没有col函数于functions.py文件，python如何导入一个不存在的函数？

它存在。只是没有明确定义。函数导出自pyspark.sql.functions是 JVM 代码的薄包装器，除了少数需要特殊处理的例外情况外，都是使用辅助方法自动生成的。

如果你仔细检查来源你会找到col除其他外列出的_functions https://github.com/apache/spark/blob/v1.6.2/python/pyspark/sql/functions.py#L72。这本词典是进一步迭代 https://github.com/apache/spark/blob/v1.6.2/python/pyspark/sql/functions.py#L185-L186 and _create_function https://github.com/apache/spark/blob/v1.6.2/python/pyspark/sql/functions.py#L35-L43用于生成包装器。每个生成的函数都直接分配给对应的名称globals.

Finally __all__，它定义了从模块导出的项目列表，只需导出所有globals排除黑名单中的内容。

如果这种机制仍然不清楚，您可以创建一个玩具示例：

创建名为的 Python 模块foo.py包含以下内容：

# Creates a function assigned to the name foo
globals()["foo"] = lambda x: "foo {0}".format(x)

# Exports all entries from globals which start with foo
__all__ = [x for x in globals() if x.startswith("foo")]

将其放置在 Python 路径上的某个位置（例如工作目录中）。
Import foo:
```
from foo import foo

foo(1)
```

这种元编程方法的一个不受欢迎的副作用是定义的函数可能无法被纯粹依赖于静态代码分析的工具识别。这不是一个关键问题，在开发过程中可以安全地忽略。

取决于IDE安装类型注释 https://pypi.org/project/pyspark-stubs/可能会解决问题（例如参见Zero323/pyspark-stubs#172 https://github.com/zero323/pyspark-stubs/issues/172).

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

在 pyspark 中找不到 col 函数的相关文章

在 Python 中比较浮点数是否几乎相等的最佳方法是什么？

众所周知由于舍入和精度问题比较浮点数是否相等有点繁琐例如比较浮点数 2012 年版 https randomascii wordpress com 2012 02 25 comparing floating point number
c++11 正则表达式比 python 慢

嗨我想了解为什么以下代码使用正则表达式进行分割字符串分割 include
Native TF 与 Keras TF 性能比较

我使用本机和后端张量流创建了完全相同的网络但在使用多个不同参数进行了多个小时的测试后仍然无法弄清楚为什么 keras 优于本机张量流并产生更好稍微但更好的结果 Keras 是否实现了不同的权重初始化方法或者执行除 tf train
来自多元 t 分布的样本 python

我想知道Python中是否有一个从多元学生t分布中采样的函数我有包含 14 个元素的均值向量 14x14 协方差矩阵和自由度我想从这个 t 分布中采样一个向量对于一维情况我使用 stats t rvs df loc scale 并且
ipython/jupyter 中的 tk 问题

我正在尝试编写一个用于从 ipython jupyter 笔记本启动的 gui 但在笔记本中使用 tkinter 时遇到了麻烦特别是在让 tk gui 窗口正常关闭方面如何从 jupyter 制作启动 tkinter gui 然后在不
R.scale() 和 sklearn.preprocessing.scale() 之间的区别

我目前正在将数据分析从 R 转移到 Python 当在 R 中缩放数据集时我将使用 R scale 根据我的理解它将执行以下操作 x mean x sd x 为了替换该函数我尝试使用 sklearn preprocessing sca
如何在 Django 中像应用程序一样从配置中注册 Flask 蓝图？

如何从我的配置中注册 Flask 蓝图就像 Django 中的应用程序一样我想在配置文件中定义蓝图它将自动注册 config py BLUEPRINTS news files 实际上我一直在一个暂定名为的项目中勾勒出类似的东西臀部口袋
错误：tensorflow：无法匹配检查点的文件

我正在训练一个张量流模型在每个时期之后我都会保存模型状态并腌制一些数组到目前为止我的模型执行了 2 个纪元并且保存状态的文件夹包含以下文件 checkpoint model e knihy preprocessed txt e0 c
django-allauth：电子邮件确认

我已经设置了 django allauth 并在新用户注册时使用电子邮件确认效果很好但在确认电子邮件中我得到 Hello from example com You re receiving this e mail because us
如何检查discord.py中的所有者

我试图让这个命令只有所有者才能运行它是否有办法检查服务器的最高角色或创建者我尝试了 commands is owner 但这仅检查某人是否是机器人的所有者 Guild owner https discordpy readthedocs
如何在 Apache Spark 中通过 DStream 使用特征提取

我有通过 DStream 从 Kafka 到达的数据我想进行特征提取以获得一些关键词我不想等待所有数据的到达因为它是可能永远不会结束的连续流所以我希望以块的形式执行提取如果准确性会受到一点影响对我来说并不重要到目前为止我整理
自动创建带有文件输出的目录[重复]

这个问题在这里已经有答案了假设我想制作一个文件 filename foo bar baz txt with open filename w as f f write FOOBAR 这给出了一个IOError since foo bar不存
AppEngine 警告 - OpenBLAS 警告 - 无法确定该系统上的 L2 缓存大小

我尝试在 GC AppEngine 上部署应用程序部署过程中没有错误但应用程序无法运行仅显示加载页面日志中唯一一个奇怪的原始日志 OpenBLAS WARNING could not determine the L2 cache s
使用 Python 获取 Youtube 数据

我正在尝试学习如何分析网络上可用的社交媒体数据我从 Youtube 开始 from apiclient errors import HttpError from outh2client tools import argparser fro
如何动态选择要在flask中使用的模板目录？

默认情况下 Flask 使用存储在 template 目录中的模板文件 flaskapp application py templates hello html 有没有办法根据登录的用户动态选择模板目录这就是我想要的目录结构 flaska
如何将 Django 数据库中的模板标签解释/渲染为 HTML

我正在尝试添加带有来自 Django 管理站点的图像的帖子但安全自动转义关闭过滤器无法解释 Django 的模板标签 My input and page look like 复制图像地址给出http 127 0 0 1 8000 7B
如何从 PyObject 获取指向字符串的 char*

我怎样才能得到一个char from a PyObject它指向一个字符串例如这是 python 脚本 Test Connect 272 22 20 65 1234 这是 C 代码 static PyObject Connect PyO
内置模块位于哪里？

我尝试查找列出的所有目录sys path但我找不到任何builtins py文件那么它在哪里呢从字面上看该模块内置于 python 解释器中 gt gt gt import builtins gt gt gt builtins
重写 __cmp__ python 函数

嗨我是压倒一切的 cmp 如果传递的第二个对象是None 或者如果它不是一个实例someClass 然后返回 1 我不明白这里到底发生了什么 class someClass def cmp self obj if obj None ret
收到 Python 错误“来自：无法读取 /var/mail/Bio”

我正在运行一个 bio python 脚本这会导致以下错误 from can t read var mail Bio 由于我的脚本与邮件没有任何关系我不明白为什么我的脚本在 var mail 中查找这里似乎有什么问题我怀疑这会有帮助

随机推荐

ZF2 Zend\Db 使用 Mysql 表达式插入/更新（Zend\Db\Sql\Expression？）

有没有办法通过 Zend Db 和或 TableGateway insert update 语句在 ZF2 2 0 0beta4 的当前版本中包含像 NOW 这样的 MySQL 表达式这是邮件列表上的相关帖子但尚未得到答复 http
如果计算机未连接到互联网，Liquibase 将失败

当我尝试启动 Liquibase 使用 Karaf 时出现以下错误无法读取架构文档http www liquibase org xml ns dbchangelog dbchangelog 3 0 xml http www liquib
我可以在 PhoneGap 中每天在指定时间安排事件/回电吗

有什么方法在 PhoneGap 中我可以安排事件或回调在每天的指定时间发生我想我正在寻找类似 Android AlarmManager 的东西这样我就可以每天在特定时间触发一些通知然后提示用户启动我的应用程序你可以使用这个 ht
AWS使用Ubuntu 22.04启动新实例：映像的卷超出了实例允许的数量

AWS 使用 Ubuntu 22 04 启动新实例 The selected AMI contains more instance store volumes than the instance allows Only the first
抓取顺畅

我做了一个简单的抓取演示页面 http jsfiddle net NV Nkf9n 它没有任何缓动加速我想做同样的缓动加速库莱什信息网 http kulesh info Flash 网站使用 JavaScript 我怎样才能做到这一
在 iPhone 的媒体库中保存录制的视频时出现问题

我正在尝试使用 UIImagePickerController 委托将录制的视频保存到库中它适用于图片但如果是视频则不会保存而且在尝试保存视频后如果我打开照片应用程序我会收到一条消息请稍候更新库以及带有标签的进度条
Javascript / Jquery 脚本因超时而终止

作为一名 Python 爱好者我正在尝试 JS 和 Jquery 我编写了这个小脚本来使用 Jquery 幻灯片折叠展开 html 页面上的菜单栏我相信这应该可以正常工作但是它所做的只是将我的浏览器冻结大约 10 秒然后在控制台中
无法在 UWP Windows 应用程序打包解决方案中打开 AppServiceConnection

我有一个 UWP 应用程序它有 2 个主要部分一个具有 UI 的 UWP 项目和一个用于提供系统托盘功能的 WinForms 项目我正在使用 Windows 应用程序打包项目将它们连接在一起如下例所示 https learn mic
NHibernate 中的 DateTime 精度以及 NHibernate SchemeExport 中对 DateTime2 的支持

然后我使用 Fluent NHibernate 及其自动映射功能来映射以下简化的 POCO 类 public class Foo public virtual int Id get set public virtual datetime
无法在主机上加载程序集 WebPages.Deployment 版本 2？

我有一个 ASP NET MVC 2 网站 VS2010 已升级到 ASP NET MVC 3 VS2012 这在本地 IIS7 上工作正常但在发布它时我在主机上遇到此异常 Could not load file or assembly
如何使用 Cocoa OSX SDK 检查 TCP 端口 [关闭]

很难说出这里问的是什么这个问题是含糊的模糊的不完整的过于宽泛的或修辞性的无法以目前的形式得到合理的回答如需帮助澄清此问题以便重新打开访问帮助中心 help reopen questions 我想制作一个可可应用程序来检查服务器
（Eclipse SDK更新错误）收集要安装的项目时发生错误

我刚刚更新了ADK 遇到了和这个家伙完全相同的问题相同版本的升级无法从 22 3 0 更新 ADT 到22 6 1 没有发现更新 https stackoverflow com questions 22525178 cannot upd
每次我发出 http 请求时应用程序都会崩溃

这是我的代码每次我触摸 imageview 我的应用程序都会等待大约 5 秒然后崩溃我有互联网权限在服务器端我有一个 php 页面它读取 GET 并将其插入数据库中 public class Home extends Activi
MySQL显示表中每小时的条目数

新链接结果减少 1 https i stack imgur com 8G1Jh png我需要在表中回显给定日期每小时的条目数即使它们是 0 这似乎正在发生但以一种奇怪的方式如您所见小时列没有发挥作用这应该是 0 00 1 22 0
如何在 Dart 中测试流

如何在 Dart 中测试流我有这个代码 test words are reading sequentially correct WordTrackerInterface wordTracker WordTracker byContent
如何在 Android 中创建 url 预览？

我想在分享时显示 Android 中任何网址的预览就像 Facebook 或 Whatsapp 中显示的那样预览必须包含网页中的图像和链接的简短描述我想过从元数据和图标中获取信息但图标大小非常小并且元数据并不总是存在例如在 Q
防止 Angular NativeScript WebView 通过捏合缩放进行缩放

所以我有一个使用 Angular NG 5 1 1 Angular 7 x 的 Nativescript 应用程序我有一个带有网络视图的视图 ViewChild myWebView webViewRef ElementRef
Webview 在冰淇淋三明治中显示白色空白页

在我的网络视图中我加载了一个 URL 其中包含电视频道直播的嵌入式视频播放器它在除 ICS 4 之外的所有 Android 操作系统版本中都能正常工作第一次它可以很好地播放视频但是当我返回并再次进入包含视频的页面时视频不会加载并显
查找目录中最后创建的FILE，C++

尽管我在网上搜索过但没有任何像我这样的问题我的问题是我想获取目录中最后创建的文件的名称我的系统将在该代码的目录中创建来自我的相机的 png 文件我希望我的代码采用最后创建的文件我想用这段代码来做 string processNa
在 pyspark 中找不到 col 函数

在pyspark 1 6 2中我可以导入col函数由 from pyspark sql functions import col 但当我尝试在GitHub 源代码 https github com apache spark blob br

在 pyspark 中找不到 col 函数

在 pyspark 中找不到 col 函数 的相关文章

随机推荐

热门标签

在 pyspark 中找不到 col 函数的相关文章