如何将参数传递给用户定义函数？

2024-06-25

我有一个用户定义的函数：

calc = udf(calculate, FloatType())

param1 = "A"

result = df.withColumn('col1', calc(col('type'), col('pos'))).groupBy('pk').sum('events')

def calculate(type, pos):
   if param1=="A":
       a, b = [ 0.05, -0.06 ]
   else:
       a, b = [ 0.15, -0.16 ]
   return a * math.pow(type, b) * max(pos, 1)

我需要传递一个参数param1对此udf。我该怎么做？

您可以使用lit or typedLit作为你的参数udf像这样：

在Python中：

from pyspark.sql.functions import udf, col, lit
mult = udf(lambda value, multiplier: value * multiplier)
df = spark.sparkContext.parallelize([(1,),(2,),(3,)]).toDF()
df.select(mult(col("_1"), lit(3)))

在斯卡拉中：

import org.apache.spark.sql.functions.{udf, col, lit}
val mult = udf((value: Double, multiplier: Double) => value * multiplier)
val df = sparkContext.parallelize((1 to 10)).toDF
df.select(mult(col("value"), lit(3)))

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

apachespark

PySpark

如何将参数传递给用户定义函数？的相关文章

什么时候在Python中使用弱引用？

谁能解释一下弱引用的用法吗 The 文档 http docs python org library weakref html没有具体解释只是说GC可以随时销毁通过弱引用链接到的对象那么拥有一个随时可能消失的物体还有什么意义呢如果我需要
Python Flask 删除请求

我正在开发一个 Python 应用程序并使用 Flask 这是我的 DELETE 函数 app route DeleteMessage methods DELETE def DeleteMessage messages Message qu
使用不带引号的块样式的 Python YAML 转储

如何使用 PyYAML 加载和转储 YAML 以便它尽可能地使用原始样式我有 Python 来加载和转储 YAML 数据例如 import sys import yaml def represent dictorder self dat
如何在嵌套列表中查找给定元素？

这是我的迭代解决方案 def exists key arg if not arg return False else for element in arg if isinstance element list for i in elemen
使用 cx_oracle 返回 MERGE 中受影响的行数

如何在 CX Oracle 中执行 MERGE INTO sql 命令来获取受影响的行数当我在cx oracle 上执行MERGE SQL 时我得到的cursor rowcount 为 1 有没有办法获取受合并影响的行数由于 cx o
映射 2 个数据帧并替换目标数据帧中匹配值的标头

我有一个数据框 df1 SAP Name SAP Class SAP Sec Avi 5 C Rison 6 A Slesh 7 B San 8 C Sud 7 B df2 Name Fi Class Avi 5 Rison 6 Slesh
为什么 scikit-learn SVM.SVC() 非常慢？

我尝试使用SVM分类器来训练大约10万个样本的数据但我发现它非常慢甚至两个小时后也没有任何反应当数据集有大约 1k 个样本时我可以立即得到结果我还尝试了 SGDClassifier 和朴素贝叶斯速度相当快几分钟内就得到了结果
为什么我的字符串中出现不需要的换行符？

这应该很简单这很愚蠢但我无法让它发挥作用我有一个在读取文件时定义的标头 if gene env in line or gene HIV2gp7 in line header line 现在这个标题看起来像 gt lcl NC 0018
Python Jinja2 调用宏会导致（不需要的）换行符

我的 JINJA2 模板如下所示 macro print if john name if name John Hi John endif endmacro Hello World print if john Foo print if joh
Plotly：如何在堆叠条形图顶部显示值的总和以及各个条形值？

我正在尝试在 Python 中的 Plotly Express 中添加每个堆叠条形顶部的总计以及各个条形值 import plotly express as px df px data medals long fig px bar df x
python osmnx - 仅提取一个国家的大型高速公路

我知道可以通过 OSMNX python 包提取城市的道路网络详情请参阅https geoffboeing com 2016 11 osmnx python street networks https geoffboeing com 20
基于 Pandas 中特殊字符分隔列中的每个项目进行聚合

我输入的数据如下 Date Investment Type Medium 1 1 2000 Mutual Fund Stocks Fixed Deposit Real Estate Own Online Through Agent 1 2
过滤给定范围内的坐标

我有数百个带有地理位置的 out 文件我将把它们批量导入到 SQLite 数据库中但是为了节省时间我只会导入地理坐标在某些间隔内的线文件是这样的 value value longitude latitude value value
折叠 numpy 数组除前两个维度之外的所有维度

我有一个可变维度的 numpy 数组例如它可以具有以下形状 64 64 64 64 2 5 64 64 40 64 64 10 20 4 我想要做的是如果维数大于 3 我想将其他所有内容折叠堆叠到第三维中同时保留顺序因此在我上面
Python - 从一定范围内随机采样，同时避免某些值

我一直在阅读有关random sample 函数在random模块但没有看到任何可以解决我的问题的东西我知道使用random sample range 1 100 5 会给我来自人群的 5 个独特样本我想得到一个随机数range
matplotlib 后端 - 我关心吗？

gt gt gt import matplotlib gt gt gt print matplotlib rcsetup all backends u GTK u GTKAgg u GTKCairo u MacOSX u Qt4Agg u
如何让 Python 生成器返回 None 而不是 StopIteration？

我使用生成器在列表中执行搜索如下简单示例 gt gt gt a 1 2 3 4 gt gt gt i for i v in enumerate a if v 4 next 3 只是为了稍微说明一下示例与上面的列表相比我使用的列表要长得
用于监视文件夹和更新数据库的 Python 守护进程

这专门用于管理 MP3 文件但它应该可以轻松地适用于任何包含大量文件的目录结构我想找到或编写一个守护程序最好用Python 来监视一个包含许多子文件夹的文件夹这些子文件夹都应该包含X个MP3文件每当添加更新或删除文件时它都应该
Mac 无法安装 Tensorflow

我检查了我的 pip3 和 python3 版本 tensorflow MacBook Pro de Hector 2 tensorflow hectoresteban pip3 V pip 10 0 1 from Users hector
合并共享属性的节点

EDITED 我真的需要 Networkx graph 专家的帮助假设我有以下数据框我想将这些数据框转换为图表然后我想根据描述和优先级属性将两个图映射到相应的节点 df1 From description To priority 10

随机推荐

从封闭的网络应用程序在 Chrome 或 Firefox 中发送桌面通知？

我的目标是发送Gmail 风格的桌面通知 https support google com mail answer 1075549 hl en在 Chrome 或 Firefox 中通过当前未在浏览器中打开的 Web 应用程序我们称之为
如何在ggplot2中正确使用facet_grid？

我试图使用以下代码为每个配置文件生成一个图表但我不断收到至少一层必须包含用于分面的所有变量错误我花了最后几个小时试图让它发挥作用但我做不到我相信答案一定很简单有人可以帮忙吗 d structure list category
哪些兼容 .NET 的图形数据库解决方案拥有经过验证的跟踪记录？

我正在寻找一种通用图形数据库解决方案该解决方案具有现有的 NET 兼容基础架构和经过验证的跟踪记录我在 Google 和 SO 上找到了几个选项的链接但没有太多关于实际应用程序中现有实现和用法的信息我还考虑过使用文档数据库之间的混合
对同一类型的多个项目使用“引用”

因此我正在自学 Ruby on Rails 并具有 PHP 背景我编写了一个草率的概念验证的 PHP 应用程序名为 2NDP http rezich com storybored 我想在 Ruby on Rails 中重新创建它但
C# 属性参数必须是常量表达式

为什么下面的字符串数组给我一个错误它们不都是字符串吗属性参数必须是属性参数类型的常量表达式 typeof 表达式或数组创建表达式 Test TestCase new string 01 02 03 04 05 06 07 08 09 1
如何扩展 Sonata\DoctrineORMAdminBundle\Model\ModelManager

我想在 ModelMangaer 中进行一些更改然后我扩展了 ModelManager 但它不起作用我不知道为什么有人告诉我为什么它不起作用吗我扩展 Sonata DoctrineORMAdminBundle Model Model
Azure Function 用于写入队列 - 我可以设置元数据吗？

我可以看到从这一页 https learn microsoft com en us azure azure functions functions bindings storage queue当队列消息元数据属性用作触发器时您可以简单地访
如何在 SwiftUI 中的形状中添加文本？

我想在 SwiftUI 中的形状例如方形中添加文本例如嗨并使它们充当单个对象看起来没有直接的方法可以在 SwiftUI 中添加形状文本这是我认为更全面的答案从 Xcode 11 5 开始这将起作用 Text question
bootstrap-select 不代理点击事件

我有选择元素
当尝试为我们分配 IP 而不是 localhost 或 home 时，NSURLSession 失败

我有一台本地运行的服务器我的IP是192 168 0 98 并且一直在尝试使用一些网络代码来访问它最初这是通过 AFNetworking 完成的但我现在用NSURLSession像这样 NSURLSession session NSU
不将所有依赖项包含在 useEffect 依赖项数组中是不是一种反模式？

我正在尝试了解 React Hooks API 具体来说我正在尝试构建曾经如下的经典用例 componentDidUpdate prevProps if prevProps foo this props foo Animate DOM e
如何将 ng-template insideHTML 获取到组件

我想将 ng template 的 insideHTML 获取到我的组件就像是 HTML
为什么 docker 会创建空的 node_modules 以及如何避免它？

有一些类似的问题 https stackoverflow com questions 39651908 why node modules is empty after docker build但他们还没有回答为什么 docker 创建空的n
如果子 div 不包含标签，如何隐藏父 div？

如果子 div 即 post title 不包含父 div 即 post 我试图隐藏父 div 即 post a 标签关于如何使用我修改的代码正确完成此操作有什么见解吗 div div div class post image post
什么是函数指针[重复]

这个问题在这里已经有答案了可能的重复函数指针有什么意义 https stackoverflow com questions 2592137 what is the point of function pointers 任何人都可以用外行
将 cookies.txt 文件与 Python 请求结合使用

我正在尝试使用访问经过身份验证的网站cookies txt带有 Python 请求的文件使用 Chrome 扩展生成 import requests cookielib cj cookielib MozillaCookieJar cook
使用 Web Inspector 调试时，IOS 6 Safari 未显示错误，如何查找错误？

据我所知我正在尝试调试仅在 IOS 6 Safari 上显示的错误 Chrome 和 Opera 不会出现此错误我已经在 iPad 2 和 iOS 模拟器上重现了该错误但仅限于生产环境然而当我进入 safari Web Inspe
Android 中的 TreeMap 到 ListView

我正在 Android 中制作一个清单类型应用程序其中我在列表视图中填充项目旁边有一个复选框当用户单击某个项目时我希望它删除文本并更新数据库中相关列的条目因此我将名称值对存储在 TreeMap 中其中名称对应于数据库列名称
如何在C中模拟套接字

我有一个使用套接字的函数我会模拟它但我找不到如何做到这一点有没有办法在 C 中模拟套接字 Thanks 大多数系统库函数是弱符号 https en wikipedia org wiki Weak symbol 这意味着您可以创建自己
如何将参数传递给用户定义函数？

我有一个用户定义的函数 calc udf calculate FloatType param1 A result df withColumn col1 calc col type col pos groupBy pk sum events

如何将参数传递给用户定义函数？

如何将参数传递给用户定义函数？ 的相关文章

随机推荐

热门标签

如何将参数传递给用户定义函数？的相关文章