我有一个包含四个字段的数据框。其中一个字段名称是 Status,我尝试在 .filter 中对数据帧使用 OR 条件。我尝试了以下查询,但没有运气。
df2 = df1.filter(("Status=2") || ("Status =3"))
df2 = df1.filter("Status=2" || "Status =3")
以前有人用过这个吗。我在堆栈溢出上看到过类似的问题here https://stackoverflow.com/questions/33747834/sparksql-filtering-selecting-with-where-clause-with-multiple-conditions。他们使用以下代码来使用 OR 条件。但该代码适用于 pyspark。
from pyspark.sql.functions import col
numeric_filtered = df.where(
(col('LOW') != 'null') |
(col('NORMAL') != 'null') |
(col('HIGH') != 'null'))
numeric_filtered.show()
代替:
df2 = df1.filter("Status=2" || "Status =3")
Try:
df2 = df1.filter($"Status" === 2 || $"Status" === 3)
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)