你怎么能做同样的事情df.fillna(method='bfill')对于带有 a 的 pandas 数据框pyspark.sql.DataFrame
?
pyspark 数据框具有pyspark.sql.DataFrame.fillna方法,但是不支持method
范围。
在 pandas 中,您可以使用以下内容来回填时间序列:
创建数据
import pandas as pd
index = pd.date_range('2017-01-01', '2017-01-05')
data = [1, 2, 3, None, 5]
df = pd.DataFrame({'data': data}, index=index)
Giving
Out[1]:
data
2017-01-01 1.0
2017-01-02 2.0
2017-01-03 3.0
2017-01-04 NaN
2017-01-05 5.0
回填数据框
df = df.fillna(method='bfill')
生成回填框架
Out[2]:
data
2017-01-01 1.0
2017-01-02 2.0
2017-01-03 3.0
2017-01-04 5.0
2017-01-05 5.0
如何才能为一个人做同样的事情呢?pyspark.sql.DataFrame
?