我有一个如下所示的示例数据框。
df = pd.DataFrame (data = {'uid': [1,1,1,2,2,3], 'pagename':['home', 'blah',
'blah', 'home', 'blah', 'blah'], 'startpage': ['NA', 'NA', 'NA', 'home',
'home', 'blah'], 'date_time': [0,1,2,5,9,1]})
我想要做的是按 UID 分组并找到最短的日期时间。如果最小 date_time 的起始页为 Null(我将字符串“NA”表示为 Null),那么我想使用该行中的页面名称来填充起始页列。我还希望为具有相同 UID 的所有行填充起始页。
这是我想要的结束数据框。
df = pd.DataFrame (data = {'uid': [1,1,1,2,2,3], 'pagename':['home', 'blah',
'blah', 'home', 'blah', 'blah'], 'startpage': ['home', 'home', 'home',
'home', 'home', 'blah'], 'date_time': [0,1,2,5,9,1]})