接前述,数据读取
上次遗留下两个问题:
2020年端午前一周A城市巡游车GPS数据,文件名:taxiGps20190603.zip
CARNO:车牌号、
LATITUDE:纬度(WGS84 GPS标准)、
LONGITUDE:经度(WGS84 GPS标准)、
GPS_DATE:卫星定位时间、
DIRECTION:行驶方向角、
SPEED:GPS速度、
RUNNING_STATUS/OPERATING_STATUS: 运营状态(空车(1)、载客(2)、电召(4)、停运(8)、交班(16)、包车(32))
20190603A城市巡游车GPS数据,预估(635M,2000万条)
从描述统计来看,我们可以发现,经度和纬度存在0值,表明存在错误,这个问题可以尝试平滑插值。
另外,可以看到GPS速度的最大值为1922,不合常理。
注意:行驶方向角即汽车前进的方向。
df.isnull().sum()
熟悉一下数据:
taxiGps20190603这个数据集中有6727辆车,涉及到的运营状态有三种,分别为1,6,8【运营状态(空车(1)、载客(2)、电召(4)、停运(8)、交班(16)、包车(32))】。