DCIC-A城市巡游车与网约车运营特征对比分析-2-可视化

2023-11-08

接前述,数据读取
上次遗留下两个问题:

  • 1、该案例的数据集过多 ,如果每次读一个数据的部分行(比如10000行),那在拼接所有数据集的时候也是每个数据只读10000行吗??
    回答:虽然我们通过更改数据类型,使得原始数据的大小有所改变,但如果想要把所有的数据集合拼接读取出来,也是依旧对内存有一定要求的。

  • 2、对于表字段含义的理解,我们接下来将以taxiGps20200619.csv为例进行字段含义的说明

  • 简介

2020年端午前一周A城市巡游车GPS数据,文件名:taxiGps20190603.zip

  • 具体数据项

CARNO:车牌号、
LATITUDE:纬度(WGS84 GPS标准)、
LONGITUDE:经度(WGS84 GPS标准)、
GPS_DATE:卫星定位时间、
DIRECTION:行驶方向角、
SPEED:GPS速度、
RUNNING_STATUS/OPERATING_STATUS: 运营状态(空车(1)、载客(2)、电召(4)、停运(8)、交班(16)、包车(32))

  • 数据范围

20190603A城市巡游车GPS数据,预估(635M,2000万条)

原数据
从描述统计来看,我们可以发现,经度和纬度存在0值,表明存在错误,这个问题可以尝试平滑插值。

另外,可以看到GPS速度的最大值为1922,不合常理。
原数据的描述性统计

注意:行驶方向角即汽车前进的方向。

  • 查看是否有缺失值
df.isnull().sum()

熟悉一下数据:
taxiGps20190603这个数据集中有6727辆车,涉及到的运营状态有三种,分别为1,6,8【运营状态(空车(1)、载客(2)、电召(4)、停运(8)、交班(16)、包车(32))】。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

DCIC-A城市巡游车与网约车运营特征对比分析-2-可视化 的相关文章

  • 新导入的项目出现很多“cannot resolve symbol ***”,项目运行不成功,怎么处理

    新导入的项目的启动类中很多类实例化出现错误 报错内容为 cannot resolve symbol 如下图所示 我在网上搜索相关信息 有一个网页总结的比较好 网页链接 其第一种解决方式没有尝试 其他的方式我尝试了很多 更改配置之类 但都没有
  • 企业网站搭建:如何规划内容?

    企业网站是企业展示自身形象和产品的重要渠道 搭建一个优质的企业网站可以提高企业的知名度 品牌价值和业务转化率 企业网站的内容规划非常重要 好的内容规划可以帮助企业更好地向用户展示自己 并提高用户体验 以下是一些关于企业网站内容规划的建议 1

随机推荐