轨迹数据

2023-11-16

如何通过轨迹相似性度量方法,发现新冠易感人群
轨迹作为一种时空数据,指的是某物体在空间中的移动路径,通常表示为GPS点的序列,例如tr=<p1→p2→…pn>,其中点pi=(lat,lng,t),表示该物体在t时刻位于地理坐标位置(lat,lng)上,lat和lng分别表示纬度和经度。
图1:离散的GPS点序列组成轨迹
在这里插入图片描述
带有停留行为的轨迹:包含平均坐标、到达时间(S.arvT)和离开时间(S.levT)的信息。

轨迹数据集

【1】Dataset: GestureMidAirD1。26个界面命令手势
【2】Singapore’s police now have access to contact tracing data
【3】corona virus.jhu.map
【4】 Location-based online social networks: Gowalla / Brightkite 数据集。
该数据集由微软研究院发布。其收集了 182 个用户从 2007 年 4月到 2012 年 8 月的轨迹数据,数据按照严格的时间序列,生成了 17 621 条轨迹,共有 48 000 多小时的记录。记录了用户的工作地点和户外活动等。该数据集是用来进行用户相似度估算、隐私保护、户外推荐和数据挖掘的切合数据.
【5】[Beijing Taxi Data Set] This is a sample of T-Drive trajectory dataset that contains a one-week trajectories of 10,357 taxis. The total number of points in this dataset is about 15 million and the total distance of the trajectories reaches 9 million kilometers.
【6】微软亚洲研究院Geolife项目,GPS轨迹数据(py绘图)githubPython GPS 轨迹聚类(附代码)
【7】 Brinkhoff轨迹生成器,利用德国奥尔登堡市交通网络图作为输入,生成n条移动轨迹。
【8】 HKUST 智慧城市研究小组
【9】 出租车gps轨迹
【10】 滴滴快的智能出行平台数据2016年8月-成都

【*1】GPS轨迹数据集整理
【*2】
【*3】基于地理位置的用户兴趣推荐有哪些常用数据集?

字符串数据集

【1】 北卡罗来纳州选民登记数据集(NCVR)

轨迹应用

定位介绍:如何知道你想找的人的位置(想找到你想找的人)

  • GPS、LBS基站、IP定位

应用场景:

  • 地图、网约车、外卖、快递

相关会议在这里插入图片描述

云计算领域

时间序列

相似性度量

【1】 时序数据特征提取
【2】 时间序列的自回归模型—从线性代数的角度来看
【3】【3】停留点:HGSM——基于层级结构图的相似度分析
【4】 轨迹相似度计算方法汇总

加权欧式距离

欧式距离是计算每个时间点上轨迹对应的两个点
的欧式距离, 加权欧式距离是将轨迹点在时间维度上
划分, 每个时间段内的特征点进行特征提取, 并给不同
的时间段赋予不同的权值, 例如, 筛选家庭成员则给予
夜间时间区间以较高的权值, 筛选学习工作同伴则给
予日间时间区间以较高的权值.

(a)Hausdorff 距离
  • 【1】 豪斯多夫距离、MindSpore的实现代码
(b)Fréchet distance
  • 【1】 弗雷歇距离、python计算
  • 【2】 弗雷歇距离,多边形曲线相似性
  • 【3】 离散弗雷歇距离、评价曲线相似度
    在这里插入图片描述
    【4】 路网匹配理论
    【5】 深度学习的“瓶颈”与“遛狗”定理

隐式马尔科夫模型(HMM)- 地图匹配

【1】
【2】
【3】 使用HMM与osmnx进行地图匹配

时间对齐

python - 如何根据时间对齐数据?:switch开关

聚类

《Time-series clustering – A decade review》
3.1. Finding similar time-series in time
Euclidean distance measure are proper for this objective.
Fourier transforms, wavelets or Piecewise Aggregate Approximation (PAA). Keogh and Kasetty

3.2. Finding similar time-series in shape
elastic methods such as Dynamic time Warping (DTW)

3.3. Finding similar time-series in change (structural similarity)
Hidden Markov Models (HMM) or an ARMA process.
This approach is proper for long time-series, not for modest or short time-series.

【1】【2】github: Timeseries Classification: KNN & DTW

【时序分割】2017KDD论文 Toeplitz Inverse Covariance-Based Clustering of Multivariate Time Series(TICC)

最新文献

【1】 [KDD2022] Spatial-Temporal Trajectory Similarity Learning in Road Networks (轨迹表示学习)

SAX(Symbolic Aggregate Approximation)符号聚合近似

【1】
【2】
【3】附Python代码
【4】Professor Keogh’s homepage

  • PAA (Piece-wise Average Approximation) 把不同时长的序列都分成n段,每段取它的均值,这样每个时间序列都变成了n维的特征,然后你就可以用欧式距离或者余弦计算相似度了。问题是:分段大丢失信息多,分段小降维程度低,关键是如何选择合适的线段数和合适的分段点。
    有个改进叫APCA, 根据时间序列变化自动确定是否分段,每个子段用该子段上各点的平均值来表示。
    在这里插入图片描述
  • 界标模型(landmark) 将时间序列中一些转折点定义为界标,如局部极大值、极小值和拐点等。每个序列都要对数值标准化,然后通过限定界标的变化幅度和持续时间找出最重要的n个界标。最后用这n个界标计算相似度。(Peng Changshing, Wang Haixun, Zhang Sylvia R, Parker D Stott. Landmarks: A New Model for Similarity-Based Pattern Querying in Time Series Databases[D]. Feb: Proc 16th IEEE Int’1 Conf on Data Engineering, 2000, 675~693)
    在这里插入图片描述

Shapelet

【1】Shapelet : 一种象形化的时间序列特征提取方法
【2】

FFT快速傅立叶变换

【抽稀算法】

【1】轨迹数据预处理

垂直欧式距离

1)Douglas-Peuker 算法(DP)
【1】
2)垂距限值法

时间同步欧氏距离(SED)

3)Top-Down Time Ratio (TDTR)

字符串 近似匹配

【1】 Python中的Levenshtein距离和文本相似度
【2】 信息检索导论读书笔记(三):词典及容错式检索(通配符查询、拼写校正)
【3】 最接近字符串匹配算法

  • LCSS最长公共子序列
  • Dice系数
  • k-gram
  • Soundex:【1】
  • Metaphone

距离度量算法,包括Euclidean算法,用于地址信息项的字段值字符串的相似度计算;
相似性度量算法,包括Cosine算法、Dice算法、Jaccard算法和Overlap算法,用于地址
信息项和分段处理后的数字信息项的字段值字符串的相似度计算;
最长公共子序列算法,包括Needleman-Wunsch算法,用于地址信息项、数字信息项和语
句信息项的字段值字符串的相似度计算;
编辑距离算法,包括Levenshtein Distance算法、Smith-Waterman算法、Jaro算法和
Jaro-Winkler算法,用于地址信息项、数字信息项和语句信息项的字段值字符串的相似度
计算。

基因 序列比对

【1】 生物信息学经典算法之双序列比对
【2】 字符串与模式匹配算法(六):Needleman–Wunsch算法
【3】 详解序列比对算法 01 | 两条序列比对与计分矩阵
【4】 做出漂亮的序列比对alignment图——ENDscript/ESPript

  • Needleman-Wunsch 算法
  • PAM Matrices

轨迹数据挖掘

社交媒体中的时空轨迹模式挖掘TrajectoryPatternMininginSocialMedia.PDF
论文pdf

停留行为 / 驻留点

【代码GitHub】 Q. Li, Y. Zheng, X. Xie, Y. Chen, W. Liu, and W.-Y. Ma, “Mining user similarity based on location history”

low sampling rate – CATS:Clue-Aware Trajectory Similarity

由于轨迹在采集的时候可能会存在大量采样点缺失的轨迹段,而对象的同一种运动行为形成的轨迹在空 间上和时间上应该都比较接近,因此Hung等人通过识别 时空上相似的轨迹,而推断出轨迹中缺失采样点 [16] 。 如图10所示,前三条轨迹的采样点缺失十分严重,通过 CATS(CATS: Clue-Aware Trajectory Similarity)方法,可以找出同一模式的轨迹,将他们的采样点相互补 充,得到一条采样完整的轨迹。CATS可以支持局部时间扭曲,对轨迹的采样率和长度都没有要求,并且对噪声具有鲁棒性。
【1】

时间序列数据挖掘

【1】 将一维时间序列转化成二维图片

降维

1. 局部敏感哈希:LSH

【1】LSH系列3:p-stable LSH&E2LSH——原理介绍
【2】LSH那些事儿 (IV): p-stable LSH

2. 时空索引

【1】 JUST技术:JUST高效时空索引揭秘及使用指南

Hilbert填充曲线
生成方法:
面向字节技术方法、几何方法、L系统方法、IFS迭代函数系统方法等。此外,陈宁涛等提出的方法,采用“矩阵复制、翻转、迭代”的思想,解决大型Hilbert填充曲线生成的效率问题
【1】Hilbert曲线介绍以及代码实现
【2】地理空间索引实现:z 曲线、希尔伯特曲线、四叉树, 最邻近几何特征查询、范围查询

其他

经纬度的距离
Computing with Spatial Trajectories 2011 书 Slides
Chapter 2 Trajectory Indexing and Retrival
时空交通数据预测方法及应用
一些对时间序列数据的理解
基于GPS轨迹数据的检索、分析和挖掘
【文献】Trajectory-Paper-Collation
【代码】Trajectory Similarity Search in Apache Spark

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

轨迹数据 的相关文章

随机推荐

  • 2021-12-21 《聪明的投资者》学习笔记-17.四个非常有启发的案例--失败案例

    摘自 聪明的投资者 The Intelligent Investor 第4版 本杰明 格雷厄姆 第17章 四个非常有启发的案例 失败案例 宾州中央铁路公司的案例 利润不合理 财务实力欠佳 Ling Temco Vought公司 举债扩张 粗
  • 网络知识点------SBC和BSC的定义

    数通知识点学习 2021 7 1 2021 12 31号我就职于浙江大华技术股份有限公司 担任嵌入式软件工程师 2022 1 4我入职中兴通讯 担任数通工程师 从物联网行业跨到通讯行业 有遗憾 有悲伤 也有快乐 希望以后还能继续通过博客记录
  • Qt 查看Qt助手的方法

    为了方便大家自学 在这里提供一种查看Qt助手的方法 1 打开软件点击帮助 在这里可以搜索关键词 2 假设搜索的是QToolBar 3 搜索的全是英文 这时可以点击 4 此时会跳到网页版Qt助手 5 使用的是 Microsoft Edge 浏
  • centos 安装java11

    直接执行 yum list grep java 11 输出结果如下 java 11 openjdk i686 1 11 0 16 0 8 1 el7 9 updates java 11 openjdk x86 64 1 11 0 16 0
  • JavaWeb——JavaWeb核心之Servlet

    一 Servlet简介 1 什么是Servlet Servlet 运行在服务端的Java小程序 是sun公司提供一套规范 接口 用来处理客户端请求 响应给浏览器的动态资源 但servlet的实质就是java代码 通过java的API 动态的
  • Python3-定时任务的四种实现方式

    最近做一个小程序开发任务 主要负责后台部分开发 根据项目需求 需要实现三个定时任务 定时更新微信token 需要2小时更新一次 商品定时上线 定时检测后台服务是否存活 使用Python去实现这三个任务 这里需要使用定时相关知识点 Pytho
  • 如何回答「你的优势和劣势是什么」?【面试核心问题6】

    导读 优势和劣势也是面试中的常问问题 求职者应该有所准备 准备好自己的3个优势和3个劣势 对于优势来说 最好是结合职位要求 或是产品经理的基本能力 谈一些自己具备的和职位相关的优势 并且能拿出证据 经历来证明它 举例 具备良好的沟通能力和组
  • 手机应用软件卸载【adb】

    解决了想卸载 厂商又不让卸载 例 miui广告 卸载小爱等 adb 工具 点击下载 官方下载 安全 附自己的卸载包 adb exe shell pm uninstall user 0 com miui systemAdSolution ad
  • 双系统 Ubuntu grub启动项中 没有Windows的解决

    目标 从ubuntu的grub进入win10系统 实施 以下操作在Ubuntu系统中进行 终端依次执行下面命令 sudo grub install dev sda sudo chmod x etc grub d 30 os prober s
  • 导致项目失败常见的原因有哪些

    一 规划工作做得不细 或缺少灵活性 项目计划始终是项目开始前的热点讨论话题 但是在实际项目进行中仍会出现问题 因此在做好计划之后 在项目实施中项目经理还需要根据项目实际情况做适当的调整 项目经理可以通过进度猫甘特图制作项目计划 调整增加项目
  • 另类的唯品会和得物比价

    目前得物h5和小程序防爬弄得采集数据很费劲 另辟蹊径做了一款通过模拟器和商家后台方式采集数据的方式 目前实现了跟唯品会的比价 运行界面如下 输入品牌名称 点击 开始 表格中左边依次显示唯品会采集的数据 右边会根据采集模式的不同 从安卓模拟器
  • inux字符驱动之read、write部分

    本期主题 linux字符驱动之read write部分 往期链接 linux设备驱动中的并发 linux设备驱动中的编译乱序和执行乱序 linux设备驱动之内核模块 linux字符驱动 linux字符驱动之ioctl部分 linux字符驱动
  • 把手伸向大数据平台的云原生,是如何将大数据平台迁移至K8s上的?

    我们正身处数据大爆炸的时代 据IDC数据显示 仅在2022年 人类就将创造超过97ZB的数据 要知道截至2012年 人类生产的所有印刷材料的数据量为200PB 仅为2022年一年所创造数据量的50万分之一 据预测 中国数据量规模将从2022
  • TMS运输管理系统,对车辆管理、物流运输、效率提升有哪些优势?

    TMS Transport Management System 运输管理系统 其主要功能是对物流中的运输环节进行管理 此系统适用于运输公司 各企业下面的运输队等 系统对车辆 驾驶员 线路 运输方式等进行全面管理 通过系统调度管理 报表分析统
  • TypeScript学习笔记(三) - 方法

    本篇将介绍在TypeScript里如何定义和使用方法 一 方法标准声明和使用 1 方法声明 2 function func x number y number number 3 return x y 4 在TypeScript里 方法声明可
  • INSTALL_FAILED_INVALID_APK: /data/app/vmdl1735842778.tmp/11_app-debug signatures are inconsistent

    坑 背景 这两天无聊想整合一下SDK和Gradle里的东西 然后手贱 整出来一个错误 安装apk报错 INSTALL FAILED INVALID APK data app vmdl1735842778 tmp 11 app debug s
  • 按指定条件从C++11 map中删除元素

    问题 无法使用remove if配合map容器的erase操作按指定条件从map容器删除元素 C 11 解决方案 可以使用一下函数实现这个需求 template
  • pytorchnp.transpose(npimg, (1, 2, 0))

    最近看pytorch的一个代码 结果中间有一句还是看不太懂 最后过了一些阵子才看懂 在此Mark一下 1 代码如下 def imshow img text should save False npimg img numpy 将torch F
  • css实现图片旋转

    一 css实现图片旋转90度 icon moz transform rotate 90deg webkit transform rotate 90deg 二 水平翻转 icon color f64e78 font size 20px dis
  • 轨迹数据

    如何通过轨迹相似性度量方法 发现新冠易感人群 轨迹作为一种时空数据 指的是某物体在空间中的移动路径 通常表示为GPS点的序列 例如tr