轨迹数据

2023-11-16

如何通过轨迹相似性度量方法，发现新冠易感人群
轨迹作为一种时空数据，指的是某物体在空间中的移动路径，通常表示为GPS点的序列，例如tr=<p1→p2→…pn>，其中点pi=(lat,lng,t)，表示该物体在t时刻位于地理坐标位置(lat,lng)上，lat和lng分别表示纬度和经度。
图1：离散的GPS点序列组成轨迹
在这里插入图片描述
带有停留行为的轨迹：包含平均坐标、到达时间(S.arvT)和离开时间(S.levT)的信息。

轨迹数据集

【1】Dataset: GestureMidAirD1。26个界面命令手势
【2】Singapore’s police now have access to contact tracing data
【3】corona virus.jhu.map
【4】 Location-based online social networks: Gowalla / Brightkite 数据集。
该数据集由微软研究院发布。其收集了 182 个用户从 2007 年 4月到 2012 年 8 月的轨迹数据，数据按照严格的时间序列，生成了 17 621 条轨迹，共有 48 000 多小时的记录。记录了用户的工作地点和户外活动等。该数据集是用来进行用户相似度估算、隐私保护、户外推荐和数据挖掘的切合数据.
【5】[Beijing Taxi Data Set] This is a sample of T-Drive trajectory dataset that contains a one-week trajectories of 10,357 taxis. The total number of points in this dataset is about 15 million and the total distance of the trajectories reaches 9 million kilometers.
【6】微软亚洲研究院Geolife项目，GPS轨迹数据（py绘图），github，Python GPS 轨迹聚类（附代码）
【7】 Brinkhoff轨迹生成器，利用德国奥尔登堡市交通网络图作为输入，生成n条移动轨迹。
【8】 HKUST 智慧城市研究小组
【9】出租车gps轨迹
【10】滴滴快的智能出行平台数据2016年8月-成都

【*1】GPS轨迹数据集整理
【*2】
【*3】基于地理位置的用户兴趣推荐有哪些常用数据集？

字符串数据集

【1】北卡罗来纳州选民登记数据集（NCVR）

轨迹应用

定位介绍：如何知道你想找的人的位置（想找到你想找的人）

GPS、LBS基站、IP定位

应用场景：

地图、网约车、外卖、快递

时间序列

相似性度量

【1】时序数据特征提取
【2】时间序列的自回归模型—从线性代数的角度来看
【3】【3】停留点：HGSM——基于层级结构图的相似度分析
【4】轨迹相似度计算方法汇总

加权欧式距离

欧式距离是计算每个时间点上轨迹对应的两个点
的欧式距离, 加权欧式距离是将轨迹点在时间维度上
划分, 每个时间段内的特征点进行特征提取, 并给不同
的时间段赋予不同的权值, 例如, 筛选家庭成员则给予
夜间时间区间以较高的权值, 筛选学习工作同伴则给
予日间时间区间以较高的权值.

（a）Hausdorff 距离

【1】豪斯多夫距离、MindSpore的实现代码

（b）Fréchet distance

【1】弗雷歇距离、python计算
【2】弗雷歇距离，多边形曲线相似性
【3】离散弗雷歇距离、评价曲线相似度

【4】路网匹配理论
【5】深度学习的“瓶颈”与“遛狗”定理

隐式马尔科夫模型（HMM）- 地图匹配

【1】
【2】
【3】使用HMM与osmnx进行地图匹配

时间对齐

python - 如何根据时间对齐数据？：switch开关

聚类

《Time-series clustering – A decade review》
3.1. Finding similar time-series in time
Euclidean distance measure are proper for this objective.
Fourier transforms, wavelets or Piecewise Aggregate Approximation (PAA). Keogh and Kasetty

3.2. Finding similar time-series in shape
elastic methods such as Dynamic time Warping (DTW)

3.3. Finding similar time-series in change (structural similarity)
Hidden Markov Models (HMM) or an ARMA process.
This approach is proper for long time-series, not for modest or short time-series.

【1】【2】github: Timeseries Classification: KNN & DTW

【时序分割】2017KDD论文 Toeplitz Inverse Covariance-Based Clustering of Multivariate Time Series（TICC）

SAX（Symbolic Aggregate Approximation）符号聚合近似

【1】
【2】
【3】附Python代码
【4】Professor Keogh’s homepage

PAA （Piece-wise Average Approximation） 把不同时长的序列都分成n段，每段取它的均值，这样每个时间序列都变成了n维的特征，然后你就可以用欧式距离或者余弦计算相似度了。问题是：分段大丢失信息多，分段小降维程度低，关键是如何选择合适的线段数和合适的分段点。
有个改进叫APCA，根据时间序列变化自动确定是否分段，每个子段用该子段上各点的平均值来表示。
界标模型（landmark） 将时间序列中一些转折点定义为界标，如局部极大值、极小值和拐点等。每个序列都要对数值标准化，然后通过限定界标的变化幅度和持续时间找出最重要的n个界标。最后用这n个界标计算相似度。（Peng Changshing, Wang Haixun, Zhang Sylvia R, Parker D Stott. Landmarks: A New Model for Similarity-Based Pattern Querying in Time Series Databases[D]. Feb: Proc 16th IEEE Int’1 Conf on Data Engineering, 2000, 675~693）

Shapelet

【1】Shapelet : 一种象形化的时间序列特征提取方法
【2】

FFT快速傅立叶变换

【抽稀算法】

【1】轨迹数据预处理

垂直欧式距离

1）Douglas-Peuker 算法（DP）
【1】
2）垂距限值法

时间同步欧氏距离（SED）

3）Top-Down Time Ratio (TDTR)

字符串近似匹配

【1】 Python中的Levenshtein距离和文本相似度
【2】信息检索导论读书笔记（三）：词典及容错式检索（通配符查询、拼写校正）
【3】最接近字符串匹配算法

LCSS最长公共子序列
Dice系数
k-gram
Soundex：【1】
Metaphone

距离度量算法，包括Euclidean算法，用于地址信息项的字段值字符串的相似度计算；
相似性度量算法，包括Cosine算法、Dice算法、Jaccard算法和Overlap算法，用于地址
信息项和分段处理后的数字信息项的字段值字符串的相似度计算；
最长公共子序列算法，包括Needleman-Wunsch算法，用于地址信息项、数字信息项和语
句信息项的字段值字符串的相似度计算；
编辑距离算法，包括Levenshtein Distance算法、Smith-Waterman算法、Jaro算法和
Jaro-Winkler算法，用于地址信息项、数字信息项和语句信息项的字段值字符串的相似度
计算。

基因序列比对

【1】生物信息学经典算法之双序列比对
【2】字符串与模式匹配算法（六）：Needleman–Wunsch算法
【3】详解序列比对算法 01 | 两条序列比对与计分矩阵
【4】做出漂亮的序列比对alignment图——ENDscript/ESPript

Needleman-Wunsch 算法
PAM Matrices

轨迹数据挖掘

社交媒体中的时空轨迹模式挖掘TrajectoryPatternMininginSocialMedia.PDF
论文pdf

停留行为 / 驻留点

【代码GitHub】 Q. Li, Y. Zheng, X. Xie, Y. Chen, W. Liu, and W.-Y. Ma, “Mining user similarity based on location history”

low sampling rate – CATS：Clue-Aware Trajectory Similarity

由于轨迹在采集的时候可能会存在大量采样点缺失的轨迹段，而对象的同一种运动行为形成的轨迹在空间上和时间上应该都比较接近，因此Hung等人通过识别时空上相似的轨迹，而推断出轨迹中缺失采样点 [16] 。如图10所示，前三条轨迹的采样点缺失十分严重，通过 CATS（CATS: Clue-Aware Trajectory Similarity）方法，可以找出同一模式的轨迹，将他们的采样点相互补充，得到一条采样完整的轨迹。CATS可以支持局部时间扭曲，对轨迹的采样率和长度都没有要求，并且对噪声具有鲁棒性。
【1】

时间序列数据挖掘

【1】将一维时间序列转化成二维图片

降维

1. 局部敏感哈希：LSH

【1】LSH系列3：p-stable LSH&E2LSH——原理介绍
【2】LSH那些事儿 (IV): p-stable LSH

2. 时空索引

【1】 JUST技术：JUST高效时空索引揭秘及使用指南

Hilbert填充曲线
生成方法：
面向字节技术方法、几何方法、L系统方法、IFS迭代函数系统方法等。此外，陈宁涛等提出的方法，采用“矩阵复制、翻转、迭代”的思想，解决大型Hilbert填充曲线生成的效率问题
【1】Hilbert曲线介绍以及代码实现
【2】地理空间索引实现：z 曲线、希尔伯特曲线、四叉树, 最邻近几何特征查询、范围查询

其他

经纬度的距离
 Computing with Spatial Trajectories 2011 书 Slides
Chapter 2 Trajectory Indexing and Retrival
时空交通数据预测方法及应用
 一些对时间序列数据的理解
 基于GPS轨迹数据的检索、分析和挖掘
 【文献】Trajectory-Paper-Collation
【代码】Trajectory Similarity Search in Apache Spark

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

轨迹数据的相关文章

2024年金三银四网络安全考试试题

2023年金三银四网络安全考试试题 1 关于数据使用说法错误的是 A 在知识分享案例中如涉及客户网络数据应取敏感化不得直接使用 B 在公开场合公共媒体等谈论传播或发布客户网络中的数据需获得客户书面授权或取敏感化公开渠道获得的除
【C++入门】C++ STL中string常用函数用法总结

目录前言 1 string使用 2 string的常见构造 3 string类对象的访问及遍历迭代器遍历访问 4 string类对象的容量操作 4 1 size和length 4 2 clear empty和capacity 4 3
「网络安全渗透」如果你还不懂CSRF？这一篇让你彻底掌握

1 什么是 CSRF 面试的时候的著名问题谈一谈你对 CSRF 与 SSRF 区别的看法这个问题如果我们用非常通俗的语言讲的话 CSRF 更像是钓鱼的举动是用户攻击用户的而对于 SSRF 来说是由服务器发出请求用户日服务器
【卡尔曼滤波】具有梯度流的一类系统的扩散映射卡尔曼滤波器研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码数据文章
【自适应滤波】一种接近最佳的自适应滤波器，用于突发系统变化研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码及文章
【网络安全】Facebook代码执行实现命令执行、敏感信息泄露

部分网站开设编码练习若安全配置不当则代码执行将升级为操作系统命令注入导致敏感信息泄露本文仅分享命令执行相关知识不承担任何由于传播利用本文所发布内容而造成的任何后果及法律责任未经许可不可转载文章目录信息泄露扩大危害信息
蒙特卡洛在发电系统中的应用（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码实现
2024年华为OD机试真题-转盘寿司-Java-OD统一考试（C卷）

题目描述寿司店周年庆正在举办优惠活动回馈新老客户寿司转盘上总共有n盘寿司 prices i 是第i盘寿司的价格如果客户选择了第i盘寿司寿司店免费赠送客户距离第i盘寿司最近的下一盘寿司 j 前提是prices j lt prices
基于卡尔曼的混合预编码技术用于多用户毫米波大规模MIMO系统研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码及文章
【自适应滤波】一种接近最佳的自适应滤波器，用于突发系统变化研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码及文章
矩阵基本操作

问题描述已知一个n n的矩阵方阵n lt 100 把矩阵主副对角线上的元素值加上x 然后输出这个新矩阵输入格式一行两个变量用空格隔开代表n和x 接下来的n行每行n列表示矩阵的数值用空格隔开输出格式输出新矩阵每个数字5个
【卡尔曼滤波】具有梯度流的一类系统的扩散映射卡尔曼滤波器研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码数据文章
机器学习算法实战案例：Informer实现多变量负荷预测

文章目录机器学习算法实战案例系列答疑技术交流 1 实验数据集 2 如何运行自己的数据集 3 报错分析机器学习算法实战案例系
【卡尔曼滤波】具有梯度流的一类系统的扩散映射卡尔曼滤波器研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 3 参考文献 4 Matlab代码数据文章
「优选算法刷题」：快乐数

一题目编写一个算法来判断一个数 n 是不是快乐数快乐数定义为对于一个正整数每一次将该数替换为它每个位置上的数字的平方和然后重复这个过程直到这个数变为 1 也可能是无限循环但始终变不到 1 如果这个过程结果为 1 那么这个
『力扣刷题本』:逆波兰表达式求值

大家好久不昂最近 1 个多月罗根一直在备考期末文章发的很少现在已经放寒假啦学习自然也不能拉下毕竟 4 月份就要去参加蓝桥杯了先给自己定个小目标日更 2 篇咳咳下面马上开始讲题一题目给你一个字符串数组 tokens 表
内网安全：隧道技术详解

目录隧道技术反向连接技术反向连接实验所用网络拓扑图及说明网络说明防火墙限制说明实验前提说明实战一 CS反向连接上线拿下Win2008 一使用转发代理上线创建监听器二上传后门执行上线隧道技术 SMB协议 SMB协议介绍
【一种新的Burton-Miller型奇异边界方法（BM-SBM）】用于声学设计灵敏度分析，2D和3D声学设计灵敏度分析的奇异边界方法研究（Matlab代码实现）

欢迎来到本博客博主优势博客内容尽量做到思维缜密逻辑清晰为了方便读者座右铭行百里者半于九十本文目录如下目录 1 概述 2 运行结果 2 1 2D 2 2 3D
【方法】如何把Excel“只读方式”变成可直接编辑？

Excel在只读方式下编辑后是无法直接保存原文件的那如何可以直接编辑原文件呢下面来一起看看看吧如果Excel设置的是无密码的只读方式那在打开Excel后会出现对话框提示是否以只读方式打开如果想直接编辑文件选择否
【安全】使用docker安装Nessus

目录一准备docker环境服务器略二安装 2 1 搜索镜像 2 2 拉取镜像 2 3 启动镜像三离线更新插件 3 1 获取challenge 3 2 官方注册获取激活码 3 3 使用challenge码和激活码获取插件下载地址

随机推荐

2021-12-21 《聪明的投资者》学习笔记-17.四个非常有启发的案例--失败案例

摘自聪明的投资者 The Intelligent Investor 第4版本杰明格雷厄姆第17章四个非常有启发的案例失败案例宾州中央铁路公司的案例利润不合理财务实力欠佳 Ling Temco Vought公司举债扩张粗
网络知识点------SBC和BSC的定义

数通知识点学习 2021 7 1 2021 12 31号我就职于浙江大华技术股份有限公司担任嵌入式软件工程师 2022 1 4我入职中兴通讯担任数通工程师从物联网行业跨到通讯行业有遗憾有悲伤也有快乐希望以后还能继续通过博客记录
Qt 查看Qt助手的方法

为了方便大家自学在这里提供一种查看Qt助手的方法 1 打开软件点击帮助在这里可以搜索关键词 2 假设搜索的是QToolBar 3 搜索的全是英文这时可以点击 4 此时会跳到网页版Qt助手 5 使用的是 Microsoft Edge 浏
centos 安装java11

直接执行 yum list grep java 11 输出结果如下 java 11 openjdk i686 1 11 0 16 0 8 1 el7 9 updates java 11 openjdk x86 64 1 11 0 16 0
JavaWeb——JavaWeb核心之Servlet

一 Servlet简介 1 什么是Servlet Servlet 运行在服务端的Java小程序是sun公司提供一套规范接口用来处理客户端请求响应给浏览器的动态资源但servlet的实质就是java代码通过java的API 动态的
Python3-定时任务的四种实现方式

最近做一个小程序开发任务主要负责后台部分开发根据项目需求需要实现三个定时任务定时更新微信token 需要2小时更新一次商品定时上线定时检测后台服务是否存活使用Python去实现这三个任务这里需要使用定时相关知识点 Pytho
如何回答「你的优势和劣势是什么」？【面试核心问题6】

导读优势和劣势也是面试中的常问问题求职者应该有所准备准备好自己的3个优势和3个劣势对于优势来说最好是结合职位要求或是产品经理的基本能力谈一些自己具备的和职位相关的优势并且能拿出证据经历来证明它举例具备良好的沟通能力和组
手机应用软件卸载【adb】

解决了想卸载厂商又不让卸载例 miui广告卸载小爱等 adb 工具点击下载官方下载安全附自己的卸载包 adb exe shell pm uninstall user 0 com miui systemAdSolution ad
双系统 Ubuntu grub启动项中没有Windows的解决

目标从ubuntu的grub进入win10系统实施以下操作在Ubuntu系统中进行终端依次执行下面命令 sudo grub install dev sda sudo chmod x etc grub d 30 os prober s
导致项目失败常见的原因有哪些

一规划工作做得不细或缺少灵活性项目计划始终是项目开始前的热点讨论话题但是在实际项目进行中仍会出现问题因此在做好计划之后在项目实施中项目经理还需要根据项目实际情况做适当的调整项目经理可以通过进度猫甘特图制作项目计划调整增加项目
另类的唯品会和得物比价

目前得物h5和小程序防爬弄得采集数据很费劲另辟蹊径做了一款通过模拟器和商家后台方式采集数据的方式目前实现了跟唯品会的比价运行界面如下输入品牌名称点击开始表格中左边依次显示唯品会采集的数据右边会根据采集模式的不同从安卓模拟器
inux字符驱动之read、write部分

本期主题 linux字符驱动之read write部分往期链接 linux设备驱动中的并发 linux设备驱动中的编译乱序和执行乱序 linux设备驱动之内核模块 linux字符驱动 linux字符驱动之ioctl部分 linux字符驱动
把手伸向大数据平台的云原生，是如何将大数据平台迁移至K8s上的？

我们正身处数据大爆炸的时代据IDC数据显示仅在2022年人类就将创造超过97ZB的数据要知道截至2012年人类生产的所有印刷材料的数据量为200PB 仅为2022年一年所创造数据量的50万分之一据预测中国数据量规模将从2022
TMS运输管理系统，对车辆管理、物流运输、效率提升有哪些优势？

TMS Transport Management System 运输管理系统其主要功能是对物流中的运输环节进行管理此系统适用于运输公司各企业下面的运输队等系统对车辆驾驶员线路运输方式等进行全面管理通过系统调度管理报表分析统
TypeScript学习笔记（三） - 方法

本篇将介绍在TypeScript里如何定义和使用方法一方法标准声明和使用 1 方法声明 2 function func x number y number number 3 return x y 4 在TypeScript里方法声明可
INSTALL_FAILED_INVALID_APK: /data/app/vmdl1735842778.tmp/11_app-debug signatures are inconsistent

坑背景这两天无聊想整合一下SDK和Gradle里的东西然后手贱整出来一个错误安装apk报错 INSTALL FAILED INVALID APK data app vmdl1735842778 tmp 11 app debug s
按指定条件从C++11 map中删除元素

问题无法使用remove if配合map容器的erase操作按指定条件从map容器删除元素 C 11 解决方案可以使用一下函数实现这个需求 template
pytorchnp.transpose(npimg, (1, 2, 0))

最近看pytorch的一个代码结果中间有一句还是看不太懂最后过了一些阵子才看懂在此Mark一下 1 代码如下 def imshow img text should save False npimg img numpy 将torch F
css实现图片旋转

一 css实现图片旋转90度 icon moz transform rotate 90deg webkit transform rotate 90deg 二水平翻转 icon color f64e78 font size 20px dis
轨迹数据

如何通过轨迹相似性度量方法发现新冠易感人群轨迹作为一种时空数据指的是某物体在空间中的移动路径通常表示为GPS点的序列例如tr