每个点都有时间序列的点之间的相关性下降

2024-03-05

我正在研究如何快速实现计算点（X、Y、Z 中）之间的相关性，并在给定搜索方向的情况下测量相关性何时低于某个阈值。我之前提出过一个相关问题计算点之间的相关性，其中每个点都有一个时间序列 https://stackoverflow.com/questions/70390466/calculating-correlation-between-points-where-each-points-has-a-timeseries但我认为我需要重新表述这个问题以使其更清楚。

我有平面上点速度的时间历史，例如 XZ 平面，我想量化用于模拟（CFD 模拟）的分辨率。为此，我想计算点之间的速度时程之间的皮尔逊相关系数，并且我想测量给定轴（例如沿 X 轴）的点数，直到相关性降至某个阈值以下（对于示例 0.8）。

我现在将所有数据都存储在 DataFrame 中，其头部如下所示：

    Velocity      X  Y      Z   Time  
0 -12.125850  2.036  0  1.172  10.42
1 -12.516033  2.036  0  1.164  10.42
2 -11.816067  2.028  0  1.172  10.42
3 -10.722124  2.020  0  1.180  10.42
4 -10.628474  2.012  0  1.188  10.42
...

我想要作为输出在某些方向上的点数，只是作为一个例子

    X    Y      Z  CorrDropNrPointsX       CorrDropNrPointsZ       
0 2.036  0  1.172  5                       12
1 2.036  0  1.164  7                       21
2 2.028  0  1.172  4                       18 
3 2.020  0  1.180  12                      19
4 2.012  0  1.188  5                       22
...

在我当前的实现中，我经常最终使用循环，例如 .iterrows() ，这需要很长时间，因为我的 DataFrame 中可以轻松拥有 300 000 行，所以我需要加快速度。

我现在使用线来检测某个方向沿轴的点数

df_lines = df[[loop_axis]].drop_duplicates()

但平面上的点不一定完全对齐（可能存在 1-e4 m 数量级的微小数值差异，这可能会导致这种方法出现错误，有时这些点可能会结束，因为平面正好穿过几何图形，如果碰巧，点集应该被视为彼此独立，例如对于阈值距离 D_L ~ 1-e2 m。

我之前得到的解决方案非常强大，可以使用以下方法计算所有点之间的相关性

df["cc"] = df.groupby(["X", "Y", "Z"]).cumcount()
df.set_index(["cc","X", "Y", "Z"], inplace=True)
df.unstack(level=[1,2,3])["Velocity"].corr()

然而我意识到这些点在加载时不一定以正确的方式排序，所以这需要完成，对于最终的数据帧，我仍然最终循环遍历行或列来测量相关性何时低于某个阈值。这种方法的另一个问题是，它会计算所有点之间的相关性，因此它将计算 corr(P1,P2) 和 corr(P2,P1) 以及所有点。我不需要计算对角点之间的相关性，而只需要计算定义方向上的相关性。

所有点都具有相同数量的时间点，因此以相同的频率和相同的开始和结束时间对它们进行采样。

我想我有点明白你想要什么。

corr_df = df.unstack(level=[1,2,3])["Velocity"].corr()

每个点都有时间序列的点之间的相关性下降的相关文章

如何使用 opencv.omnidir 模块对鱼眼图像进行去扭曲

我正在尝试使用全向模块 http docs opencv org trunk db dd2 namespacecv 1 1omnidir html用于对鱼眼图像进行扭曲处理Python 我正在尝试适应这一点C 教程 http docs op
安装了 32 位的 Python，显示为 64 位

我需要运行 32 位版本的 Python 我认为这就是我在我的机器上运行的因为这是我下载的安装程序当我重新运行安装程序时它会将当前安装的 Python 版本称为 Python 3 5 32 位然而当我跑步时platform arch
独立滚动矩阵的行

我有一个矩阵准确地说是 2d numpy ndarray A np array 4 0 0 1 2 3 0 0 5 我想滚动每一行A根据另一个数组中的滚动值独立地 r np array 2 0 1 也就是说我想这样做 print np
如何使用 Pandas、Numpy 加速 Python 中的嵌套 for 循环逻辑？

我想检查一下表的字段是否TestProject包含了Client端传入的参数嵌套for循环很丑陋有什么高效简单的方法来实现吗非常感谢您的任何建议 def test parameter a list parameter b list g
使用 xlrd 打开 BytesIO (xlsx)

我正在使用 Django 需要读取上传的 xlsx 文件的工作表和单元格使用 xlrd 应该可以但因为文件必须保留在内存中并且可能不会保存到我不知道如何继续的位置本例中的起点是一个带有上传输入和提交按钮的网页提交后文件被捕获req
为什么 PyYAML 花费这么多时间来解析 YAML 文件？

我正在解析一个大约 6500 行的 YAML 文件格式如下 foo1 bar1 blah name john age 123 metadata whatever1 whatever whatever2 whatever stuff thi
从Python中的字典列表中查找特定值

我的字典列表中有以下数据 data I versicolor 0 Sepal Length 7 9 I setosa 0 I virginica 1 I versicolor 0 I setosa 1 I virginica 0 Sepal
如何使用python在一个文件中写入多行

如果我知道要写多少行我就知道如何将多行写入一个文件但是当我想写多行时问题就出现了但是我不知道它们会是多少我正在开发一个应用程序它从网站上抓取并将结果的链接存储在文本文件中但是我们不知道它会回复多少行我的代码现在如下 r
javascript 是否有等效的 __repr__ ？

我最接近Python的东西repr这是 function User name password this name name this password password User prototype toString function r
不同编程语言中的浮点数学

我知道浮点数学充其量可能是丑陋的但我想知道是否有人可以解释以下怪癖在大多数编程语言中我测试了 0 4 到 0 2 的加法会产生轻微的错误而 0 4 0 1 0 1 则不会产生错误两者计算不平等的原因是什么在各自的编程语言中可以采
如何断言 Unittest 上的可迭代对象不为空？

向服务提交查询后我会收到一本字典或一个列表我想确保它不为空我使用Python 2 7 我很惊讶没有任何assertEmpty方法为unittest TestCase类实例现有的替代方案看起来并不正确 self assertTrue
为什么 Pickle 协议 4 中的 Pickle 文件是协议 3 中的两倍，而速度却没有任何提升？

我正在测试 Python 3 4 我注意到 pickle 模块有一个新协议因此我对 2 个协议进行了基准测试 def test1 pickle3 open pickle3 wb for i in range 1000000 pickle
Python：XML 内所有标签名称中的字符串替换（将连字符替换为下划线）

我有一个格式不太好的 XML 标签名称内有连字符我想用下划线替换它以便能够与 lxml objectify 一起使用我想替换所有标签名称包括嵌套的子标签示例 XML
如何在 pygtk 中创建新信号

我创建了一个 python 对象但我想在它上面发送信号我让它继承自 gobject GObject 但似乎没有任何方法可以在我的对象上创建新信号您还可以在类定义中定义信号 class MyGObjectClass gobject GO
在本地网络上运行 Bokeh 服务器

我有一个简单的 Bokeh 应用程序名为app py如下 contents of app py from bokeh client import push session from bokeh embed import server do
Scipy Sparse：SciPy/NumPy 更新后出现奇异矩阵警告

我的问题是由大型电阻器系统的节点分析产生的我基本上是在设置一个大的稀疏矩阵A 我的解向量b 我正在尝试求解线性方程A x b 为了做到这一点我正在使用scipy sparse linalg spsolve method 直到最近一切都
Django-tables2 列总计

我正在尝试使用此总结列中的所有值文档 https github com bradleyayers django tables2 blob master docs pages column headers and footers rst 但页
如何计算Python中字典中最常见的前10个值

我对 python 和一般编程都很陌生所以请友善我正在尝试分析包含音乐信息的 csv 文件并返回最常听的前 n 个乐队从下面的代码中每听一首歌曲都是一个列表中的字典条目格式如下 album Exile on Main Street
更改 Tk 标签小部件中单个单词的颜色

我想更改 Tkinter 标签小部件中单个单词的字体颜色我知道可以使用文本小部件来实现与我想要完成的类似的事情例如使单词 YELLOW 显示为黄色 self text tag config tag yel fg clr yellow s
使用 z = f(x, y) 形式的 B 样条方法来拟合 z = f(x)

作为一个潜在的解决方案这个问题 https stackoverflow com questions 76476327 how to avoid creating many binary switching variables in gekk

随机推荐

在固定宽度

每个点都有时间序列的点之间的相关性下降

python

pandas

DataFrame

correlation

pearsoncorrelation

每个点都有时间序列的点之间的相关性下降的相关文章

如何使用 opencv.omnidir 模块对鱼眼图像进行去扭曲

安装了 32 位的 Python，显示为 64 位

独立滚动矩阵的行

如何使用 Pandas、Numpy 加速 Python 中的嵌套 for 循环逻辑？

使用 xlrd 打开 BytesIO (xlsx)

为什么 PyYAML 花费这么多时间来解析 YAML 文件？

从Python中的字典列表中查找特定值

如何使用python在一个文件中写入多行

javascript 是否有等效的 repr ？

不同编程语言中的浮点数学

如何断言 Unittest 上的可迭代对象不为空？

为什么 Pickle 协议 4 中的 Pickle 文件是协议 3 中的两倍，而速度却没有任何提升？

Python：XML 内所有标签名称中的字符串替换（将连字符替换为下划线）

如何在 pygtk 中创建新信号

在本地网络上运行 Bokeh 服务器

Scipy Sparse：SciPy/NumPy 更新后出现奇异矩阵警告

Django-tables2 列总计

如何计算Python中字典中最常见的前10个值

更改 Tk 标签小部件中单个单词的颜色

使用 z = f(x, y) 形式的 B 样条方法来拟合 z = f(x)

随机推荐

在固定宽度

每个点都有时间序列的点之间的相关性下降

每个点都有时间序列的点之间的相关性下降 的相关文章

随机推荐

每个点都有时间序列的点之间的相关性下降的相关文章