+= 对不存在的数据帧进行操作

2024-02-12

df_对：

city1   city2
0   sfo yyz
1   sfo yvr
2   sfo dfw
3   sfo ewr

df_pairs.to_dict('records') 的输出：

[{'city1': 'sfo', 'city2': 'yyz'},
 {'city1': 'sfo', 'city2': 'yvr'},
 {'city1': 'sfo', 'city2': 'dfw'},
 {'city1': 'sfo', 'city2': 'ewr'}]

data_df:

    city    2016-02-02 00:00:00 2016-02-05 00:00:00 2016-02-01 00:00:00 2016-02-04 00:00:00 2016-02-03 00:00:00
0   sfo -33.63  -62.34  -35.70  -31.84  -33.87
1   yyz -24.31  -51.17  -22.07  -31.00  -23.00
2   yvr -24.31  -51.17  -22.07  -31.00  -23.00
3   dfw -32.17  -43.77  -34.84  0.27    -11.49
4   ewr -28.87  -59.66  -28.40  -32.94  -29.06

data_df.to_dict('records') 的输出

[{'city': 'sfo',
  Timestamp('2016-02-02 00:00:00'): -33.63,
  Timestamp('2016-02-05 00:00:00'): -62.34,
  Timestamp('2016-02-01 00:00:00'): -35.7,
  Timestamp('2016-02-04 00:00:00'): -31.84,
  Timestamp('2016-02-03 00:00:00'): -33.87},
 {'city': 'yyz',
  Timestamp('2016-02-02 00:00:00'): -24.31,
  Timestamp('2016-02-05 00:00:00'): -51.17,
  Timestamp('2016-02-01 00:00:00'): -22.07,
  Timestamp('2016-02-04 00:00:00'): -31.0,
  Timestamp('2016-02-03 00:00:00'): -23.0},
 {'city': 'yvr',
  Timestamp('2016-02-02 00:00:00'): -24.31,
  Timestamp('2016-02-05 00:00:00'): -51.17,
  Timestamp('2016-02-01 00:00:00'): -22.07,
  Timestamp('2016-02-04 00:00:00'): -31.0,
  Timestamp('2016-02-03 00:00:00'): -23.0},
 {'city': 'dfw',
  Timestamp('2016-02-02 00:00:00'): -32.17,
  Timestamp('2016-02-05 00:00:00'): -43.77,
  Timestamp('2016-02-01 00:00:00'): -34.84,
  Timestamp('2016-02-04 00:00:00'): 0.27,
  Timestamp('2016-02-03 00:00:00'): -11.49},
 {'city': 'ewr',
  Timestamp('2016-02-02 00:00:00'): -28.87,
  Timestamp('2016-02-05 00:00:00'): -59.66,
  Timestamp('2016-02-01 00:00:00'): -28.4,
  Timestamp('2016-02-04 00:00:00'): -32.94,
  Timestamp('2016-02-03 00:00:00'): -29.06}]

所以我有一个名为df_pairs。对于每一对df_pairs，我想在中查找 city1 和 city2data_df，从另一个中减去一个，取差时间序列的符号，分离正负符号值，分离正差值和负差值，并计算 data_df 列中每一列的总和。

diff_df_sign_pos = diff_df_sign_neg = diff_df_pos = diff_df_neg = 0

for i in range(0,len(data_df.columns)):
    a = pd.merge(df_pairs[['city1','city2']], data_df.ix[:, [i]], left_on='city1', right_index=True, how='left').set_index(['city1', 'city2'])
    b = pd.merge(df_pairs[['city1','city2']], data_df.ix[:, [i]], left_on='city2', right_index=True, how='left').set_index(['city1', 'city2'])
    diff_df = b - a
    diff_df_sign = np.sign(diff_df)
    diff_df_sign_pos+= diff_df_sign.clip(lower=0)
    diff_df_sign_neg+= diff_df_sign.clip(upper=0)
    diff_df_pos+= diff_df.clip(lower=0)
    diff_df_neg+= diff_df.clip(upper=0)

如果运行上面的代码，您将看到最终值diff_df_sign_pos, diff_df_sign_neg, diff_df_pos and diff_df_neg是 NaN。

例如，最终结果为diff_df_sign_pos应该看起来像：

               2016-02-03 00:00:00
city1    city2  
sfo      yyz    5.0
         yvr    5.0
         dfw    5.0
         ewr    4.0

这告诉我们 yyz、yvr、dfw 和 sfo 之间的所有 5 个差异都是正的。

你为什么不简单地这样做：

df_city1 = pd.merge(df_pairs['city1'], data_df, left_on='city1', right_on='city', how='left')
df_city2 = pd.merge(df_pairs['city2'], data_df, left_on='city2', right_on='city', how='left')
diff = df_city2.subtract(df_city1, fill_value=0)
pos_sum = diff[diff >= 0].sum(axis=1)
neg_sum = diff[diff <  0].sum(axis=1)

不要循环遍历所有列，而是合并 2*（列数）次，更不用说索引了，然后使用复杂的位np.sign and .clip... 你的df_pairs and data_df是一一对应的吧？

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

+= 对不存在的数据帧进行操作的相关文章

在 Tensorflow tf.nn.nce_loss 中出现 TypeError：'Mul' Op 的输入 'y' 的类型为 float32，与参数 'x' 的 int32 类型不匹配

我正在研究 Tensor Flow 中的 Bag of Words 实现并得到了类型错误 Mul Op 的输入 y 的类型为 float32 与参数 x 的 int32 类型不匹配在 tf nn nce loss 中我尝试查看 tf
如何使用 Plotly 中的直方图将所有离群值分入一个分箱？

所以问题是我可以在 Plotly 中绘制直方图其中所有大于某个阈值的值都将被分组到一个箱中吗所需的输出但使用标准情节Histogram类我只能得到这个输出 import pandas as pd from plotly import
如何在 pytest 中将单元测试和集成测试分开

根据维基百科 https en wikipedia org wiki Unit testing Description和各种articles https techbeacon com devops 6 best practices inte
如何计算numpy数组中元素的频率？

我有一个 3 D numpy 数组其中包含重复的元素 counterTraj shape 13530 1 1 例如 counterTraj 包含这样的元素我只显示了几个元素 array 136 129 130 103 102 101 我
切片 Dataframe 时出现 KeyError

我的代码如下所示 d pd read csv Collector Output csv df pd DataFrame data d dfa df copy dfa dfa rename columns OBJECTID Object ID
为什么在 Python 2.4 中使用 Unicode 数据会出现 ASCII 编码错误，而在 2.7 中却不会？

我有一个程序当在 Python 2 7 中运行时会生成正确的 Unicode 输出到标准输出当在 Python 2 4 中运行时我得到UnicodeEncodeError ascii codec can t encode chara
从 python 发起 SSH 隧道时出现问题

目标是在卫星服务器和集中式注册数据库之间建立 n 个 ssh 隧道我已经在我的服务器之间设置了公钥身份验证因此它们只需直接登录而无需密码提示怎么办我试过帕拉米科它看起来不错但仅仅建立一个基本的隧道就变得相当复杂尽管代码示例将受
按元组分隔符拆分列表

我有清单 print L I WW am XX newbie YY ZZ You WW are XX cool YY ZZ 我想用分隔符将列表拆分为子列表 ZZ print new L I WW am XX newbie YY ZZ You
如何使用列表作为pandas数据框中的值？

我有一个数据框需要列的子集包含具有多个值的条目下面是一个带有运行时列的数据框其中包含程序在各种条件下的运行时 df condition a runtimes 1 1 5 2 condition b runtimes 0 5 0 7
Python 将日志滚动到变量

我有一个使用多线程并在服务器后台运行的应用程序为了无需登录服务器即可监控应用程序我决定包括Bottle http bottlepy org为了响应一些HTTP端点并报告状态执行远程关闭等我还想添加一种查阅日志文件的方法我可以使用以
无法在 osx-arm64 上安装 Python 3.7

我正在尝试使用 Conda 创建一个带有 Python 3 7 的新环境例如 conda create n qnn python 3 7 我收到以下错误 Collecting package metadata current repoda
使用yield 进行字典理解

作为一个人为的例子 myset set a b c d mydict item yield join item s for item in myset and list mydict gives as cs bs ds a None b N
默认情况下，Keras 自定义层参数是不可训练的吗？

我在 Keras 中构建了一个简单的自定义层并惊讶地发现参数默认情况下未设置为可训练我可以通过显式设置可训练属性来使其工作我无法通过查看文档或代码来解释为什么会这样这是应该的样子还是我做错了什么导致默认情况下参数不可训练代码 im
使用 PyTorch 分布式 NCCL 连接失败

我正在尝试使用 torch distributed 将 PyTorch 张量从一台机器发送到另一台机器 dist init process group 函数正常工作但是 dist broadcast 函数中出现连接失败这是我在节点 0
Ubuntu 上的 Python 2.7

我是 Python 新手正在 Linux 机器 Ubuntu 10 10 上工作它正在运行 python 2 6 但我想运行 2 7 因为它有我想使用的功能有人敦促我不要安装 2 7 并将其设置为我的默认 python 我的问题是如
在Python中按属性获取对象列表中的索引

我有具有属性 id 的对象列表我想找到具有特定 id 的对象的索引我写了这样的东西 index 1 for i in range len my list if my list i id specific id index i break
字典和数组作为类变量与实例变量

这是赚取积分的简单方法请解释以下内容 class C a b 0 c def init self self x def d self k v self x k v self a k v self b v self c append v d
Elastic Beanstalk 中的 enum34 问题

我正在尝试在 Elastic Beanstalk 中设置 django 环境当我尝试通过requirements txt 文件安装时我遇到了python3 6 问题 File opt python run venv bin pip li
Python 无法使用套接字绑定我的外部/公共 IP 地址，给出错误但是当使用本地 IP 地址时，错误不会显示

这是出现主要错误的代码与我的本地 IP 的绑定将起作用 s bind 192 168 1 4 port 与我的公共 IP 的绑定失败并出现以下错误 s bind 99 99 99 99 port WinError 10049 请求的地址在
迭代 pandas 数据框的最快方法？

如何运行数据框并仅返回满足特定条件的行必须在之前的行和列上测试此条件例如 1 2 3 4 1 1 1999 4 2 4 5 1 2 1999 5 2 3 3 1 3 1999 5 2 3 8 1 4 1999 6 4 2 6 1 5 1

随机推荐

实体框架代码优先 - 多对多 - 包括条件

我有两个实体Store and Catalog 使用流畅的 Api 建立多对多关系我想通过以下方式获得商店id所有目录的状态都等于已发布下面我尝试编写以下查询但没有得到预期的结果 var store context Stores I
Powershell 不允许我打开 firebase CLI

每次我输入命令 firebase login 时 Powershell 都不会让我打开 firebase 出现了问题如何打开文件 ihc 以前用 powershell 打开 firebase 从来没有遇到过问题现在我明白了在此输入图像描
clearInterval 在reactjs 中不起作用

SetInterval 工作正常但clearInterval 不起作用查看我的代码我有父类 Channel 和子类 Body 当调用 componentDidMount 时在 body 内然后我为函数刷新状态设置间隔在刷新状态函
使用管道在 bash 中划分的最佳方法？

我只是在寻找一种简单的方法来除法或提供其他数学函数假设我有以下命令 find name mp4 wc l 如何获取 wc l 的结果并将其除以 3 我见过的例子不涉及重定向出入 Using bc bc l lt lt lt scale
如何将参数传递给 DbMigration.Sql() 方法

使用实体框架迁移时 DbMigration基类有一个 Sql 方法它接受匿名对象中的参数 http msdn microsoft com en us library system data entity migrations dbmigr
D3.js：如何在版本 4 中向直方图添加分布线

Note 这个问题 https stackoverflow com questions 41248649 d3 js how to add distribution curves to histograms in version 4是关于c
如何获取 UICollectionView 标头的索引路径？

使用视图的indexPathForItemAtPoint 我将获得单元格的索引路径但永远不会获得UICollectionReusableView 页眉页脚因为它总是返回nil override func collectionView
如何在android中以编程方式绘制下面的图像？

我是安卓新手我发现使用画布非常困难如何在android中绘制下面的图像我还想让选定的字母在触摸时突出显示这里是
在 Powershell 中列出给定深度或以下的文件夹

我有一个包含很多文件夹的目录我想列出所有深度超过 2 层的文件夹路径因此在下面的情况下文件夹 1 和 2 Directory folder1 Directory folder1 test1 test testsub Director
HttpWebRequest：请求已中止：请求已取消

我一直致力于开发某种中间人应用程序该应用程序使用一系列日期通常一次 7 个的 HTTP post 请求将文本上传到 CMS 后端我正在使用 HttpWebRequest 来完成此任务第一次约会似乎工作正常但是当第二次约会开始时
XPath 1.0 用于查找元素的值是否在值列表中

有没有办法构造一个 XPath 来评估元素的值是否在预定义的值列表中与此类似的东西 Location Addr State TX or AL or MA 哪一个将与德克萨斯州阿拉巴马州或马萨诸塞州的州元素相匹配我知道我无法解压该表达式
Foverlaps 错误： if (any(x[[xintervals[2L]]] - x[[xintervals[1L]]] < 0L)) stop 中出错

我可以成功使用foverlaps使用我的数据集的一小部分样本但是当使用完整数据超过 30k 行的 data tables 时它会崩溃并抛出以下错误错误信息 Error in if any x xintervals 2L x xint
数据库在 QuerySet.dates() 中返回无效值

在将一些 Wordpress 内容导入 Mezzanine 的 blog blogpost 后我在安装了 mysql 5 5 的 Ubuntu 12 04 机器上收到此错误 ValueError at admin blog blogpo
如何在块内制作边框底部？ [关闭]

Closed 这个问题需要细节或清晰度 help closed questions 目前不接受答案怎么做border bottom悬停事件后在块内我尝试使用文本阴影但似乎这不是解决方案嵌入框阴影似乎就是您所需要的 div heigh
如何使用户定义类型像内置类型一样*精确地*初始化？

我想创建一个包装数字类型的类型并提供附加功能此外我需要号码和包装纸两者都可以隐式转换对彼此到目前为止我有 template
您可以插入表的最大列数/值数 - mysql

有谁知道你可以的最大列数值是多少插入一个表 mysql 我收到错误 IDK 20 列值是的 of col no of val INSERT INTO comenzi a b c d e f VALUES 1 2 3 4 5 6 硬限制
Python boto，列出存储桶中特定目录的内容

我只能通过 S3 访问 S3 存储桶中的特定目录例如与s3cmd如果我尝试列出整个存储桶则命令 s3cmd ls s3 bucket name 我收到错误 Access to bucket my bucket url was deni
我可以在 Windows 10/Windows 8/WinRT 中唯一标识设备吗

是否有任何机制可以唯一地标识设备即使它是匿名的需要明确的是设备是指计算机平板电脑个人电脑 Windows 8 x http codepaste net ybt893 http codepaste net ybt893 strin
JavaFX 透明窗口仅接收绘制像素上的鼠标事件

我想要一个与屏幕大小相同的舞台它完全透明并可以在任何地方接收鼠标事件在下面的示例中仅当鼠标位于圆圈上方时我才会收到鼠标事件我在使用 Java 8u11 的 Windows XP 和 Windows 7 上看到此问题 import j
+= 对不存在的数据帧进行操作

df 对 city1 city2 0 sfo yyz 1 sfo yvr 2 sfo dfw 3 sfo ewr df pairs to dict records 的输出 city1 sfo city2 yyz city1 sfo city

+= 对不存在的数据帧进行操作

+= 对不存在的数据帧进行操作 的相关文章

随机推荐

热门标签

+= 对不存在的数据帧进行操作的相关文章