如何使用从其他数据帧计算出的值有效地填充数据帧列

2024-03-20

我正在尝试填充数据框（elist）与公司的累积回报和累积市场回报。这可以通过使用循环遍历 elist 数据框来完成iterrows，看这个link https://stackoverflow.com/questions/42593859/why-cant-iterrows-do-math-and-instead-returns-integer-values-where-these-shou。然而，这很慢。

我正在寻找更有效、更快的解决方案。

作为累积收益计算输入的原始收益源自两个数据帧 (ri, rm)。结果应记录在以下列中elist。请参阅下面的示例，使用此中的数据file https://www.dropbox.com/s/r69b54q2zw1wp7q/cumrets.zip?dl=0.

在运行之前iterrows loop, elist好像：

    permno  begdat      enddat   return vwretd
0   11628   2012-03-31  2013-03-31  NaN NaN
1   11628   2012-06-30  2013-06-30  NaN NaN
2   11628   2012-09-30  2013-09-30  NaN NaN
3   11628   2012-12-31  2013-12-31  NaN NaN
4   11628   2013-03-31  2014-03-31  NaN NaN

运行循环后elist应该看起来像：

    permno   begdat     enddat      return      vwretd
0   11628   2012-03-31  2013-03-31  0.212355    0.133429
1   11628   2012-06-30  2013-06-30  0.274788    0.198380
2   11628   2012-09-30  2013-09-30  0.243590    0.198079
3   11628   2012-12-31  2013-12-31  0.299277    0.304479
4   11628   2013-03-31  2014-03-31  0.303147    0.208454

这是依赖 iterrows 的代码，速度很慢：

import os,sys
import pandas as pd
import numpy as np
rm     = pd.read_csv('rm_so.csv') # market return
ri     = pd.read_csv('ri_so.csv') # firm return
elist  = pd.read_csv('elist_so.csv') # table to be filled with cumlative returns over a period (begdat to enddat)
for index, row in elist.iterrows():
    #fill cumulative market return
    elist.loc[index, 'vwretd']=rm.loc[(rm['date']>row['begdat']) & (rm['date']<=row['enddat']),'vwretd'].product()-1    
    #fill cumulative firm return
    r = ri.loc[(ri['permno']==row['permno']),]
    elist.loc[index, 'return'] = r.loc[(r['date']>row['begdat']) & (r['date']<=row['enddat']),'ret'].product()-1

很高兴看到这个过程运行得更快！

None

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

如何使用从其他数据帧计算出的值有效地填充数据帧列的相关文章

ca 证书 Mac OS X

我需要在emacs 上安装offlineimap 和mu4e 问题是配置当我运行 Offlineimap 时我得到 OfflineIMAP 6 5 5 Licensed under the GNU GPL v2 v2 or any la
以矢量化方式在另一个 DataFrame 中查找包含值子集的行

如何匹配此 DataFrame 中的值source car id lat lon 0 100 10 0 15 0 1 100 12 0 10 0 2 100 09 0 08 0 3 110 23 0 12 0 4 110 18 0 32 0
Pandas 连接问题：列重叠但未指定后缀

我有以下数据框 print df a mukey DI PI 0 100000 35 14 1 1000005 44 14 2 1000006 44 14 3 1000007 43 13 4 1000008 43 13 print df b
使用多级解决方案计算二维网格中的最近邻

我有一个问题在 x y 大小的网格中我提供了一个点并且我需要找到最近的邻居在实践中我试图在 pygame 中找到距离光标最近的点该点跨越颜色距离阈值计算如下 sqrt rgb1 0 rgb2 0 2 rgb1 1 rgb2 1
如何使用 i18n 切换器将“LANGUAGE_CODE”保存到数据库，以便在 Django 中的不同浏览器中语言不会更改？

有什么办法可以改变它的值LANGUAGE CODE单击按钮发送请求时 settings py 中的变量会动态变化吗我希望用户设置自己的默认语言他们的帐户现在用户可以使用下拉列表选择他们的首选语言并且网站会得到完美的翻译并且
张量流和线程

下面是来自 Tensorflow 网站的简单 mnist 教程即单层 softmax 我尝试通过多线程训练步骤对其进行扩展 from tensorflow examples tutorials mnist import input dat
scikit-learn 和tensorflow 有什么区别？可以一起使用它们吗？

对于这个问题我无法得到满意的答案据我了解 TensorFlow是一个数值计算库经常用于深度学习应用而Scikit learn是一个通用机器学习框架但它们之间的确切区别是什么 TensorFlow 的目的和功能是什么我可以一起使用它
Tensorflow 不分配完整的 GPU 内存

Tensorflow 默认分配所有 GPU 内存但我的新设置实际上只有 9588 MiB 11264 MiB 我预计大约 11 000MiB 就像我的旧设置一样张量流信息在这里 from tensorflow python client
如何使用 PyMongo 在重复键错误后继续插入

如果我需要在 MongoDB 中插入尚不存在的文档 db stock update one document set document upsert True 将完成这项工作如果我错了请随时纠正我但是如果我有一个文档列表并想将它们全
返回上个月的日期时间对象

如果 timedelta 在它的构造函数中有一个月份参数就好了那么最简单的方法是什么 EDIT 正如下面指出的那样我并没有认真考虑这一点我真正想要的是上个月的任何一天因为最终我只会获取年份和月份因此给定一个日期时间对象返回的最
在 Linux 上的 Python 中使用受密码保护的 Excel 工作表

问题很简单我每周都会收到一堆受密码保护的 Excel 文件我必须解析它们并使用 Python 将某些部分写入新文件我得到了文件的密码当在 Windows 上完成此操作时处理起来很简单我只需导入 win32com 并使用 clie
Python 3在for循环中更改字典键的值不起作用

我的 python 3 代码没有按预期工作 def addFunc x y print x y def subABC x y z print x y z def doublePower base exp print 2 base exp d
从 data.frame 中提取时用 NA 填充缺失的列

我有一个函数它将具有某些列的数据框作为输入 columns a b z 现在我有一个数据框DF只有很少的这些列DF columns f u z 如果列不在其中如何创建一个包含所有值为 NA 的列的数据框DF这与DF在柱子上 f u z
pandas 中连续数据的平行坐标图

pandas 的 parallel coordinates 函数非常有用 import pandas import matplotlib pyplot as plt from pandas tools plotting import par
将列表中的 None 替换为最左边的非 none 值

Given a None 1 2 3 None 4 None None I d like a None 1 2 3 3 4 4 4 目前我已经用以下方法强制它 def replaceNoneWithLeftmost val last Non
根据第三个变量更改散点图中的标记样式

我正在处理多列字典我想绘制两列然后根据第三列和第四列更改标记的颜色和样式我很难改变 pylab 散点图中的标记样式我的方法适用于颜色不幸的是不适用于标记样式 x 1 2 3 4 5 6 y 1 3 4 5 6 7 m k l l
python dicttoxml 多次使用相同的键

我正在尝试做如下所示的 xml
在父类中访问子类变量

我有一个父类和一个继承的子类我想知道如何访问我的父类中的子类变量我尝试了这个但失败了 class Parent object def init self print x class Child Parent x 1 x Child Er
如何使用 Python 3 正确显示倒计时日期

我正在尝试获取将显示的倒计时基本上就像一个世界末日时钟哈哈有人可以帮忙吗 import os import sys import time import datetime def timer endTime datetime datet
在python中对列表列表执行行总和和列总和

我想用python计算矩阵的行和和列和但是由于信息安全要求我无法使用任何外部库因此为了创建矩阵我使用了列表列表如下所示 matrix 0 for x in range 5 for y in range 5 for pos in

随机推荐

C#，WinForms 中的双缓冲区？

private void button3 Click object sender EventArgs e this DoubleBuffered true for int i 0 i lt 350 i using Graphics g th
如何解析 gridstack.js 项目？

也许这很简单但我仍在学习 JS 之类的东西我正在使用插件https github com troolee gridstack js https github com troolee gridstack js并希望在小部件重新定位调整大
Android：购买后使用产品（应用内计费）

我在应用程序计费方面遇到一些问题我想在应用程序内创建一个可以多次购买的产品但谷歌在应用程序内计费的方式是产品必须先被消费然后才能再次购买我用下面的代码尝试过 public class HomeFragment extends Fr
使用 SonarQube Web api 分析项目

我使用 SonarQube Web api 创建了一个项目现在我正在尝试分析该项目我找到了这个 POST api project analyses create event 当我尝试这项服务时我得到了这样的回复 errors msg
jQuery html() 和 &

我正在人员列表中进行搜索我希望它能够即时显示结果所以它确实做到了但我需要一个链接它应该如下所示 chatid 18 userid 45 create new 但通过此显示结果后 get ajax php sec search use
经过身份验证后访问 [Authorize] 控制器时收到 404

我正在尝试在 ASP NET MVC Core 应用程序 NetCore 2 上使用 IdentityServer4 实现身份验证和访问控制虽然这不是我第一次实现后端但这是第一次使用 net 并且我正在努力解决一些问题我已按照以下说明
文本分析：使用 python 查找列中最常见的单词

我创建了一个数据框其中只有一个带有主题行的列 df activities filter Subject axis 1 df shape 这返回了这个数据框 Subject 0 Call Out Quadria Capital May Lo
Azure IOT 配置服务中的个人注册无法通过 REST API 运行

我目前面临着使用提供的 REST API 在 Azure 设备配置服务中进行个人注册的挑战文档中也存在一些空白我正在按照此网址中的官方文档中提到的步骤进行操作 https learn microsoft com en us rest a
DistributedNotificationCenter - 如何在应用程序之间传递数据？

我构建了两个应用程序主应用程序和一个支持它的 Finder 扩展使用分布式通知中心我可以成功地在应用程序之间来回发布消息并且注册的观察者事件会按预期触发问题似乎是我无法通过该事件传递任何用户数据所有文档都表明您可以通过NS词典
Python 全局对象变量

我想使用一个已从独立模块在类内部实例化的对象我试图通过使对象引用全局来做到这一点我想我想利用当前的对象而不是创建一个新的对象假设我在模块文件中有这段代码 import moduleFile class A def checkAdmin
选择 FTP 和 HTTP 传输的缓冲区大小

在实现低级 HTTP 和 FTP 传输时如何选择缓冲区的大小从套接字读取或写入套接字的字节数以获得最大吞吐量我的应用程序应该在 130 Kbps 到 3 Mbps 的连接上使用 HTTP 或 FTP 传输数据我事先知道预期的速度
Google Now 活动卡 - 如何显示更多信息

我正在通过将架构数据添加到确认电子邮件来测试 Google Now 中的事件卡目前我正在尝试用铁路旅程信息填充事件卡因为不支持铁路旅程模式不幸的是我只能获取 Google Now 卡片中显示的少量信息这是我要添加到电子邮件中的内
如何使用 importlib.resources.path(package, resources)？

我正在使用以下代码创建一个 GeneratorContextManager try import importlib resources as pkg resources except ImportError Try backported
在没有 RequireJS 的情况下使用 Angular Dragula

我很想使用 angular dragula 模块在我的 Angular 项目中实现拖放 https github com bevacqua angular dragula https github com bevacqua angular
switch (true) 作为 else if 的替代品 [关闭]

Closed 这个问题是基于意见的 help closed questions 目前不接受答案我见过多次使用switch true 今天我自己用过它而不是多个else ifs 这是我使用它的案例 var isChrome navigat
如何在 JDK 1.7 OSX 上运行 Eclipse Indigo

Oracle 最近发布了 OSX JDK 7 ea 如何运行 Eclipse Indigo 我收到以下错误消息 echo JAVA HOME Library Java JavaVirtualMachines JDK 1 7 0 Develo
如何在 HTML 中显示变量

我正在使用 Python 制作一个 Web 应用程序并且有一个想要在 HTML 页面上显示的变量我该如何去做呢会使用 VariableName 在 HTML 页面中是正确的方法吗这在 Flask 中解释得非常清楚文档 http fl
在Java中检测USB驱动器

如何检测 USB 驱动器何时连接到 Windows Linux 或 Mac 中的计算机我在网上看到的唯一方法是迭代驱动器但我不认为有一个很好的跨平台方法例如 Linux 中的 File listRoots 仅返回即使在 Window
无法在 Snow Leopard 上安装乘客 3（使用 RVM 和 ruby 1.9.2）

我一直在尝试安装乘客但尚未成功我已经安装了 gem 但是当我运行时 passenger install apache2 module 它告诉我 This installer must be able to write to the fo
如何使用从其他数据帧计算出的值有效地填充数据帧列

我正在尝试填充数据框 elist 与公司的累积回报和累积市场回报这可以通过使用循环遍历 elist 数据框来完成iterrows 看这个link https stackoverflow com questions 42593859 why

如何使用从其他数据帧计算出的值有效地填充数据帧列

如何使用从其他数据帧计算出的值有效地填充数据帧列 的相关文章

随机推荐

热门标签

如何使用从其他数据帧计算出的值有效地填充数据帧列的相关文章