Python
Java
PHP
IOS
Android
Nodejs
JavaScript
Html5
Windows
Ubuntu
Linux
在 Pandas 中计算滚动回归并存储斜率
我有一些时间序列数据 我想计算 Pandas 中最后 n 天的分组滚动回归 并将该回归的斜率存储在新列中 我搜索了较旧的问题 它们要么没有得到解答 要么使用了 Pandas OLS 我听说它已被弃用 我想我可能可以使用df rolling
python
pandas
Regression
pandas 左连接并更新现有列
我是 pandas 的新手 似乎无法让它与合并功能一起使用 gt gt gt left gt gt gt right a b c a c d 0 1 4 9 0 1 7 13 1 2 5 10 1 2 8 14 2 3 6 11 2 3 9
python
pandas
将多嵌套 dict/json 加载到 pandas 中
我正在尝试加载一个非常令人困惑的多重嵌套JSON变成熊猫 我已经在使用了json 规范化 http pandas pydata org pandas docs stable reference api pandas io json json
python
json
pandas
Dictionary
基于多列值的重复键的两个大型 Pandas DataFrame 的条件合并/连接 - Python
我来自 R 老实说 这是使用 R data tables 在一行中完成的最简单的事情 并且对于大型数据表来说 该操作也相当快 但是我真的很难用Python实现它 前面提到的用例都不适合我的应用程序 当前的主要问题是 Python 解决方案中
python
pandas
MERGE
conditionalstatements
largedata
如何将 datetime64 数组转换为 int?
有了这个 pd Timestamp 31 12 1999 23 59 12 value gt gt 946684752000000000 我可以获得日期时间基本值的整数值 如何对日期时间值数组完成此操作 df pd DataFrame a
python
pandas
NumPy
类型错误:fit_transform() 需要 2 个位置参数,但给出了 3 个
我有熊猫数据框df 我想对连续和分类特征进行编码df使用不同的编码器 我觉得用起来很舒服make column transformer 但是下面显示的代码失败了LabelEncoder 但可以很好地与OneHotEncoder handle
python
pandas
scikitlearn
Pandas如何按列按间隔分割数据框
我有一个巨大的数据框 其中有一个名为的日期时间类型列dt 数据框排序基于dt已经 我想根据以下内容将数据帧拆分为多个数据帧dt 每个数据帧包含行1 hr range Split dt text 0 20160811 11 05 a 1 20
python
python27
pandas
NumPy
scipy
如何将 Pandas DataFrame 中加载的嵌入转换为 Gensim 模型?
我有一个 DataFrame 其中索引是单词 并且有 100 个带有浮点数的列 这样对于每个单词 我将其嵌入为 100d 向量 我想将我的 DataFrame 对象转换为gensim 模型对象 https radimrehurek com
python
pandas
gensim
尝试将稀疏 df 保存到 hdf5 时,获取“SparseDtype”对象没有属性“itemsize”?
我正在尝试将大型稀疏数据帧保存到 hdf5 文件 但出现归因错误 one hot pd get dummies my DF columns cat sparse True one hot to hdf content data h5 tab
python
pandas
HDFS
为什么 Pandas 内连接给出 ValueError: len(left_on) 必须等于“right”索引中的级别数?
我正在尝试将 DataFrame A 内部连接到 DataFrame B 并且遇到错误 这是我的加入声明 merged DataFrameA join DataFrameB on Code Date 这是错误 ValueError len
python
pandas
join
MERGE
innerjoin
将 numpy float64 稀疏矩阵转换为 pandas 数据框
我有一个n x n numpy float64 sparse matrix data where n 44 其中行和列是图节点 值是边权重 gt gt gt data lt 44x44 sparse matrix of type
python
pandas
NumPy
DataFrame
大熊猫群体中的百分位排名
我不太清楚如何编写函数来完成分组百分位数 我将 1985 年至 2012 年的所有球队都放在一个数据框中 前 10 个如下所示 目前按年份排序 我想给一个百分位LgRnk分组依据Year 例如 1985 年的 23 LgRank 最差球队
python
NumPy
pandas
statistics
scipy
如何获取 Jupyter Notebook 的“markdown”单元格中的制表符空间
我正在编写描述性 ipynb 文件 需要在带有空格的 markdown 中给出输出 但无法添加制表符空间来打印结构化数据 键入 nbsp 以添加一个空格 输入 ensp 添加 2 个空格 输入 emsp 添加 4 个空格 使用不间断空格 n
python
pandas
jupyternotebook
熊猫系列名称
我试图将我的系列命名为 Points 但它没有显示为 Points Points pd Series 1 2 3 print Points name output None 我什至尝试重命名它 但它仍然显示 无 Points rename
python
pandas
rename
将自定义累积函数应用于 pandas 数据框
我有一个按以下顺序排序的数据框date df pd DataFrame idx 1 1 1 2 2 2 date 2016 04 30 2016 05 31 2016 06 31 2016 04 30 2016 05 31 2016 06
python
pandas
DeprecationWarning:当 `op_axes` 为 NULL 时使用 `oa_ndim == 0` 已被弃用
我如何防止这种异常 C Anaconda envs p33 lib site packages numexpr necompiler py 742 DeprecationWarning using oa ndim 0 when op axe
python
pandas
获取列中唯一值的索引(pandas)
我需要获取具有唯一值的行号x 我得出以下解决方案 x pv index get level values get index level values dups x x duplicated unique get dup values un
python
pandas
使用多索引/ groupby 对象“按组”对值进行排序,而不破坏索引级别
是否可以按每组总和的计数值对值进行排序 不突破指数水平 我注释掉的两次尝试都会排序 但会破坏索引级别 DataFrame ff pd DataFrame P1 17 male P2 10 female P3 10 male P4 19 fe
pandas
将 Pandas GroupBy 多索引输出从 Series 转换回 DataFrame
我有一个数据框 City Name 0 Seattle Alice 1 Seattle Bob 2 Portland Mallory 3 Seattle Mallory 4 Seattle Bob 5 Portland Mallory 我执
python
pandas
DataFrame
groupby
multiindex
检查 Pandas Series 是否为字符串类型
我将一些数据从 parquet 文件导入到 DataFrame 中并想要检查数据类型 我期望的数据类型之一是字符串 为此 我有如下内容 import pandas as pd col pd Series None b c None e as
python
pandas
«
1 ...
3
4
5
6
7
8
9
...100
»