Python
Java
PHP
IOS
Android
Nodejs
JavaScript
Html5
Windows
Ubuntu
Linux
如何使用 pandas 对一系列值进行编码
我有一个 pandas 数据框并且有一列age 我想将其编码为按特定范围分隔的分类值 例如 15岁以下的年龄应为0 15到30之间的年龄应更改为1等等 我找到了这种方法来做到这一点 在经历了关于使用的巨大困惑之后 and and age X
python
pandas
Indexing
向量化 for 循环并返回 x 天的最高价和最低价
Overview 对于数据帧的每一行 我想计算 x 天的最高价和最低价 x 天的高点高于前 x 天 x 天的低点低于前 x 天 for 循环在此有更详细的解释post https stackoverflow com questions 70
pandas
Pandas:根据其他列值有条件地替换值
我有一个数据框 df 如下所示 environment event time 2017 04 28 13 08 22 NaN add rd 2017 04 28 08 58 40 NaN add rd 2017 05 03 07 59 35
python
python3x
pandas
DataFrame
为 pandas 系列的每个值分配百分位数
是否有直接开箱即用的方法为 pandas 系列的每个值分配百分位数 我通过排名和重新调整来实现此计算 如下所示 values pd Series np random normal 0 1 100 percentiles values ran
python
pandas
series
percentile
检索除指定一列之外的所有 DataFrame [重复]
这个问题在这里已经有答案了 有没有办法选择 pandas DataFrame 对象中除一列之外的所有列 我已经看到了删除列的方法 但我不想这样做 use drop method df drop column name axis 1
python
pandas
DataFrame
如何获取所有数字列(嵌套与否)的“.describe()”统计信息?
获取数据帧 或列表或数组 中任何列的简单描述性统计数据的最佳方法是什么 无论是否嵌套 一种高级 df describe 还包括带有数值的嵌套结构 就我而言 我有一个包含许多列的数据框 有些列的每一行都有一个数字列表 在我的例子中是时间序列结
python
pandas
NumPy
multidimensionalarray
scipystats
时间戳相减必须具有相同的时区或没有时区,但它们都是 UTC
有一些问题解决了相同的错误TypeError Timestamp subtraction must have the same timezones or no timezones但没有一个面临与此相同的问题 我有 2 个 UTC 时间戳 在
python
pandas
datetime
timestamp
timezone
当 pandas 是导入时,Cx_freeze TypeError 只能使用 numpy 依赖项将列表(不是“NoneType”)连接到列表
我正在尝试使用 cxfreeze 将以下脚本转换为可执行文件 import datetime from calendar import monthrange from tia bbg import LocalTerminal as Lt i
python
pandas
NumPy
executable
cxfreeze
python pandas将文本中的数字提取到新列
我有以下文字column A A hellothere 3 43 hellothere 3 9 我想extract仅另一个新列 B A 旁边 的数字 例如 B 3 43 3 9 I use str extract d d d expand
python
pandas
extract
Geopandas 数据框指向多边形
我有一个 geopandas 数据框 由 id 和由 2D 点填充的几何列组成 我想连接每个唯一 id 的点来创建一个多边形 以便我的新数据框将多边形作为其几何形状 我的代码目前看起来像这样 polygons geopandas GeoDa
python
pandas
shapely
geopandas
Pandas:如何删除以 nan 作为列名的多个列?
根据标题 这是一个可重现的示例 raw data x this that this that this np nan np nan np nan np nan np nan np nan y np nan np nan np nan np
python
pandas
DataFrame
NaN
将非方邻接矩阵导入 Networkx python
我在下面有一些 pandas 数据框形式的数据 其中列代表离散技能 行代表离散工作 仅当工作需要该技能时才存在 1 否则为 0 skill 1 skill 2 job 1 1 0 job 2 0 0 job 3 1 1 我想使用 netwo
python
pandas
NumPy
networkx
graphtheory
Pandas:合并多个数据框并控制列名称?
我想将九个 Pandas 数据帧合并到一个数据帧中 对两列进行联接 控制列名称 这可能吗 我有九个数据集 它们都有以下列 org name items spend 我想将它们加入到具有以下列的单个数据框中 org name items df
python
pandas
使用条件在 pandas 数据框中生成新列
我有一个 pandas 数据框 如下所示 portion used 0 1 1 0 1 2 0 3 2 3 0 0 3 4 0 8 我想根据以下内容创建一个新专栏used列 以便df看起来像这样 portion used alert 0 1
python
pandas
conditionalstatements
calculatedcolumns
Pandas 使用什么规则来生成视图和副本?
我对 Pandas 在决定数据帧中的选择是原始数据帧的副本或原始数据帧的视图时使用的规则感到困惑 例如 如果我有 df pd DataFrame np random randn 8 8 columns list ABCDEFGH index
python
pandas
DataFrame
Indexing
chainedassignment
Pandas如何将多个函数应用于数据框
有没有办法像 DataFrameGroupBy agg 函数那样将函数列表应用于 DataFrame 中的每一列 我发现了一个丑陋的方法来做到这一点 df pd DataFrame dict one np random uniform 0
python
pandas
创建 df 以生成给定格式的 json
我正在尝试生成一个 df 来生成下面的 json Json数据 name flare children name K1 children name Exact size 4 name synonyms size 14 name K2 chi
python
json
pandas
DataFrame
dataanalysis
有效地写入 pandas 中的多个相邻列
使用 numpy ndarray 可以一次写入多个列 而无需先进行复制 只要它们相邻 如果我想写入数组的前三列 我会写 a 0 0 3 1 2 3 this is very fast a is a numpy ndarray 我希望在 pa
python
NumPy
pandas
将 pandas 多索引数据帧转换为嵌套字典
我有一个 pandas 多索引数据框 我试图将其输出为嵌套字典 create the dataset data clump thickness 0 0 274 0 0 1 19 0 1 0 67 0 1 1 12 0 2 0 83 0 2
python
pandas
在 python 中查找价格动量的有效方法:对列的最后 n 个条目求平均值
我正在定义价格动量是给定股票过去动量的平均值n days 反过来 动量是一种分类 如果当天的收盘价高于前一天 则每天标记为 1 如果当天的收盘价低于前一天 则标记为 1 我的库存变化百分比如下 df close in percent np
python
pandas
NumPy
«
1 ...
5
6
7
8
9
10
11
...100
»