pandas

Pandas：将 DataFrame 列值转换为新的 Dataframe 索引和列

我有一个如下所示的数据框 a b c 0 1 10 1 2 10 2 2 20 3 3 30 4 1 40 4 3 10 上面的数据帧作为默认索引 0 1 2 3 4 我想将其转换为如下所示的数据框 1 2 3 0 10 0 0 1 0 1

python pandas

如何从分组数据创建直方图

我正在尝试根据 pandas 中的分组数据创建直方图到目前为止我已经能够创建标准线图但我不知道如何做同样的事情来获取直方图条形图我想获得泰坦尼克号事故中幸存者和未幸存者的 2 个年龄直方图看看年龄分布是否存在差异来源数据 ht

python pandas matplotlib Histogram

根据Python中两行之间的匹配创建一个带有[0,1]的新列

我正在尝试将多个列表或数据帧与一个大型基础数据帧进行比较然后对于任何匹配我想附加一个存储 1 匹配或 0 不匹配的列 df pd DataFrame Name A B C D ID 5 6 6 7 8 9 7 list1 5 6 8 9

python pandas function DataFrame row

如何使用 tweepy 仅提取主题标签中的文本？

我想为我的情感分析项目提取主题标签但是我得到了一个字典列表其中包含所有主题标签及其在推文中的索引我只想要文字我的代码 data tweepy Cursor api search q since a i until b i items

python list pandas Dictionary tweepy

AttributeError：模块“pandas”没有属性“read_csv”Python3.5

我已经成功使用pandas read csv很久以来当我尝试读取 csv 文件时突然开始出现错误 df pd read csv file csv encoding utf 8 错误是 AttributeError module pand

python python3x pandas

pandas：根据总和和平均值过滤列

我有一个时间序列数据的数据框其中包含列中的数值数据在绘制这些数据时我只想绘制某些被认为不足的系列以下是我选择要绘制的列的方法 df loc df iloc 1 gt 100 df sum gt 1000 换句话说显着的标准是一系

pandas

在 DataFrame 的切片副本上设置值[重复]

这个问题在这里已经有答案了我有一个小数据框说这个 Mass32 Mass44 12 0 576703 0 496159 13 0 576658 0 495832 14 0 576703 0 495398 15 0 576587 0 49

python pandas

将数值数据更改为分类数据 - Pandas [重复]

这个问题在这里已经有答案了我有一个 pandas 数据框其中有一个数字列金额金额从 0 到 20000 不等我想将其更改为定义范围的分类变量因此分类变量将是 0 1000 之间 1000 2000 美元之间依此类推直到 1

python pandas NumPy DataFrame

在 Python 中使用 mca 包

我正在尝试使用MCA 套餐 https github com esafak mca blob master docs usage rst在Python中进行多重对应分析我对如何使用它有点困惑和PCA我希望fit一些数据即找到这些数据的

python3x pandas scikitlearn PCA

在 pandas 数据框中使用 Replace 和 str.startswith() 来重命名值

我有一个名为源的列其中包含数百行文本问题是其中一些可以组合在一起而我正在努力在 Pandas 数据框中做到这一点这是我的代码 df source replace df source str startswith share n

python string pandas series

Pandas：数据帧累积和，如果其他列为假则重置[重复]

这个问题在这里已经有答案了我有一个包含 2 列的数据框这里的目标很简单如果行列设置为 False 则重置 df cumsum df value condition 0 1 1 1 2 1 2 3 1 3 4 0 4 5 1 想要的结果

pandas NumPy DataFrame cumsum

Pandas 数据框可对多列和要列出的值进行字典

我有一个数据框 id key a1 1 a2 1 a3 1 a4 2 a5 2 a6 3 我想创建一本字典key作为机器号并且id列作为列表 like 1 a1 a2 a3 2 a4 a5 3 a6 我可以先使用 groupby 然后再使

python pandas Dictionary DataFrame

获取列的 [0, x] 元素的最小值

我需要计算一列其中值是对其他列进行矢量化运算的结果 df new col df col1 min 0 df col2 然而事实证明我不能像上面的语法一样使用 min 那么获得 pandas 列的零和给定值之间的最小值的正确方法是什么

python pandas

NumPy 根据另一个数组中的值对第三个数组中的每个匹配元素求和一个数组

我有两个 numpy 数组一个包含值另一个包含每个值类别 values np array 1 2 3 4 5 6 7 8 9 10 valcats np array 101 301 201 201 102 302 302 202 102

python Arrays pandas NumPy

将具有多个时区的 pandas 列转换为单个时区

Problem 我在 pandas DataFrame 中有一个列其中包含带有时区的时间戳此列中有两个不同的时区我需要确保只有一个这是该列末尾的输出 260003 2019 05 21 12 00 00 06 00 260004 2

python python3x pandas DataFrame timezone

pandas groupby 并转换为 json 列表

我有一个如下所示的 pandas 数据框 idx f1 f2 f3 1 a a b 2 b a c 3 a b c 87 e e e 我需要将其他列转换为基于索引列的字典列表所以最终结果应该是 idx features 1 f1 a f

python Dictionary pandas

为什么 pandas.DataFrame.update 会更改更新后的数据帧的数据类型？

出于显而易见的原因我想在更新后将列的数据类型保留为 int 有什么想法为什么这不能按预期工作吗 import pandas as pd df1 pd DataFrame a 1 b 2 c foo a 3 b 4 c baz df2 pd

python pandas

将 geojson 文件下载到 jupyter 中的 folium 中

我想要一张欧洲地图作为 json 文件这样我就可以使用 geojson 将其作为图层放置在 Folium 地图上这样我就可以将我的数据集嵌入到其中以显示欧洲哪个国家的酒精含量最高我在从 GitHub 获取 json 文件以在 jy

pandas mapping GeoJson jupyter folium

熊猫加入具有不同索引级别/日期时间的数据帧？

嗨我有两个 DataFrame 如下所示 dineType menuName unique columns date y m d

python pandas

如何向 pandas.DataFrame 的子类添加属性？

我想向 DataFrame 的子类添加属性但出现错误 gt gt gt import pandas as pd gt gt gt class Foo pd DataFrame def init self self bar None gt

pandas