Python
Java
PHP
IOS
Android
Nodejs
JavaScript
Html5
Windows
Ubuntu
Linux
Pandas:将 DataFrame 列值转换为新的 Dataframe 索引和列
我有一个如下所示的数据框 a b c 0 1 10 1 2 10 2 2 20 3 3 30 4 1 40 4 3 10 上面的数据帧作为默认索引 0 1 2 3 4 我想将其转换为如下所示的数据框 1 2 3 0 10 0 0 1 0 1
python
pandas
如何从分组数据创建直方图
我正在尝试根据 pandas 中的分组数据创建直方图 到目前为止 我已经能够创建标准线图 但我不知道如何做同样的事情来获取直方图 条形图 我想获得泰坦尼克号事故中幸存者和未幸存者的 2 个年龄直方图 看看年龄分布是否存在差异 来源数据 ht
python
pandas
matplotlib
Histogram
根据Python中两行之间的匹配创建一个带有[0,1]的新列
我正在尝试将多个列表或数据帧与一个大型基础数据帧进行比较 然后对于任何匹配 我想附加一个存储 1 匹配或 0 不匹配的列 df pd DataFrame Name A B C D ID 5 6 6 7 8 9 7 list1 5 6 8 9
python
pandas
function
DataFrame
row
如何使用 tweepy 仅提取主题标签中的文本?
我想为我的情感分析项目提取主题标签 但是我得到了一个字典列表 其中包含所有主题标签及其在推文中的索引 我只想要文字 我的代码 data tweepy Cursor api search q since a i until b i items
python
list
pandas
Dictionary
tweepy
AttributeError:模块“pandas”没有属性“read_csv”Python3.5
我已经成功使用pandas read csv很久以来 当我尝试读取 csv 文件时 突然开始出现错误 df pd read csv file csv encoding utf 8 错误是 AttributeError module pand
python
python3x
pandas
pandas:根据总和和平均值过滤列
我有一个时间序列数据的数据框 其中包含列中的数值数据 在绘制这些数据时 我只想绘制某些被认为不足的系列 以下是我选择要绘制的列的方法 df loc df iloc 1 gt 100 df sum gt 1000 换句话说 显着 的标准是一系
pandas
在 DataFrame 的切片副本上设置值[重复]
这个问题在这里已经有答案了 我有一个小数据框 说这个 Mass32 Mass44 12 0 576703 0 496159 13 0 576658 0 495832 14 0 576703 0 495398 15 0 576587 0 49
python
pandas
将数值数据更改为分类数据 - Pandas [重复]
这个问题在这里已经有答案了 我有一个 pandas 数据框 其中有一个数字列 金额 金额从 0 到 20000 不等 我想将其更改为定义范围的分类变量 因此 分类变量将是 0 1000 之间 1000 2000 美元之间 依此类推 直到 1
python
pandas
NumPy
DataFrame
在 Python 中使用 mca 包
我正在尝试使用MCA 套餐 https github com esafak mca blob master docs usage rst在Python中进行多重对应分析 我对如何使用它有点困惑 和PCA我希望fit一些数据 即找到这些数据的
python3x
pandas
scikitlearn
PCA
在 pandas 数据框中使用 Replace 和 str.startswith() 来重命名值
我有一个名为 源 的列 其中包含数百行文本 问题是 其中一些可以组合在一起 而我正在努力在 Pandas 数据框中做到这一点 这是我的代码 df source replace df source str startswith share n
python
string
pandas
series
Pandas:数据帧累积和,如果其他列为假则重置[重复]
这个问题在这里已经有答案了 我有一个包含 2 列的数据框 这里的目标很简单 如果行列设置为 False 则重置 df cumsum df value condition 0 1 1 1 2 1 2 3 1 3 4 0 4 5 1 想要的结果
pandas
NumPy
DataFrame
cumsum
Pandas 数据框可对多列和要列出的值进行字典
我有一个数据框 id key a1 1 a2 1 a3 1 a4 2 a5 2 a6 3 我想创建一本字典key作为机器号 并且id列作为列表 like 1 a1 a2 a3 2 a4 a5 3 a6 我可以先使用 groupby 然后再使
python
pandas
Dictionary
DataFrame
获取列的 [0, x] 元素的最小值
我需要计算一列 其中值是对其他列进行矢量化运算的结果 df new col df col1 min 0 df col2 然而 事实证明我不能像上面的语法一样使用 min 那么 获得 pandas 列的零和给定值之间的最小值的正确方法是什么
python
pandas
NumPy 根据另一个数组中的值对第三个数组中的每个匹配元素求和一个数组
我有两个 numpy 数组 一个包含值 另一个包含每个值类别 values np array 1 2 3 4 5 6 7 8 9 10 valcats np array 101 301 201 201 102 302 302 202 102
python
Arrays
pandas
NumPy
将具有多个时区的 pandas 列转换为单个时区
Problem 我在 pandas DataFrame 中有一个列 其中包含带有时区的时间戳 此列中有两个不同的时区 我需要确保只有一个 这是该列末尾的输出 260003 2019 05 21 12 00 00 06 00 260004 2
python
python3x
pandas
DataFrame
timezone
pandas groupby 并转换为 json 列表
我有一个如下所示的 pandas 数据框 idx f1 f2 f3 1 a a b 2 b a c 3 a b c 87 e e e 我需要将其他列转换为基于索引列的字典列表 所以 最终结果应该是 idx features 1 f1 a f
python
Dictionary
pandas
为什么 pandas.DataFrame.update 会更改更新后的数据帧的数据类型?
出于显而易见的原因 我想在更新后将列的数据类型保留为 int 有什么想法为什么这不能按预期工作吗 import pandas as pd df1 pd DataFrame a 1 b 2 c foo a 3 b 4 c baz df2 pd
python
pandas
将 geojson 文件下载到 jupyter 中的 folium 中
我想要一张欧洲地图 作为 json 文件 这样我就可以使用 geojson 将其作为图层放置在 Folium 地图上 这样我就可以将我的数据集嵌入到其中 以显示欧洲哪个国家的酒精含量最高 我在从 GitHub 获取 json 文件以在 jy
pandas
mapping
GeoJson
jupyter
folium
熊猫加入具有不同索引级别/日期时间的数据帧?
嗨 我有两个 DataFrame 如下所示 dineType menuName unique columns date y m d
python
pandas
如何向 pandas.DataFrame 的子类添加属性?
我想向 DataFrame 的子类添加属性 但出现错误 gt gt gt import pandas as pd gt gt gt class Foo pd DataFrame def init self self bar None gt
pandas
«
1 ...
4
5
6
7
8
9
10
...100
»