Python
Java
PHP
IOS
Android
Nodejs
JavaScript
Html5
Windows
Ubuntu
Linux
对数据帧的每一行应用函数并同时递增计数器
我知道我可以使用apply 在数据帧的每一行上应用函数 如下所示 import pandas as pd df pd DataFrame Name A B C Number 1 2 3 def func row pass df apply
python
pandas
DataFrame
apply
根据 pandas 中的给定条件派生特征或列
我有 df 如下所示 ID Age days N 30 N 31 90 N 91 180 N 180 365 1 201 60 15 30 1 2 800 0 15 5 10 3 800 0 0 10 6 4 100 0 0 0 370 5
python3x
pandas
DataFrame
Pandas 中最快的计算方法?
给定这两个数据框 df1 Name Start End 0 A 10 20 1 B 20 30 2 C 30 40 df2 0 1 0 5 10 1 15 20 2 25 30 df2没有列名 但您可以假设列 0 的偏移量为df1 Star
python
python3x
pandas
DataFrame
Pandas 根据拆分另一列添加新列
我有一个如下所示的 pandas 数据框 A B US 65 AMAZON 2016 US 65 EBAY 2016 我的目标是看起来像这样 A B country code com US 65 AMAZON 2016 US 65 AMAZ
python
pandas
DataFrame
split
multiplecolumns
如何分组并获取具有 X max 的 Y 列的值? [复制]
这个问题在这里已经有答案了 我有一个以前从未遇到过的用例 我有以下数据框 并且想要选择 y 的值 其中 x 分别为条件 i 的每个级别实现其最小值和最大值 gt library dplyr gt df lt data frame i c 1
r
DataFrame
dplyr
根据两列的值选择 pandas 数据框行
我希望根据两列值选择一些特定行 例如 d user 1 2 3 4 item 5 6 7 8 f1 9 16 17 18 f2 4 5 6 5 f3 4 5 5 8 df pd DataFrame d print df Out f1 f2
python
Arrays
NumPy
pandas
DataFrame
如何将数据帧转换为R中的ID列表? [复制]
这个问题在这里已经有答案了 我整个晚上都在努力弄清楚如何在 R 中做到这一点 基本上我有一个如下的数据集 id lt c 1 1 1 2 2 3 3 3 3 label lt c a b c b d a c d e mydata lt as
r
list
DataFrame
每个 id 单行到每个 id 多行
我想根据给定的时间间隔将观察结果从每个 id 单行扩展到每个 id 多行 gt dput df structure list id c 123 456 789 gender c 0 1 1 yr start c 2005 2010 2000
r
DataFrame
dplyr
reshape
melt
对公司名称的 DataFrame 进行非规范化 [第 1 部分]
我有一个公司名称的 Pandas DataFrame 其结构如下 import numpy as np import pandas as pd df pd DataFrame name Nitron Pulset Rotaxi postal
python
pandas
DataFrame
替换 DataFrame 索引中的 NaN
我有一个数据框 如下所示 one two a 2 5 b 3 6 NaN 0 0 如何用字符串替换索引中的 NaN 例如 无标签 I tried df df replace np NaN No label and df index df i
pandas
replace
label
DataFrame
NaN
来自数组的 Pandas Multiindex => TypeError:不可散列的类型:'dict'
我正在尝试从具有以下结构的数组创建数据框 df date time Timestamp 2015 05 22 05 37 59 name Tom value 129 date time Timestamp 2015 05 22 05 37
python
pandas
DataFrame
multiindex
如何使用 apply、map 或 applymap 查找 pandas dataframe 中的每一行和每一列数据类型?
我有如图所示的数据框 我希望每行和列的数据类型都使用 apply map applymap 如何获取这个数据类型 有些列具有混合数据类型 如突出显示的 例如list 和 str 有些有 list 和 dict 示例 pandas 数据框 1
python
pandas
DataFrame
complexdatatypes
将文本表转换为 pandas 数据框
很多时候 当我尝试回答 Stackoverflow 上的问题时 问题包含一个表 我必须将其转换为 pandas 数据框才能进行处理 例如 在这个问题中 http stackoverflow com questions 43172116 pa
python
pandas
DataFrame
texteditor
str.split() 返回的 Pandas 排序列表
给定 str 类型的 Pandas Series 我想对 str split 返回的结果进行排序 例如 给定系列 s pd Series abc def ghi ghi abc 我想得到 s2 pd Series abc def ghi a
python
string
Sorting
pandas
DataFrame
如何删除数据框中值的顺序不重要的行
我有一个像这样的数据框 source target weight 1 2 5 2 1 5 1 2 5 1 2 7 3 1 6 1 1 6 1 3 6 我的目标是删除重复的行 但源列和目标列的顺序并不重要 事实上 两列的顺序并不重要 应该将其
python
pandas
DataFrame
pandas 中的 dtype('O') 是什么?
我在 pandas 中有一个数据框 我试图弄清楚它的值的类型是什么 我不确定列的类型是什么 Test 然而 当我跑步时myFrame Test dtype I get dtype O 这是什么意思 它的意思是 O Python object
python
pandas
NumPy
DataFrame
types
如何使用pyspark从HDFS读取docx/pdf文件?
我想使用 pyspark 从 Hadoop 文件系统读取 DOCX PDF 文件 目前我正在使用 pandas API 但在 pandas 中我们有一些限制 我们只能读取 CSV JSON XLSX 和 HDF5 它不支持任何其他格式 目前
python
pandas
DataFrame
PySpark
HDFS
.External2(C_dataviewer, x, title) 中的错误:无法启动数据查看器
在 R 中 每次点击时都会出现以下错误View or data frame我不明白为什么 事情发生得很突然 gt View Fhat all Error in External2 C dataviewer x title unable to
r
DataFrame
display
将 JSON 数组读入类似 Julia DataFrame 的类型
给定一个 JSON 文件 JSON 包会愉快地解析它 但如果我想把它作为DataFrame 或任何其他柱状数据结构 获得它的好方法是什么 目前 例如 我有 using JSON using DataFrames json str color
DataFrame
Julia
pandas groupby 转置 str 列
这就是我想做的 gt gt gt import pandas as pd gt gt gt dftemp pd DataFrame a 1 3 2 3 b a a b c d e split a b 0 1 a 1 1 a 2 1 b 3
python
pandas
DataFrame
Pivot
transpose
1
2
3
4
5
6
...100
»