Python
Java
PHP
IOS
Android
Nodejs
JavaScript
Html5
Windows
Ubuntu
Linux
如何将自定义多变量函数应用于 R 中数据框的每一行?
假设我有一个数据框 其中的列名为 foo 和 bar mydata lt data frame foo rnorm 100 bar rnorm 100 假设我有一个自定义标量函数 它需要标量输入 x 和 y 并产生标量输出 例如 myfun
r
function
DataFrame
根据 pandas 中另一列的值创建新列
我有这个 pandas 数据框 其 代码 列包含顺序分层代码 我的目标是使用每个层次级别代码及其名称创建新列 如下所示 原始数据 Code Name 0 A USA 1 AM Massachusetts 2 AMB Boston 3 AMS
pandas
DataFrame
python36
Hierarchical
如何解决 pandas 读取大 csv 文件时的内存问题
我有一个 100GB 的 csv 文件 其中有数百万行 我需要在 pandas 数据框中一次读取 10 000 行 并将其分块写入 SQL 服务器 我按照建议使用了 chunksize 以及 iteartorhttp pandas docs
python
csv
pandas
DataFrame
Iterator
按日期过滤 Pandas 数据框
我有一个带有 日期 列的 Pandas DataFrame 现在我需要过滤掉 DataFrame 中日期在未来两个月之外的所有行 本质上 我只需要保留接下来两个月内的行 实现这一目标的最佳方法是什么 If 日期列是索引 然后使用 loc 进
python
datetime
pandas
Filtering
DataFrame
双循环填充数据框 - 如何修复“复杂赋值中的无效函数”
我有一个数据框 results 2 612 obs 281 variables ID Q1000 p2000 2016 Q1893 p2039 2016 Q1000 p2000 2017 Q1893 p2039 2017 1 392 381
r
loops
DataFrame
forloop
错误:系列'对象没有属性'包含'”
我搜索 DataFrame 的所有列 第一列除外 并添加一个带有匹配列名称的新列 Matching Columns 当我尝试在测试我的模式是否包含在一行中之前删除所有点时 我收到错误 这有效 keyword 123456789 f lamb
python3x
pandas
DataFrame
如何总结不同的groupby组合?
我正在编制一份按县列出的前 3 名作物的表格 有些县的农作物品种相同 顺序相同 其他县也有相同的作物品种 但顺序不同 df1 pd DataFrame County Harney Baker Wheeler Hood River Wasco
python
pandas
DataFrame
pandasgroupby
pythonitertools
如何计算连续行的时间差
原始数据如下所示 我想按访问者和时间对其进行排序 以计算行中的时间差 然后将其保存到新文件中 visitor v time payment items 1 Jack 1 2 2018 16 07 35 3 2 Jack 1 2 2018 1
r
DataFrame
time
无法向分组数据框添加行
这是这个问题的后续问题如何将行添加到数据框中仅修改某些列 https stackoverflow com questions 71095723 how to add a row to a dataframe modifying only s
r
DataFrame
dplyr
tibble
从 data.frame 中删除 NA 超过列长度 15% 的列 [重复]
这个问题在这里已经有答案了 我有一个data frame10 个不同的列 每列的长度相同 我想消除任何具有 NA 大于柱长的 15 我首先需要制作一个函数来计算百分比NA对于每一列 然后再制作另一列data frame我在哪里应用该函数 最
r
DataFrame
有没有办法在 writetable() 中使用字符串作为分隔符 - Julia
当使用 writetable 将数据帧写入文件时 我希望能够将分隔符设为空格然后逗号 即 作为分隔符 我知道 writetable 只能选择将单个字符作为分隔符参数 是否有可能的解决方法能够将字符串作为分隔符 或者 是否可以简单地在数据框中
csv
DataFrame
Julia
delimiter
separator
从 Spark DataFrame 中的单个列派生多个列
我有一个 DF 它有一个巨大的可解析元数据作为 Dataframe 中的单个字符串列 我们称之为 DFA 带有 ColmnA 我想通过函数 ClassXYZ Func1 ColmnA 将这一列 ColmnA 分成多个列 该函数返回一个类 C
scala
apachespark
DataFrame
apachesparksql
userdefinedfunctions
在 pandas 中插入具有随机字符串值的新列
我有一个数据框 A B C 0 1 2 3 1 2 3 3 2 3 2 1 我需要在 pandas DataFrame 中创建一个新列 并随机填充此列中的 是 或 否 A B C NEW 0 1 2 3 yes 1 2 3 3 no 2 3
python
pandas
DataFrame
Random
series
将 pandas 列表数据框转换为数据框字典
我有一个数据框 带有 DateTime 索引 其中一些列包含列表 每个列表有 6 个元素 In dframe head Out A B timestamp 2017 05 01 00 32 25 30 3512 375 1025 358 1
python
list
pandas
Dictionary
DataFrame
如何将一列中的文本拆分为多行
我正在处理一个大型 csv 文件 倒数第二列有一个文本字符串 我想用特定分隔符分割它 我想知道是否有一种简单的方法可以使用 pandas 或 python 来做到这一点 CustNum CustomerName ItemQty Item S
python
pandas
DataFrame
在多级列 pandas 数据框中创建列的更好方法
假设我有一个 pandas 多层列数据框架df像这样 A B gt first level x y x y gt second level 0 5 5 1 5 1 3 1 4 7 2 1 4 10 20 3 50 8 7 8 如何创建一个新
python
pandas
DataFrame
multiindex
如何将两个或多个不同 csv 文件组成的数据框中的两列合并为一个新列?
我有几个 csv 文件 全部以日期命名 对于所有文件 我想在每个文件中创建一个新列 其中包含来自其他两列放在一起的数据 然后 我想将它们组合成一个大数据框 并仅选择其中两列来保留 这是一个例子 假设我有两个数据框 a b c a b c x
r
csv
DataFrame
multiplecolumns
删除具有重复索引的 pandas 行
如何删除具有重复索引值的行 在下面的天气数据框中 有时科学家会返回并纠正观察结果 不是通过编辑错误的行 而是通过将重复的行附加到文件末尾 我正在从网络上读取一些自动天气数据 每 5 分钟进行一次观测 并编译成每个气象站的每月文件 解析文件后
python
pandas
DataFrame
duplicates
Dataframe 根据其他列创建新列
我有一个数据框 df lt data frame a c 1 2 3 4 5 b c 1 20 3 4 50 df a b 1 1 1 2 2 20 3 3 3 4 4 4 5 5 50 我想根据现有列创建一个新列 像这样的事情 if df
r
DataFrame
apply
与 NaN 进行元素比较作为相等
如果我运行以下代码 dft1 pd DataFrame a 1 np nan np nan dft2 pd DataFrame a 1 1 np nan dft1 a dft2 a 结果是 0 True 1 False 2 False Na
python
pandas
NumPy
DataFrame
NaN
«
1
2
3
4
5
6
7
...100
»