DataFrame

如何将自定义多变量函数应用于 R 中数据框的每一行？

假设我有一个数据框其中的列名为 foo 和 bar mydata lt data frame foo rnorm 100 bar rnorm 100 假设我有一个自定义标量函数它需要标量输入 x 和 y 并产生标量输出例如 myfun

r function DataFrame

根据 pandas 中另一列的值创建新列

我有这个 pandas 数据框其代码列包含顺序分层代码我的目标是使用每个层次级别代码及其名称创建新列如下所示原始数据 Code Name 0 A USA 1 AM Massachusetts 2 AMB Boston 3 AMS

pandas DataFrame python36 Hierarchical

如何解决 pandas 读取大 csv 文件时的内存问题

我有一个 100GB 的 csv 文件其中有数百万行我需要在 pandas 数据框中一次读取 10 000 行并将其分块写入 SQL 服务器我按照建议使用了 chunksize 以及 iteartorhttp pandas docs

python csv pandas DataFrame Iterator

按日期过滤 Pandas 数据框

我有一个带有日期列的 Pandas DataFrame 现在我需要过滤掉 DataFrame 中日期在未来两个月之外的所有行本质上我只需要保留接下来两个月内的行实现这一目标的最佳方法是什么 If 日期列是索引然后使用 loc 进

python datetime pandas Filtering DataFrame

双循环填充数据框 - 如何修复“复杂赋值中的无效函数”

我有一个数据框 results 2 612 obs 281 variables ID Q1000 p2000 2016 Q1893 p2039 2016 Q1000 p2000 2017 Q1893 p2039 2017 1 392 381

r loops DataFrame forloop

错误：系列'对象没有属性'包含'”

我搜索 DataFrame 的所有列第一列除外并添加一个带有匹配列名称的新列 Matching Columns 当我尝试在测试我的模式是否包含在一行中之前删除所有点时我收到错误这有效 keyword 123456789 f lamb

python3x pandas DataFrame

如何总结不同的groupby组合？

我正在编制一份按县列出的前 3 名作物的表格有些县的农作物品种相同顺序相同其他县也有相同的作物品种但顺序不同 df1 pd DataFrame County Harney Baker Wheeler Hood River Wasco

python pandas DataFrame pandasgroupby pythonitertools

如何计算连续行的时间差

原始数据如下所示我想按访问者和时间对其进行排序以计算行中的时间差然后将其保存到新文件中 visitor v time payment items 1 Jack 1 2 2018 16 07 35 3 2 Jack 1 2 2018 1

r DataFrame time

无法向分组数据框添加行

这是这个问题的后续问题如何将行添加到数据框中仅修改某些列 https stackoverflow com questions 71095723 how to add a row to a dataframe modifying only s

r DataFrame dplyr tibble

从 data.frame 中删除 NA 超过列长度 15% 的列 [重复]

这个问题在这里已经有答案了我有一个data frame10 个不同的列每列的长度相同我想消除任何具有 NA 大于柱长的 15 我首先需要制作一个函数来计算百分比NA对于每一列然后再制作另一列data frame我在哪里应用该函数最

r DataFrame

有没有办法在 writetable() 中使用字符串作为分隔符 - Julia

当使用 writetable 将数据帧写入文件时我希望能够将分隔符设为空格然后逗号即作为分隔符我知道 writetable 只能选择将单个字符作为分隔符参数是否有可能的解决方法能够将字符串作为分隔符或者是否可以简单地在数据框中

csv DataFrame Julia delimiter separator

从 Spark DataFrame 中的单个列派生多个列

我有一个 DF 它有一个巨大的可解析元数据作为 Dataframe 中的单个字符串列我们称之为 DFA 带有 ColmnA 我想通过函数 ClassXYZ Func1 ColmnA 将这一列 ColmnA 分成多个列该函数返回一个类 C

scala apachespark DataFrame apachesparksql userdefinedfunctions

在 pandas 中插入具有随机字符串值的新列

我有一个数据框 A B C 0 1 2 3 1 2 3 3 2 3 2 1 我需要在 pandas DataFrame 中创建一个新列并随机填充此列中的是或否 A B C NEW 0 1 2 3 yes 1 2 3 3 no 2 3

python pandas DataFrame Random series

将 pandas 列表数据框转换为数据框字典

我有一个数据框带有 DateTime 索引其中一些列包含列表每个列表有 6 个元素 In dframe head Out A B timestamp 2017 05 01 00 32 25 30 3512 375 1025 358 1

python list pandas Dictionary DataFrame

如何将一列中的文本拆分为多行

我正在处理一个大型 csv 文件倒数第二列有一个文本字符串我想用特定分隔符分割它我想知道是否有一种简单的方法可以使用 pandas 或 python 来做到这一点 CustNum CustomerName ItemQty Item S

python pandas DataFrame

在多级列 pandas 数据框中创建列的更好方法

假设我有一个 pandas 多层列数据框架df像这样 A B gt first level x y x y gt second level 0 5 5 1 5 1 3 1 4 7 2 1 4 10 20 3 50 8 7 8 如何创建一个新

python pandas DataFrame multiindex

如何将两个或多个不同 csv 文件组成的数据框中的两列合并为一个新列？

我有几个 csv 文件全部以日期命名对于所有文件我想在每个文件中创建一个新列其中包含来自其他两列放在一起的数据然后我想将它们组合成一个大数据框并仅选择其中两列来保留这是一个例子假设我有两个数据框 a b c a b c x

r csv DataFrame multiplecolumns

删除具有重复索引的 pandas 行

如何删除具有重复索引值的行在下面的天气数据框中有时科学家会返回并纠正观察结果不是通过编辑错误的行而是通过将重复的行附加到文件末尾我正在从网络上读取一些自动天气数据每 5 分钟进行一次观测并编译成每个气象站的每月文件解析文件后

python pandas DataFrame duplicates

Dataframe 根据其他列创建新列

我有一个数据框 df lt data frame a c 1 2 3 4 5 b c 1 20 3 4 50 df a b 1 1 1 2 2 20 3 3 3 4 4 4 5 5 50 我想根据现有列创建一个新列像这样的事情 if df

r DataFrame apply

与 NaN 进行元素比较作为相等

如果我运行以下代码 dft1 pd DataFrame a 1 np nan np nan dft2 pd DataFrame a 1 1 np nan dft1 a dft2 a 结果是 0 True 1 False 2 False Na

python pandas NumPy DataFrame NaN