DataFrame

将 lambda 函数应用于 dask 数据框

我正在寻找申请lambda如果列中的标签小于一定百分比则使用 dask 数据框的函数来更改列中的标签我使用的方法适用于 pandas 数据框但相同的代码不适用于 dask 数据框代码如下 df pd DataFrame A ant

python DataFrame Dask

使用列数可视化线图

我有个问题我有两列toDate and fromDate 我想直观地看到它们之间的差异linechart x 轴应该是月份例如 1 2 3 4 等 y 轴应该是月份的计数最后这应该是由what 不幸的是我没有得到想要的输出数据框 i

python pandas DataFrame matplotlib Seaborn

当列数动态时，如何从数据框中过滤数据？

我有一个如下所示的数据框 A Name B Detail Value B Value C Value D 0 AA X1 1 2 0 5 1 3 1 BB Y1 0 76 0 7 0 8 2 CC Z1 0 7 1 3 2 5 3 DD L

python NumPy pandas DataFrame

删除列表内数据框中的列

我根据 A 列中的因子水平从数据框中创建了一个列表在列表中我想删除该列我的脑子里在说 lapply 但没有别的意思 P A ID Test A 1 A 1 B ID Test B 1 B 3 B 5 进入这个 A Test 1 1

r list DataFrame

将每一行转换为数据框并连接结果

我有一个数据框df按照下面的格式其中content是一个字符串列 content 0 api api 1 api 1 api 1 A 1 2 3 B 4 5 6 1 api api 2 api 2 api 2 A 7 8 9 B 10 1

python pandas DataFrame

toDF 问题，值 toDF 不是 org.apache.spark.rdd.RDD 的成员

我已附加错误 value toDF is not a member of org apache spark rdd RDD 的代码片段我正在使用 scala 2 11 8 和 Spark 2 0 0 您能帮我解决 API toDF 的这个

DataFrame apachesparksql

在 data.frame 中有效地定位分组常量列

如何有效地从数据框中提取分组常量列我在下面包含了一个 plyr 实现以精确说明我想要做的事情但它很慢我怎样才能尽可能高效地做到这一点理想情况下根本不分割数据框 base lt data frame group 1 1000 a s

r DataFrame plyr

如何使用 Snowflake sql 查询的结果填充 pandas DataFrame？

使用Python 连接器 https docs snowflake net manuals user guide python connector example html querying data我可以查询雪花 import snowf

pandas DataFrame snowflakeclouddataplatform

set_index 不在 pandas 中建立索引

对于下面的简单程序我期望第二个输出与第一个输出相同为什么这没有发生这只是订单的改变data1 and data2 columnList PID Sec Util random data1 67123 12 85 100 67123 1

python pandas DataFrame multiindex

向数据框添加行的有效方法

由此question https stackoverflow com questions 28056171 how to build and fill pandas dataframe from for loop和其他人似乎不建议使用con

python pandas DataFrame

框架和对象之间有什么区别，什么时候应该修改其中一个而不是另一个？

我开始阅读有关 python 的语法的内容并偶然发现了以下帖子答案关于的交互代码 https stackoverflow com a 13329969 7143036 所以我注意到框架和物体之间似乎存在差异在全局框架中即使它们

python python3x object DataFrame

为什么 `head` 需要 `()` 而 `shape` 不需要？

在下面的代码中我将 csv 文件导入到 Python 的 pandas 库中并显示前 5 行并查询 pandas 数据框的形状 import pandas as pd data pd read csv my file csv data

python pandas DataFrame Methods

从 data.frame 中的现有变量创建几个新的派生变量

在 R 中我有一个 data frame 其中有几个变量这些变量是多年来每月测量的我想得出每个变量的月平均值使用所有年份理想情况下这些新变量将全部放在一个新的 data frame 中继承 ID 下面我只是将新变量添加到 da

r variables DataFrame

在 Spark 中，从哈希映射创建数据帧，其中键作为列名称，值作为行

我有一个数据框我有一个列它是数据框中的地图如下所示 scala gt df printSchema root A1 map nullable true key string value string valueContainsNull

scala apachespark DataFrame apachesparksql

使用plotly r 的多折线图

我有一个数据框我试图使用plotly作为多折线图来绘制它下面是数据框的样子 Month considered pct x pct y pct

r DataFrame plotly rplotly

连接两列值pandas

我有一个数据框数据 Cluster OsId BrowserId PageId VolumePred ConversionPred 255 7 11 17 1149582 4 0 607 18 99 16 917224 8 0 22 0 1

python python3x pandas DataFrame

如何将行添加到数据框中仅修改某些列

为了准备用于绘图的数据我需要向数据添加一个新行我有这个数据框 df lt data frame test id c 1 1 1 1 test nr c 1 1 1 1 region c A B C D test value c 3 1

r DataFrame dplyr tibble

根据向量元素的数量截断数据框

我有一个数据框df 包含三个向量 subject condition value 01 A 12 01 A 6 01 B 10 01 B 2 02 A 5 02 A 11 02 B 3 02 B 5 02 B 9 主题 01 有四个观察值

r DataFrame vector

使用字符向量索引命名数据帧的嵌套列表 - R

我有一个命名数据框的嵌套列表如下所示 mylist2 lt list list df1 a data frame replicate 2 sample 0 1 5 rep TRUE df2 b data frame replicate 2

r list DataFrame Indexing

Python - 类似于 VLOOKUP (Excel) 的函数

我正在尝试连接两个数据框但无法理解 Python 提供的可能性第一个数据框 ID MODEL REQUESTS ORDERS 1 Golf 123 4 2 Passat 34 5 3 Model 3 500 8 4 M3 5 0 第二个

python pandas DataFrame vlookup