Python
Java
PHP
IOS
Android
Nodejs
JavaScript
Html5
Windows
Ubuntu
Linux
将 lambda 函数应用于 dask 数据框
我正在寻找申请lambda如果列中的标签小于一定百分比 则使用 dask 数据框的函数来更改列中的标签 我使用的方法适用于 pandas 数据框 但相同的代码不适用于 dask 数据框 代码如下 df pd DataFrame A ant
python
DataFrame
Dask
使用列数可视化线图
我有个问题 我有两列toDate and fromDate 我想直观地看到它们之间的差异linechart x 轴应该是月份 例如 1 2 3 4 等 y 轴应该是月份的计数 最后这应该是由what 不幸的是我没有得到想要的输出 数据框 i
python
pandas
DataFrame
matplotlib
Seaborn
当列数动态时,如何从数据框中过滤数据?
我有一个如下所示的数据框 A Name B Detail Value B Value C Value D 0 AA X1 1 2 0 5 1 3 1 BB Y1 0 76 0 7 0 8 2 CC Z1 0 7 1 3 2 5 3 DD L
python
NumPy
pandas
DataFrame
删除列表内数据框中的列
我根据 A 列中的因子水平 从数据框中创建了一个列表 在列表中 我想删除该列 我的脑子里在说 lapply 但没有别的意思 P A ID Test A 1 A 1 B ID Test B 1 B 3 B 5 进入这个 A Test 1 1
r
list
DataFrame
将每一行转换为数据框并连接结果
我有一个数据框df按照下面的格式 其中content是一个字符串列 content 0 api api 1 api 1 api 1 A 1 2 3 B 4 5 6 1 api api 2 api 2 api 2 A 7 8 9 B 10 1
python
pandas
DataFrame
toDF 问题,值 toDF 不是 org.apache.spark.rdd.RDD 的成员
我已附加错误 value toDF is not a member of org apache spark rdd RDD 的代码片段 我正在使用 scala 2 11 8 和 Spark 2 0 0 您能帮我解决 API toDF 的这个
DataFrame
apachesparksql
在 data.frame 中有效地定位分组常量列
如何有效地从数据框中提取分组常量列 我在下面包含了一个 plyr 实现 以精确说明我想要做的事情 但它很慢 我怎样才能尽可能高效地做到这一点 理想情况下根本不分割数据框 base lt data frame group 1 1000 a s
r
DataFrame
plyr
如何使用 Snowflake sql 查询的结果填充 pandas DataFrame?
使用Python 连接器 https docs snowflake net manuals user guide python connector example html querying data我可以查询雪花 import snowf
pandas
DataFrame
snowflakeclouddataplatform
set_index 不在 pandas 中建立索引
对于下面的简单程序 我期望第二个输出与第一个输出相同 为什么这没有发生 这只是订单的改变data1 and data2 columnList PID Sec Util random data1 67123 12 85 100 67123 1
python
pandas
DataFrame
multiindex
向数据框添加行的有效方法
由此question https stackoverflow com questions 28056171 how to build and fill pandas dataframe from for loop和其他人似乎不建议使用con
python
pandas
DataFrame
框架和对象之间有什么区别,什么时候应该修改其中一个而不是另一个?
我开始阅读有关 python 的 语法的内容 并偶然发现了以下帖子 答案 关于 的交互代码 https stackoverflow com a 13329969 7143036 所以我注意到框架和物体之间似乎存在差异 在全局框架中 即使它们
python
python3x
object
DataFrame
为什么 `head` 需要 `()` 而 `shape` 不需要?
在下面的代码中 我将 csv 文件导入到 Python 的 pandas 库中并显示前 5 行 并查询 pandas 数据框的 形状 import pandas as pd data pd read csv my file csv data
python
pandas
DataFrame
Methods
从 data.frame 中的现有变量创建几个新的派生变量
在 R 中 我有一个 data frame 其中有几个变量 这些变量是多年来每月测量的 我想得出每个变量的月平均值 使用所有年份 理想情况下 这些新变量将全部放在一个新的 data frame 中 继承 ID 下面我只是将新变量添加到 da
r
variables
DataFrame
在 Spark 中,从哈希映射创建数据帧,其中键作为列名称,值作为行
我有一个数据框 我有一个列 它是数据框中的地图 如下所示 scala gt df printSchema root A1 map nullable true key string value string valueContainsNull
scala
apachespark
DataFrame
apachesparksql
使用plotly r 的多折线图
我有一个数据框 我试图使用plotly作为多折线图来绘制它 下面是数据框的样子 Month considered pct x pct y pct
r
DataFrame
plotly
rplotly
连接两列值pandas
我有一个数据框数据 Cluster OsId BrowserId PageId VolumePred ConversionPred 255 7 11 17 1149582 4 0 607 18 99 16 917224 8 0 22 0 1
python
python3x
pandas
DataFrame
如何将行添加到数据框中仅修改某些列
为了准备用于绘图的数据 我需要向数据添加一个新行 我有这个数据框 df lt data frame test id c 1 1 1 1 test nr c 1 1 1 1 region c A B C D test value c 3 1
r
DataFrame
dplyr
tibble
根据向量元素的数量截断数据框
我有一个数据框df 包含三个向量 subject condition value 01 A 12 01 A 6 01 B 10 01 B 2 02 A 5 02 A 11 02 B 3 02 B 5 02 B 9 主题 01 有四个观察值
r
DataFrame
vector
使用字符向量索引命名数据帧的嵌套列表 - R
我有一个命名数据框的嵌套列表 如下所示 mylist2 lt list list df1 a data frame replicate 2 sample 0 1 5 rep TRUE df2 b data frame replicate 2
r
list
DataFrame
Indexing
Python - 类似于 VLOOKUP (Excel) 的函数
我正在尝试连接两个数据框 但无法理解 Python 提供的可能性 第一个数据框 ID MODEL REQUESTS ORDERS 1 Golf 123 4 2 Passat 34 5 3 Model 3 500 8 4 M3 5 0 第二个
python
pandas
DataFrame
vlookup
«
1
2
3
4
5
6
7
8
...100
»