Julia 转置 DataFrame 中的分组数据？

2024-03-15

ds = Dataset(group = repeat(1:3, inner = 2),
                                    b = repeat(1:2, inner = 3),
                                    c = repeat(1:1, inner = 6),
                                    d = repeat(1:6, inner = 1),
                                    e = string.('a':'f'))

在inmemorydatasets包中，我们可以像这样转置分组数据。

#transpose by group
transpose(groupby(ds, :group), 2:4)

如何在 DataFrames 包中执行此操作？

我怎样才能在 R 中做到这一点？

result:

Row │ group  variable  1       2      
     │ Int64  String    Int64?  Int64? 
─────┼─────────────────────────────────
   1 │     1  b              1       1
   2 │     1  c              1       1
   3 │     1  d              1       2
   4 │     2  b              1       2
   5 │     2  c              1       1
   6 │     2  d              3       4
   7 │     3  b              2       2
   8 │     3  c              1       1
   9 │     3  d              5       6

回答（尝试）关于 Julia DataFrames 问题的一部分：

首先创建数据框：

df = DataFrame(group = repeat(1:3, inner = 2),
               b = repeat(1:2, inner = 3),
               c = repeat(1:1, inner = 6),
               d = repeat(1:6, inner = 1),
               e = string.('a':'f'))

接下来，由于转置操作取决于行排序，因此我们修复组中的行排序：

julia> ordereddf = transform(DataFrames.groupby(df, :group),"group" => (x->1:length(x)) => "rn")[:,Not(:e)]
6×5 DataFrame
 Row │ group  b      c      d      rn    
     │ Int64  Int64  Int64  Int64  Int64 
─────┼───────────────────────────────────
   1 │     1      1      1      1      1
   2 │     1      1      1      2      2
   3 │     2      1      1      3      1
   4 │     2      2      1      4      2
   5 │     3      2      1      5      1
   6 │     3      2      1      6      2

最后，stack - unstack组合，是否转置位：

julia> sort!(unstack(stack(ordereddf,[:b,:c,:d]),:rn, :value),:group)
9×4 DataFrame
 Row │ group  variable  1       2      
     │ Int64  String    Int64?  Int64? 
─────┼─────────────────────────────────
   1 │     1  b              1       1
   2 │     1  c              1       1
   3 │     1  d              1       2
   4 │     2  b              1       2
   5 │     2  c              1       1
   6 │     2  d              3       4
   7 │     3  b              2       2
   8 │     3  c              1       1
   9 │     3  d              5       6

感觉可能有更简单的方法来做到这一点，但一般来说，转置很少适合类似数据库的表，如果合适，那么也许应该首先使用矩阵来存储信息。

R部分留给其他人来回答。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

Julia

Julia 转置 DataFrame 中的分组数据？的相关文章

R 中的插补 MICE 仍不存在于数据集中

运行 MICE 包后 5 个完整插补集中的缺失值数量从 147428 减少到 46093 但不是应该是 0 NA 吗 Thanks 这是我的 MICR 代码 imp mice newdata imputationSet1 complete
导入 mgcv 失败，因为找不到 Rlapack.dll

我想通过使用链接到 IronPython 中的 R 统计包R NET http rdotnet codeplex com 图书馆它一直工作得很好但现在我需要使用 R 的mgcv http cran r project org web p
按钮：带滚动条的下载按钮仅下载几行

我正在处理超过 100 000 行的表并使用DT包裹开发版本0 1 56 在 Shiny App 中将其可视化此外我正在使用DT扩展如下 Buttons 下载不同格式的数据然而虽然Scroller扩展程序也已激活我只能下载几行不是
添加不同 data.frame 中缺失的列并填充 0 [重复]

这个问题在这里已经有答案了我有以下情况 df1 a b c d 1 2 3 4 df2 a c 5 6 我想要的结果是用 df1 中缺失的列填充第二个 data frame 并用零填充它们所以结果应该是 df3 a b c d 5 0
不同元素的ggplot字体大小

我知道在创建 ggplot 图后我可以使用theme get 返回所有主题元素的详细信息这对于弄清楚诸如此类的事情非常有帮助strip text x等等但我有两件事无法弄清楚 1 在下面的ggplot图形中代表短语被土拨鼠卡住的木头
根据 B 列中的一系列值获取 A 列的平均值

我的数据框有几列如下所示 df1 lt data frame A c 1 2 4 B c 1 3 1 C c 1 1 3 我有两个条件来获取 A 列的平均值条件1 我想在B为1时获得A列的平均值即只对row1和row2进行平均条件2
R Shinydashboard 根据选项卡选择显示/隐藏 UI 元素

如果有人可以提供帮助我正在努力满足要求我必须根据用户的选项卡面板选择在仪表板侧栏上显示隐藏一些元素这是 UI 代码的一部分可让您了解我的应用程序的结构我需要仅在 tabpPanel 2 上显示 Fourthoutput Fift
R - Rstudio - 如果生成警告/错误，则使 R 播放声音

我正在运行一个循环遍历股票对组合列表的脚本偶尔由于对组合之间的数据长度不同而产生错误脚本会停止运行我只是将不匹配的股票从考虑中删除 Error in model frame default formula stckY stckX 0
R Shiny 中表格的条件格式

我正在尝试可视化队列分析并想使用RenderDataTable闪亮以获得这种可视化效果我将能够突出显示基于具有值 1 0 的单独列的所有单元格其中 1 被着色 0 不被着色我尝试了几件事包括尝试使用geom tile in ggp
在 R 中绘制决策树（插入符）

我已经训练了一个数据集rf方法例如 ctrl lt trainControl method LGOCV repeats 3 savePred TRUE verboseIter TRUE preProcOptions list thresh
使用 kableExtra 增加行/行间距

有没有办法在 r markdown 或 bookdown 中使用 kableExtra 增加 pdf 输出的行间距 library knitr library kableExtra kable head iris 5 caption Iri
使用“kde”函数进行 R 中的 5-D 核密度估计

我想通过使用 R 的 ks 库中的 kde 函数来执行 5 维数据 x y z 时间大小的核密度估计在它的手册中它说它可以执行核密度估计1 至 6 维数据手册第 24 页 http cran r project org web p
mutate() 尝试在使用美元符号运算符时使用全局变量的值进行提取

我使用得到了有趣的结果mutate with a 当全局环境中碰巧存在与要提取的元素同名的变量时进行提取我正在运行 R 3 1 3 和 dplyr 0 4 3 9 这工作正常 library dplyr df lt data frame
成对散点图；一对多[重复]

这个问题在这里已经有答案了有没有一种简洁的方法来创建pairs仅将一个变量与许多其他变量进行比较的图换句话说我可以只绘制标准的一行或一列吗 pairs不使用循环的散点图矩阵融化你的数据然后使用带有facet的ggplot libr
难以理解 R 中双括号和单括号子集之间的区别[重复]

这个问题在这里已经有答案了我很难理解双括号子集和单括号子集之间的区别我在开源编程方面相当陌生我很难理解 R 中的 help 函数因为考虑到我目前对 R 的理解其中的一些信息对我来说太技术性了我尝试过谷歌搜索差异虽然它给了我一个
如何绘制对数似然函数图

我想绘制 pi 和 pi 之间的对数似然函数对数似然函数 llh lt function teta x sum log 1 cos x teta 2 pi x c 3 91 4 85 2 28 4 06 3 70 4 04 5 46 3
使用shinyjs通过javascript在闪亮的应用程序中操作现有的Leaflet地图

我有一个闪亮的应用程序其中包含现有的传单地图我希望能够在渲染后使用自定义 javascript 通过shinyjs包裹一个最小的例子如下 app R packages library dplyr library leaflet lib
仅当 ggplot 中 y 轴的下限设置为 0 时才会出现图条[重复]

这个问题在这里已经有答案了我正在尝试创建一个条形图当我将限制设置为 0 7 时就会出现条形但是我希望下限为 1 而不是 0 当我将下限设置为 1 时条形图不会出现我收到以下错误消息 Removed 8 rows contain
在R中使用plotly在轴标题中换行和下标

我刚开始使用plotly对于 R 中的一些交互式散点图并且在轴标签上遇到困难通常我设计我的情节ggplot2然后使用ggplotly函数来转换它们但这有时由于某种原因非常慢所以我想直接在中创建我的图plotly 我现在尝试更改轴标题
拆分并保存在新的 data.frames 中

我有一个大 data frame 144 列我想将其分成每组 3 列子文件或子 data frame 然后将子 data frame 保存在单独的文件中换句话说 file1 将包含从 1 到 3 的列 file2 将包含从 6 到 9

随机推荐

android 游标到 JSONArray

如何将 Cursor 转换为 JSONArray 我的光标为 3 列 id 姓名出生我已经搜索过但找不到任何示例游标到 JSONArray public JSONArray cur2Json Cursor cursor JSONA
VirtualBox WordPress 重定向到端口 80

我在 OSX 10 9 2 上运行我刚刚在 VirtualBox 中的 Lubuntu 上设置了 LAMP 这样我就可以通过 VirtualBox 运行开发服务器我改变了我的 etc apache2 ports conf监听 8080
Android Studio3.2 APK 构建错误 -> 保留文件或目录名称“lib”

Android Studio 版本 3 2 AI 181 5540 7 32 5014246 在 Android Studio 3 1 中我能够成功构建 SignedAPK 但当我制作了 Android Studio 3 2 后我根本无
添加回调 url 时 Twitter API oAuth 签名失败

我正在使用这个代码指南另一个失败的 Twitter oAuth cURL 访问令牌请求 https stackoverflow com questions 3295466 another twitter oauth curl access
.NET 转到 NuGet 包的实现

有谁知道一种方法工具可以让我浏览实施来自 NuGet 包的方法类型通过具有原始PDBs or a URL哪里可以得到它们我知道来源链接 https github com dotnet core blob master Documen
使用Flask return修改网页

我有最简单的烧瓶应用程序 app Flask name app route python methods GET POST def index return Hello World if name main app run debug Tr
从 thymeleaf spring 框架中的本地目录插入图像（使用 maven）

我使用此链接开发了一个项目 https spring io guides gs serving web content https spring io guides gs serving web content 我使用maven来开发上述项
使用参数作为列名的“排序依据”

我们希望在使用 Visual Studio 数据集设计器创建的查询或存储过程的 Order By 子句中使用参数 Example FROM TableName WHERE Forename LIKE SearchValue OR Surna
MVVM 中的命令

我看过一些教程人们在他们的代码中创建像 CanExecute 这样的方法我假设他们这样做是为了帮助读者理解这一切是如何运作的当我查找 Command 和 ICommand 时它会将我带到 MSDN 上用于 Windows 应用商店应
std::memory_order 和指令顺序，澄清

这是一个后续问题this one https stackoverflow com questions 59626494 understanding memory order acquire and memory order release
如何更改

Julia 转置 DataFrame 中的分组数据？

Julia 转置 DataFrame 中的分组数据？ 的相关文章

随机推荐

Julia 转置 DataFrame 中的分组数据？的相关文章