Deedle - 按列区分

2024-03-14

前几天我遇到了一个情况，我的某个特定专栏Frame有一些重复的值。

我想删除所述列具有重复值的任何行。

我设法使用过滤器函数破解了一个解决方案，虽然它对于手头的探索性数据分析来说已经足够好了，但它应该更加痛苦。

尽管四处寻找，我还是找不到任何关于优雅解决方案的想法。

我还注意到Series不提供DistincyBy()或类似的。

如何对特定列执行“DistinctBy”操作？

一种方法是使用nest and unnest，像这样：

let noDuplicates: Frame<(int*string), string> =
  df1
  |> Frame.groupRowsBy "Tomas"
  |> Frame.nest
  |> Series.mapValues (Frame.take 1)
  |> Frame.unnest

让我们解释一下每个步骤。想象一下你有这个数据框：

// Create from individual observations (row * column * value)
let df1 = 
  [ ("Monday", "Tomas", 1); ("Tuesday", "Adam", 2)
    ("Tuesday", "Tomas", 4); ("Wednesday", "Tomas", -5)
    ("Thursday", "Tomas", 4); ("Thursday", "Adam", 5) ]
  |> Frame.ofValues

            Tomas Adam      
Monday    -> 1     <missing> 
Tuesday   -> 4     2         
Wednesday -> -5    <missing> 
Thursday  -> 4     5

您想要删除“Tomas”列中包含重复值的行。

首先，按此列分组。

let df2 : Frame<(int * string), string> = df1 |> Frame.groupRowsBy "Tomas"

                Tomas Adam      
1  Monday    -> 1     <missing> 
4  Tuesday   -> 4     2         
4  Thursday  -> 4     5         
-5 Wednesday -> -5    <missing>

现在您有了一个具有两级索引的框架，您可以将其转换为一系列数据框架。

let df3 = df2 |> Frame.nest

          Tomas Adam      
Monday -> 1     <missing> 

            Tomas Adam 
Tuesday  -> 4     2    
Thursday -> 4     5    

             Tomas Adam      
Wednesday -> -5    <missing>

取每一帧的第一行。

let df4 = df3 |> Series.mapValues (fun fr -> fr |> Frame.take 1)

          Tomas Adam      
Monday -> 1     <missing> 

           Tomas Adam 
Tuesday -> 4     2    

             Tomas Adam      
Wednesday -> -5    <missing>

仍然需要执行向后转换：从一系列数据帧转换为具有两级索引的帧。

let df5 = df4 |> Frame.unnest

                Tomas Adam      
-5 Wednesday -> -5    <missing> 
1  Monday    -> 1     <missing> 
4  Tuesday   -> 4     2

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

F

deedle

Deedle - 按列区分的相关文章

不可为空字符串的 F# 类型别名

我的代码中有一些域类型我用它们来区分不同类型的字符串因此编译器可以阻止我例如以错误的顺序传递参数 type Foo string type Bar string let baz foo Foo bar Bar printfn A A
作为参数的函数的类型推断

我想编写一个函数它接受几个元组作为参数并用元素选择它们并传递给另一个函数其中 i 作为另一个参数给出我已经尝试过这样的事情 let function tup1 A A tup2 B B i otherFunction i tup1
为什么没有List.skip和List.take？

为什么没有List skip和List take 当然有 Seq take 和 Seq skip 但它们不会因此创建列表一种可能的解决方案是 mylist gt Seq skip N gt Seq toList 但这会创建第一个枚举器然
F# 的 timeit 函数

我想写一些类似的东西 let timeit x a gt b let start System DateTime Now x let duration System DateTime Now start printfn time usage
使用实体框架代码优先的 FSharp 记录类型

我正在一个业务应用程序中进行概念验证我想用 F 替换当前的 C 代码优先实体框架实现我正在关注this http blogs msdn com b visualstudio archive 2011 04 04 f code first
F# 类型函数和 [] 属性

这两个 F 类型函数有什么区别 let defaultInstance1 lt a when a new unit gt a gt new a
不可变数据结构性能

我不明白作为一个集合的东西怎么可能是不可变的并且仍然具有可接受的性能根据我在 F Sets 中读到的内容内部使用红黑树作为其实现如果每次我们想要向红黑树添加新内容时我们基本上都必须重新创建它那么它如何才能具有良好的性能呢我在这里
F# 设置带有参数的 SQLCommand 的最佳方法

我的 F 程序需要与 SQL Server 通信在一部分中我有这样的事情 let workFlowDetailRuncommand new SqlCommand query econnection workFlowDetailRuncom
定义具有多种消息类型的消息传递域

到目前为止我见过的大多数 F 消息传递示例都使用 2 4 种消息类型并且能够利用模式匹配将每条消息定向到其正确的处理函数对于我的应用程序由于处理和所需参数的不同性质我需要数百种独特的消息类型到目前为止每个消息类型都是其自己的记
F#、FParsec 和递归调用流解析器（第二次）

感谢您的回复我的第一篇文章 https stackoverflow com questions 26853718 f fparsec and calling a stream parser recursively and 我的第二篇文章 h
绘图 Deedle 框架

我有以下代码 let mychart frame GetAllSeries gt Seq iter fun key value gt Chart Line value Name key gt Chart Combine where fram
如何搭建Windows Phone开发环境并使用F#开发应用程序？

我已经下载了Windows Phone开发工具但我不知道如何使用F 来开发应用程序目前是C 将 F 和 Windows Phone 模板安装到 Visual Studio 中可以让生活变得更轻松如果您打开 Visual Studio
F# 中序列的递归函数

这是一个相当微不足道的问题但快速的谷歌搜索并没有给我答案为序列编写递归函数的标准方法是什么对于列表您可以使用空列表和头尾模式进行模式匹配序列的等效项是什么没有标准的方法可以做到这一点因为您很少为序列编写递归函数您应该查看各
在 Blazor 中显示计时器

我正在尝试在服务器端 Blazor 应用程序中显示倒计时器我的代码同时使用 F 和 C 语言该代码在某种程度上可以工作但计时器永远不会按预期停止并且计时器显示偶尔不会呈现所有数字这是我第一次尝试 Blazor 服务器端应用程序我
是 F# 映射上的迭代还是集合中序遍历？

AFAIK F Map 和 set 被实现为红黑树所以我猜这些的迭代将是有序遍历我做了一些测试迭代结果总是排序的但我想确定一下是按顺序遍历吗 MSDN 上的文档非常适合解决这个问题例如返回值Set toSeq http msd
如何在 FsCheck 中注册任意实例并让 xUnit 使用它？

我有一个类型Average有一个字段count这是积极的int64 and a double字段称为sum 我做了一个任意的生成有效实例的操作 let AverageGen Gen map2 fun s c gt Average float
F# 获取随机数列表

我正在尝试用随机数填充列表但很难获得随机数部分我现在打印出一个随机数 10 次我想要的是打印出 10 个不同的随机数 let a new System Random Next 1 1000 let listOfSquares for
该表达式的类型为 int，但此处与 unit 类型一起使用

我试图在 F 中获得与此 vb net 代码完全相同的非功能性的 Function FastPow ByVal num As Double ByVal exp As Integer As Double Dim res As Double
从 C# 调用高阶 F# 函数

给定 F 高阶函数在参数中采用函数 let ApplyOn2 f int gt int f 2 和 C 函数 public static int Increment int a return a 我怎么打电话ApplyOn2 with I
将属性应用于返回值 - 在 F# 中

在 C 中可以将属性应用于方法的返回 return DynamicAttribute public object Xyz return new ExpandoObject 这在 F 中可能吗背景我想要一个用 F 编写的库的方法该方法

随机推荐

打印不带括号的 Numpy 数组

predictions x6 x5 x4 x3 x2 x1 predictions 调用上面的列表会产生以下数组 array 782 36739152 array 783 31415872 array 726 90474426 array
在单元测试中模拟 Spark RDD

是否可以在不使用sparkContext的情况下模拟RDD 我想对以下实用函数进行单元测试 def myUtilityFunction data1 org apache spark rdd RDD myClass1 data2 org ap
如何使用 CSS 创建对角线背景效果

是否可以使用 CSS 创建如下图所示的效果基本上我想创建 div 背景对角线分割一侧为块色另一侧为白色您可以使用linear gradient on background 请参见以下示例 body height 100vh widt
C语言中localtime的结果结构体是如何分配的？

我正在玩time hC 语言文件可以帮助我们处理时间日期函数我碰到 struct tm Cdecl localtime const time t timer 这似乎返回一个指向 tm 结构的指针我发现按地址返回主要用于返回新的内存分配
导入错误未定义符号（python 中的 C++ 模块）ZTINSt8ios_base7failureB5cxx11E

我知道网站上有很多类似的问题但我找不到问题的答案我使用 Cython 包装 C 类以便将它们与 Python3 一起使用使用以下命令构建外部模块后setup py 当我运行 python 程序时出现以下错误 from name o
MYSQL - 选择两个表中行数的差异

我正在尝试比较两个数据库中两个表的行数行数应该相同 SELECT 从 db1 table1 中选择 COUNT 从 db2 table1 中选择 COUNT AS差异仅当差异 0 时如何选择我需要为多个表运行此命令并且不需要 0 值
R RegEx：匹配方括号内的所有双引号 (") 字符

我正在努力获取匹配所有双引号字符的正则表达式出现在方括号内我有不同的部分可以完成我想要的部分功能例如 gsub xyz 1 xyz 将得到所有双引号无论其他什么 gsub xyz abc 1 abc 将把所有内容放在两个方括号内包
如何将 HashLocationStrategy 与 Auth0 Lock 小部件结合使用以进行用户登录

更新后Auth0登录示例 https github com auth0 samples auth0 angular samples tree master 01 Login to use HashLocationStrategy in ap
spring-batch (java-config) 使用 JobExecutionDecider 识别和执行步骤

我有 3 个步骤 A B C 应按 A gt B gt C 的顺序执行其中 B 是可选的我必须仅根据某些条件执行步骤 B 我使用 JobExecutionDecider 来决定如下 Bean name decider JobExecut
单击鼠标在画布中绘制实心圆

我想通过鼠标单击在画布上绘制一个填充或未填充的圆圈但我无法让我的代码正常工作我已经尝试了几乎所有方法这是我的 HTML div div
MonthGenitiveNames 和 MonthNames 之间有什么区别？为什么月份有空白？

我很困惑MonthGenitiveNames and MonthNames 两者的值都有月份名称那么它们之间有什么区别MonthGenitiveNames and MonthNames 还有为什么一个月是空白如果您查看两者的值就会发
ListView 滚动问题：项目选择时

我有 Listview 我试图用它来显示我的自定义适配器一切正常除了当我选择列表项并滚动它时未选择的项目已经被选择我真的不明白我的问题是什么列表显示这是我的课 Override protected void onCreate Bu
如果文件存在，如何在 MSBuild 中导致错误？

我们有一个在夜间构建之前运行的流程如果该过程失败它将生成一个文本文件我需要做的就是检查该文件是否存在如果存在则会导致 MSBuild 失败我目前已尝试以下操作
为什么我们不能通过索引访问元组的元素？

tuple
Java泛型方法的继承和覆盖规则

我有一个具有泛型方法的抽象类我想通过用特定类型替换泛型参数来覆盖泛型方法所以在伪代码中我有以下内容 public abstract class GetAndParse public SomeClass var public abstra
shinydashboard 一些 Font Awesome 图标不起作用

使用时shinydashboard我发现有些图标似乎有效而有些则无效在下面的示例中电池充满图标不起作用而时钟图标则工作正常我无法弄清楚为什么会发生这种情况 library shiny library shinydashboard
具有服务器端渲染 HTML 片段的骨干模型

我想开始使用 Backbone js 来更好地构建我的 JavaScript 文件但是我不想重做我的应用程序以通过 API 仅输出 JSON 如果我错了请纠正我但到目前为止我的印象是即使没有 JSON API 我仍然可以使用 Ba
Play Framework - 如何忽略 Json 序列化的某些字段？

我有案例课 case class User id Option Long None username String password Option String None 这是该案例类的 json 序列化器 object User impl
Rails：如何更改页面标题？

在不使用插件的情况下为 Rails 应用程序中的页面创建自定义标题的最佳方法是什么在你看来做这样的事情 h1 h1 布局文件中包含以下内容
Deedle - 按列区分

前几天我遇到了一个情况我的某个特定专栏Frame有一些重复的值我想删除所述列具有重复值的任何行我设法使用过滤器函数破解了一个解决方案虽然它对于手头的探索性数据分析来说已经足够好了但它应该更加痛苦尽管四处寻找我还是找不到任何关于

Deedle - 按列区分

Deedle - 按列区分 的相关文章

随机推荐

热门标签

Deedle - 按列区分的相关文章