FParsec：如何组合解析器以便它们以任意顺序匹配

2024-04-30

任务是找到特定的键值对并解析它们。这些对可以按任何顺序出现。我的部分工作尝试：

open FParsec

type Parser<'a> = Parser<'a, unit>
type Status = Running | Done

type Job = 
    { Id: int
      Status: Status
      Count: int }

let ws = spaces

let jobId: Parser<int> = ws >>. skipStringCI "Job id" >>. ws >>. skipChar '=' >>. ws >>. pint32

let status: Parser<Status> = 
    ws >>. skipStringCI "Status" >>. ws >>. skipChar '=' >>. ws >>. (
        (skipStringCI "Running" >>% Running) <|> (skipStringCI "Done" >>% Done))

let count: Parser<int> = ws >>. skipStringCI "Count" >>. ws >>. skipChar '=' >>. ws >>. pint32

let parse: Parser<Job> = parse {
    do! skipCharsTillStringCI "Job id" false 1000
    let! id = jobId
    do! skipCharsTillStringCI "Status" false 1000
    let! status = status
    do! skipCharsTillStringCI "Count" false 1000
    let! count = count
    return { Id = id; Status = status; Count = count }}

[<EntryPoint>]
let main argv = 
    let sample = """
Some irrelevant text.
Job id = 33
Some other text.
Status = Done
And another text.
Count = 10
Trailing text.
"""
    printfn "%A" (run parse sample)
    0
(* 
result:
 Success: {Id = 33;
 Status = Done;
 Count = 10;} 
*)

所以，它可以工作，但有两个问题：明显的重复（jobId函数中的“Job id”和顶级解析器中的“Job id”等），并且它需要“Job id”，“Status”和“Count” “按照这个特定的顺序进行排序，这根据要求是错误的。

我有一种强烈的感觉，有一个优雅的解决方案可以解决这个问题。

Thanks!

第一个问题（重复）可以通过少量重构来解决。基本思想是将每个解析器包装到一个可以执行跳过的包装器中。
Note由于这段代码还远未达到完美，我只是尝试使重构尽可能小。

let jobId: Parser<int> = pint32

let status: Parser<Status> = 
    (skipStringCI "Running" >>% Running) <|> (skipStringCI "Done" >>% Done)

let count: Parser<int> = pint32

let skipAndParse prefix parser =
    skipCharsTillStringCI prefix false 1000
    >>. ws >>. skipStringCI prefix >>. ws >>. skipChar '=' >>. ws >>. parser

let parse: Parser<Job> = parse {
    let! id = skipAndParse "Job id" jobId
    let! status = skipAndParse "Status"  status
    let! count = skipAndParse "Count" count
    return { Id = id; Status = status; Count = count }}

第二个问题更复杂。如果您希望数据线以自由顺序出现，则必须考虑以下情况：

not all存在数据线；
出现某条数据线twice或者更多;

为了缓解这种情况，您需要生成一个list找到的数据行，分析所需的一切是否都存在，并决定如何处理任何可能的重复项。

请注意，每个数据行不能再有“跳过”部分，因为它可能会在实际解析器之前跳过信息行。

let skipAndParse2 prefix parser =
    ws >>. skipStringCI prefix >>. ws >>. skipChar '=' >>. ws >>. parser

// Here, you create a DU that will say which data line was found
type Result =
    | Id of int
    | Status of Status
    | Count of int
    | Irrelevant of string

// here's a combinator parser
let parse2 =
    // list of possible data line parsers
    // Note they are intentionally reordered
    [
    skipAndParse2 "Count" count |>> Count
    skipAndParse2 "Status"  status |>> Status
    skipAndParse2 "Job id" jobId |>> Id
    // the trailing one would skip a line in case if it has not
    // been parsed by any of prior parsers
    // a guard rule is needed because of specifics of
    // restOfLine behavior at the end of input: namely, it would
    // succeed without consuming an input, which leads
    // to an infinite loop. Actually FParsec handles this and
    // raises an exception
    restOfLine true .>> notFollowedByEof |>> Irrelevant
    ]
    |> List.map attempt // each parser is optional
    |> choice // on each iteration, one of the parsers must succeed
    |> many // a loop

运行代码：

let sample = "
Some irrelevant text.\n\
Job id = 33\n\
Some other text.\n\
Status = Done\n\
And another text.\n\
Count = 10\n\
Trailing text.\n\
"

sample |> run parse2 |> printfn "%A "

将产生以下输出：

Success: [Irrelevant ""; Irrelevant "Some irrelevant text."; Id 33;
Irrelevant ""; Irrelevant "Some other text."; Status Done; Irrelevant "";
Irrelevant "And another text."; Count 10; Irrelevant ""]

进一步处理需要过滤Irrelevant元素，检查重复或缺失的项目，并形成Job记录或提出错误。

更新：进一步处理隐藏的简单示例Result并返回Job option反而：

// naive implementation of the record maker
// return Job option
// ignores duplicate fields (uses the first one)
// returns None if any field is missing
let MakeJob arguments =
    let a' =
        arguments
        |> List.filter (function |Irrelevant _ -> false | _ -> true)

    try
        let theId     = a' |> List.pick (function |Id x -> Some x | _ -> None)
        let theStatus = a' |> List.pick (function |Status x -> Some x | _ -> None)
        let theCount  = a' |> List.pick (function |Count x -> Some x | _ -> None)
        Some { Id=theId; Status = theStatus; Count = theCount }
    with
        | :?System.Collections.Generic.KeyNotFoundException -> None

要使用它，只需将以下行添加到代码中parse2:

|>> MakeJob

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

F

parsercombinators

fparsec

FParsec：如何组合解析器以便它们以任意顺序匹配的相关文章

函数式 GUI 编程可能吗？ [关闭]

Closed 这个问题是基于意见的 help closed questions 目前不接受答案我最近发现了 FP bug 试图学习 Haskell 到目前为止所看到的东西给我留下了深刻的印象一流的函数惰性求值和所有其他好处我还不是专
如何从复合泛型类型中检索值？

如何从泛型中检索值具体来说我正在尝试以下操作 Test let result Validate goodInput How to access record let request getRequest result 这是代码 type
如何统计字符串中特定字符的出现次数

我不知道从哪里开始检查字符串中特定字符的 n 次出现我已经列出了我认为是该功能框架的基本轮廓但我不确定内容是什么 let countCharFromNth getStr string chkdChar char if getStr Le
F# 设置带有参数的 SQLCommand 的最佳方法

我的 F 程序需要与 SQL Server 通信在一部分中我有这样的事情 let workFlowDetailRuncommand new SqlCommand query econnection workFlowDetailRuncom
F# 中的异步 EF 查询

在使用 EF6 的 C 中我可以轻松地进行如下异步操作 using var context new MyDbContext var item await context SomeEntities Where e gt e Id 1 Fir
F# 中的组总计 - 使用序列很容易，可以使用列表吗？

给定一组 id value 元组序列很容易计算组总数与使用 C 和 LINQ 执行此操作的方式几乎相同 let items g1 5 g2 10 g1 20 let groupsums items gt Seq groupBy fun
如何在 x 轴上显示每个元素的标签？

我有包含文件名和编号的元组序列我想绘制柱形图其中 X 轴上有文件名我的问题是现在 X 轴下仅显示 3 个标签文件名这可能是因为屏幕无法容纳更多内容还是X轴间隔错误如何让图表显示所有文件名也许有办法将这些标签逆时针旋转 90
F#、FParsec 和递归调用流解析器（第二次）

感谢您的回复我的第一篇文章 https stackoverflow com questions 26853718 f fparsec and calling a stream parser recursively and 我的第二篇文章 h
与 F# List.nth 的参数顺序混淆

List nth is T 列表 gt 整数 gt T 而不是标准int gt T 列表 gt T like Seq nth 这使得管道有些尴尬难道幕后有什么事情吗我不知道为什么可能是为了ocaml兼容性 http www csc v
如何解决“程序主模块为空：运行时不会发生任何事情”

我在 F 解决方案中有两个项目 1 主要项目有 EntryPoint http msdn microsoft com en us library dd402151 aspx并设置为启动项目 2 support 第二个项目拥有一组支持模块
如何在插件场景中实现程序集绑定重定向？

我有一个plugin P延伸和application A NET40 我无法控制 P 程序集 NET40 有一个shared dependency D NET35 P和D都依赖于FSharp Core 但版本不同 P是针对FSharp Co
通用高阶函数

当我将泛型函数作为本地值传递时但在作为参数传递时却不能使用具有不同类型参数的泛型函数时是否有原因例如 let f id let g x y f x f y g 1 2 工作正常但如果我尝试将函数作为参数传递 let g f x y
F# 在类型提供程序内的类型扩展函数中生成类型

我有以下问题在我的类型提供程序中我需要使用一个返回此泛型类型实例的方法来扩展我之前定义的泛型类型我的意思是假设我们有 type receiveType lt a gt class val Next int val Type stri
什么是错误“类型实例化涉及 byref 类型。” F# 中的解决方法是什么

我有一些代码包装 TA Lib 很多包装器非常相似 let sma timePeriod int data float let mutable outStartIndex 0 let mutable outNbElement 0 let m
使用 SqlBulkCopy 和 F# 在 SQL 中导出矩阵

我想将大量数据从 F 传输到 SQL 表基本上我的 F 代码创建了一个三列矩阵 UserID ProductID and price 和N行我想将其复制粘贴到数据库中我尝试了多种选择但最终从 F 传输数据非常慢 10000
单位安全平方根

我只是想知道如何以与 F 正确交互的方式编写用户定义的平方根函数 sqrt 单位制 http blogs msdn com andrewkennedy archive 2008 09 04 units of measure in f par
F# 检查列表是否为空

作为 F 新手我正在尝试实现一个简单的函数该函数将索引和列表作为参数然后返回给定索引的列表值 let rec getElementAtIndex index int list a list match index list with
将 F# 类型保存到数据库

A lot http gorodinski com blog 2013 02 17 domain driven design with fsharp and eventstore f 文章数推荐 http fsharpforfunandpr
如何使 FSI 在 NET5 下工作并让愚蠢的 stackoverflow 消息“标题不能包含...”闭嘴？

我正在将一个相当小的 F 项目从 Net Framework 迁移到 NET5 迁移非常简单一切正常包括测试但是当我运行一些脚本时我现在收到以下错误 Microsoft R F Interactive version 11 0 0
如何从引用的表达式匹配中获取模块、函数等的 F# 名称

我继续开发 F 引用表达式的打印机它不一定是完美的但我想看看有什么可能中的活跃模式Microsoft FSharp Quotations Patterns and Microsoft FSharp Quotations Derived

随机推荐

使用 TFLite 量化模型的参数进行计算操作

我正在尝试使用量化的 Mobilenetv2 模型在硬件中实现图像分类here https www tensorflow org lite guide hosted models 为此我首先需要从头到尾重现推理过程以确保我理解对数据执行
检查一个类是否是 Laravel 5 中的 Model

我在 Laravel 5 2 中有这段代码用于检查给定的数据库表名称 what 是否有自己的 Model public function manage what model Str studly Str singular what if
加载视频数据集（Keras）

我正在尝试实现 LRCN C LSTM RNN 来对视频中的情绪进行分类我的数据集结构分为两个文件夹 train set 和 valid set 当你打开其中任何一个时你可以找到3个文件夹积极消极和惊喜最后这 3 个文件夹中
如何在 Google 文档电子表格中使用 regexextract 函数来获取字符串的“所有”出现位置？

我的文本字符串位于单元格 D2 中 Decision ERC Case No 2009 094 MC In the Matter of the Application for Authority to Secure Loan from th
颜色重新映射 - 使用 3D 网格匹配目标调色板？

假设我有颜色 FOO 它以 RGB 格式存储我需要重新着色 FOO 以便它与颜色列表中最接近的颜色匹配即时执行此操作我是否无法将每种颜色的 RGB 值视为 3D 网格上的点 r x g y b z 并计算点 FOO 与每个颜色点之间的
如何给gRaphael图形添加jquery点击事件？

我用 g Raphael 做了一个图表 function var r Raphael pieChart pie r piechart 320 240 100 55 20 13 32 5 1 2 10 r text 320 100 Inter
如何创建可以使用拨号盘启动的应用程序

我想知道如何使用 Dialpad 中的一些代码启动我的 Android 应用程序就像如果你 3214789650 它会从您的星系启动angryGps 应用程序如何实施 Thanks 试试这个使用广播接收器来监听去电号码清单 xml
Maven 依赖项插件无法解析插件的手动指定依赖项

我遇到了一个问题maven dependency plugin Maven版本3 2 3 maven dependency plugin版本2 10 我正在尝试引入插件依赖项我创建了一个简单的项目
MongoError: 使用 mongoosejs 连接 mLab 时数据库名称不能包含字符 ' '

这是我的JS代码 var mongoose require mongoose mongoose connect mongodb myUsername email protected cdn cgi l email protection 61
GetWindowLong(int hWnd, GWL_STYLE) 在 C# 中返回奇怪的数字

我使用 GetWindowLong 窗口 api 来获取 C 中窗口的当前窗口状态 DllImport user32 dll static extern int GetWindowLong IntPtr hWnd int nIndex Pr
有没有办法让 EF 5 代码优先迁移使用 ASP.NET MVC 4 中的 SQL Server 数据库来完成所有操作？

当我开始一个新的 ASP NET MVC 4 Web 应用程序项目时我希望它默认使用 SQL Server 来处理所有事情默认情况下当您运行此项目时它会创建一个 LocalDb 实例并在其中创建以下表网页会员资格网页 OAut
排列 SSE __m128i 寄存器内的字节

我有以下问题 In m128i寄存器有 16 个 8bit 值顺序如下 1 5 9 13 2 6 10 14 3 7 11 15 4 8 12 16 我想要实现的是有效地洗牌字节以获得此排序 1 2 3 4 5 6 7 8 9 10 11
使用 PHP 将列标题添加到 CSV 文件

我正在尝试将 php mysql 生成的表转换为可下载的 csv 文件当用户输入搜索参数时将调用 mysql 表并将结果作为表返回我使用了该线程中提供的解决方案效果非常好在 PHP 中为用户创建 CSV 文件 https stac
javascript 在提示后显示用户输入

我想在用户完成信息输入后显示用户输入的内容当用户到达最后一个提示时我希望页面显示他们输入的内容例如如果他们在名称部分下输入 apples 我希望它在底部代码的 P1 部分中列出单词 apples 我是 javascript 的新手
从基类调用重写的方法？

深入Python http diveintopython net object oriented framework userdict html Python 的原作者 Guido 是这样解释方法重写的派生类可以重写其基类的方法因为方法
滚动时重用视图时保存 RecyclerView 中所选项目的状态

我为 recyclerView 创建了一个 Adapter 和 ViewHolder 我将 itemView 的 imageButton 绑定到 Viewholder 内并在 onBindViewHolder 中设置了一个 onClick
C++ 中的编译器指令重新排序优化（以及阻碍它们的因素）

我已将代码缩减为以下内容这在保留我感兴趣的编译器输出的同时尽可能简单 void foo const uint64 t used uint64 t ar 100 for int i 0 i lt 100 i ar i some globa
将 VBA 转换为 .NET 语言 [重复]

这个问题在这里已经有答案了可能的重复是否可以将 VBA 转换为 C https stackoverflow com questions 388819 is it possible to convert vba to c 假设我有一个大型
如何在rails中使用bootstrap Modal和link_to？

我之前就问过这个问题但不幸的是我仍然被困住了我有一个这样的 link to 在 page html erb 当点击链接时我想以模式加载的页面我有 div class modal Test Content div 在资产 page js
FParsec：如何组合解析器以便它们以任意顺序匹配

任务是找到特定的键值对并解析它们这些对可以按任何顺序出现我的部分工作尝试 open FParsec type Parser lt a gt Parser lt a unit gt type Status Running Done typ

FParsec：如何组合解析器以便它们以任意顺序匹配

FParsec：如何组合解析器以便它们以任意顺序匹配 的相关文章

随机推荐

热门标签

FParsec：如何组合解析器以便它们以任意顺序匹配的相关文章