将 NFA 转换为正则表达式

2024-01-03

我在这个网站上发现了同样的问题，答案是描述如何将 NFA 转换为正则表达式的 PDF http://courses.engr.illinois.edu/cs373/sp2009/lectures/lect_08.pdf。但这是行不通的，因为该方法有一些条件：

存在从初始状态到所有其他状态的转换，并且没有过渡到初始状态。
有一个接受状态，只有进入它的转换（并且没有传出）过渡）。
接受状态与初始状态不同。
除了初始状态和接受状态外，所有其他状态都与所有其他状态相连通过过渡状态。特别是，每个状态都有一个到自身的转换。

在我的示例中，开始状态只是进入下一个状态，而不是所有状态（例如 q0 进入 q1，但不进入 q2、q3），并且存在到开始状态的转换。

那么将 NFA 转换为正则表达式的最简单方法是什么？我没有给出 NFA 的例子，因为我没有具体的例子，这只是一个一般性的问题，因为我遇到过这种 DFA，其中起始状态并不与所有状态相关，并且是转换到启动状态。

我想要一个通用算法来转换这种 NFA。

答案是假设这些条件，因为任何 NFA 都可以修改以满足这些要求。

For any kind of NFA, you can add a new initial state q₀ that has an epsilon-transition to the original initial state, and also using an additional transition symbol called ∅ (they call it empty set symbol, assumed to be a symbol which does not match any symbol from the original NFA) from it to any other states, then use this new state as the new initial state. Note that this does not change the language accepted by the original NFA. This would make your NFA satisfies the first condition.

For any kind of NFA, you can add a new acceptance state q_a that has an epsilon-transition from all acceptance state in the original NFA. Then mark this as the only acceptance state. Note that this does not change the language accepted by the original NFA. This would make your NFA satisfies the second condition.

By the above construction, by setting q₀ != q_a, it satisfies the third condition.

在您提供的链接中，第四个条件是通过一个称为 ∅（空集符号）的特殊转换符号来解释的，原始 NFA 中的实际字母表无法匹配该符号。因此，您可以使用这个新符号添加从每个状态到任何其他状态的转换。请注意，这不会更改原始 NFA 接受的语言。

现在 NFA 已被修改以满足四个要求，您可以应用那里的算法将 NFA 转换为正则表达式，它将接受与原始 NFA 相同的语言。

编辑以回答进一步的问题:

To answer your question in the comment, consider the NFA with two states, q_A and q_B. q_A is the initial state as well as the only acceptance state. We have a transition from q_A to itself with symbol 0,1. We also have transition from q_A to q_B with symbol 1. Lastly we have transition from q_B to q_A with symbol 0.

可视化：



 0,1    
  |  1
->q_A----->q_B
  ^       |
  |-------|
     0

Step 2. When we normalize the NFA, just put the new init state (q_init) that points to q_A, and put a new acceptance state (q_acc) from q_A.

Step 3. We want to remove q_A. So q_A is the q_rip in the algorithm (in page 3). Now we need to consider every states that enters q_A and every states that exits from q_A. In this case, there are two states pointing to q_A, that are q_init and q_B. There are two states that are pointed to by q_A, that are q_B and q_acc. By the algorithm, we replace the transitions q_in->q_rip->q_out with a transition q_in->q_out, having the transition symbol R_dir+R_in(R_rip)*R_out, where:

R_dir is the original transition from q_in to q_out
R_in is the original transition from q_in to q_rip
R_rip is the original loop at q_rip
R_out is the original transition from q_rip to q_out

So in this case we replace the transition q_init->q_A->q_B with q_init->q_B with transition symbol (0+1)*1. Continuing this process, we will create in total 4 new transitions:

q_init->q_B: (0+1)*1
q_init->q_acc: (0+1)*
q_B->q_B: 0(0+1)*1
q_B->q_acc: 0(0+1)*

Then we can remove q_A.

Step 4. We want to remove q_B. Again, we identify the q_in and q_out. There is only one state coming to q_B here, which is q_init, and there is only one state departing from q_B, which is q_acc. So we have:

R_dir = (0+1)*
R_in = (0+1)*1
R_rip = 0(0+1)*1
R_out = 0(0+1)*

So the new transition q_init->q_acc will be:

R_dir+R_in(R_rip)*R_out

(0+1)* + (0+1)*1 (0(0+1)*1)* 0(0+1)*

And we can remove q_B.

步骤 5. 由于原始 NFA 中的每个状态都已被删除，我们就完成了。所以最终的正则表达式如上所示。

请注意，最终的正则表达式可能不是最佳的（并且在大多数情况下它不会是最佳的），这是算法所期望的。一般来说，为 NFA（甚至 DFA）找到最短的正则表达式是非常困难的（尽管在这个例子中很容易看出第一个组件已经涵盖了所有可能的字符串）

为了完整起见，接受相同语言的最短正则表达式将是：

(0+1)*

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

regex

nfa

将 NFA 转换为正则表达式的相关文章

正则表达式替换混合数字+字符串

我想删除所有包含数字的单词示例 LW23 London W98 String 从上面的字符串中我唯一想保留的是 London String 这可以用正则表达式来完成吗我目前正在使用 Python 但 PHP 代码也很好 Thanks E
[Regex]::Replace() 和 -replace 有什么区别？

我明白了之间的区别 Replace and replace 但是什么是 replace and Regex Replace 我测试了以下两个代码但对我来说结果完全相同我还提到了 PowerShell Cookbook O reilly
在 Java 正则表达式中获取多个模式的重叠匹配

我有同样的问题这个链接 https stackoverflow com questions 18751486 matching one string multiple times using regex in java 但有多种模式我的正
Python re无限执行

我正在尝试执行这段代码 import re pattern r w w s re compiled re compile pattern results re compiled search COPRO HORIZON 2000 HOR p
REGEXP_REPLACE - 仅当包含在 () 中时才从字符串中删除逗号

我在 oracle 论坛网站找到了一个例子输入字符串 a b c x y z a xx yy zz x WITH t AS SELECT a b c x y z a xx yy zz x col1 FROM dual SELECT t c
什么是仅匹配空字符串的正则表达式？

有很多关于正则表达式的帖子来匹配潜在地空字符串但我找不到任何提供正则表达式的字符串only匹配一个空字符串我知道将匹配任何行的开头并且将匹配任何行的结尾以及字符串的结尾像这样匹配的内容远不止空字符串如 n foobar n n
使用 posix shell 测试字符串中的正则表达式

如何测试字符串是否与特定字符串匹配正则表达式与基本无 bash 或任何其他 posix shell 脚本在 if 语句中您可以使用expr在 POSIX shell 中计算正则表达式的命令 s Abc expr s alpha 3 e
Python 非贪婪正则表达式

我如何制作一个像这样的Python正则表达式这样给定 a b c d e 蟒蛇匹配 b 代替 b c d 我知道我可以使用代替但我正在寻找一种更通用的解决方案使我的正则表达式更加干净有没有办法告诉python 嘿尽快匹配这个
Java 正则表达式 - 字母数字，最多一个连字符，句点或下划线，七个字符长

我是 Java 正则表达式工具的新手尽管它们潜力巨大但我很难完成这项任务我想编写一个正则表达式来验证遵循以下语法的输入字符串小写字母和数字的任意组合仅一个下划线一个破折号或一个句号无其他特殊字符最小长度为 5 我想出了以下解
将html数据解析成python列表进行操作

我正在尝试读取 html 网站并提取其数据例如我想查看公司过去 5 年的 EPS 每股收益基本上我可以读入它并且可以使用 BeautifulSoup 或 html2text 创建一个巨大的文本块然后我想搜索该文件我一直在使用
Golang 正则表达式在字符串之间替换

我有一些可能采用以下形式的字符串 MYSTRING MYSTRING n MYSTRING n MYSTRING randomstringwithvariablelength n 我希望能够将其正则表达式为MYSTRING foo 基本上替
扩展 RegExp 以获取文件扩展名

我知道已经有很多基于 RegExp 的解决方案但是我找不到适合我需求的解决方案我有以下函数来获取 URL 的各个部分但我还需要文件扩展名 var getPathParts function url var m url match w
从字体到跨度（大小和颜色）和背面的正则表达式（VB.NET）

我正在寻找一个正则表达式可以将我的字体标签仅具有大小和颜色属性转换为具有相关内联CSS的span标签如果有帮助的话这将在 VB NET 中完成我还需要一个正则表达式来实现相反的效果下面详细说明的是我正在寻找的转换示例 font
sed 错误“未终止的 's' 命令”故障排除

我正在构建一个script https stackoverflow com questions 4036832 replacing a specific term in an xml file其中它将用文件夹路径替换 XML 文件中的模式
如何用正则表达式替换多个匹配/组？

通常我们会编写以下内容来替换一场比赛 namesRegex re compile r is life re I replaced namesRegex sub r butter There is no life in the void pr
JavaScript 中的实时摩尔斯电码转换器

在看到谷歌关于莫尔斯电码 gmail 的愚人节笑话后我想我应该尝试用 javascript 创建一个实时莫尔斯电码转换器我正在使用正则表达式和替换将莫尔斯电码更改为字符例如 replace g a replace g r 我遇到的问题
正则表达式库基准

我最近一直想知道正则表达式实现的性能并且很难想出很多有用的信息它很容易对浏览器 javascript 正则表达式性能进行基准测试网上有很多工具 Chrome 和 Opera 中的 javascript 正则表达式实现几乎摧毁了所有其他
如何使正则表达式匹配不区分大小写？

我有以下正则表达式加拿大的邮政编码 http en wikipedia org wiki Postal codes in Canada ABCEGHJKLMNPRSTVXY 1 d 1 A Z 1 d 1 A Z 1 d 1 它工作正常但
Java：正则表达式排除空值

在问题中here https stackoverflow com questions 51359056 java regexp for a separated group of digits 我得到了正则表达式来匹配 1 到 99 之间的一
反向引用在 PHP 中不起作用

最近我一直在研究更多的是在实践中说实话正则表达式我注意到他的力量我提出的这个要求 link https stackoverflow com questions 30380397 take the text up to a speci

随机推荐

如何访问超级账本结构交易历史记录中的“eventEmissed”字段

我正在研究超级账本结构我想访问超级账本结构交易历史记录中的 eventEmissed 字段 transaction history transactionType com acn hps aops ims addingEvidence e
如何在R中绘制旋转轴？

我想将六因素性格测试的结果绘制为环形图有问题的测试是总体兴趣结构测试 AIST R Bergmann Eder 2005 一般兴趣结构测试根据 J L Holland 的理论衡量职业选择荷兰代码 http en wikipedia o
当我更新 MutableStateFlow> 时，未发生重新组合

我有一个MutableStateFlow
LG WEBOS：无法连接到设备，请检查设备连接

我已经一步一步地遵循了这里的一切 webOS TV 上的应用程序测试 http developer lge com webOSTV develop web app app test preparingAccount 但我似乎仍然无法使用 w
水平联合选择语句

假设我的 select 语句的结果如下我有 5 个 Id Animal AnimalId 1 Dog Dog1 1 Cat Cat57 Id Transport TransportId 2 Car Car100 2 Plane Plane
LongInt 与 Integer、LongWord 与 Cardinal 的区别

在Delphi中 LongInt和Integer LongWord和Cardinal之间有什么区别有时我会发现DWORD的用法它是什么它们在所有版本的 Delphi 中都是一致的吗我应该坚持哪一个简而言之 Longint 和 Lo
Hibernate 复合键和重叠字段 - 如何避免列重复

我面临着如何管理特定模型的映射的问题这是一个多租户应用程序我们选择在每个实体中包含 tenant id 因此我们不必每次需要获取实体时都进行联合事实上这是我的问题的根源模型如下 Book Author id pk id pk te
Microsoft Graph API .NET 无法读取共享邮件

第一篇文章就到这里我试图显示来自共享邮箱的电子邮件但遇到 ErrorAccessDenied 访问被拒绝检查凭据并重试用户确实拥有邮箱的权限我可以在 Outlook 和 O365 门户中访问阅读电子邮件在我的应用程序中我还
MVC 3 部分页面 (Razor) 和 MVC 3 带布局的视图页面 (Razor) 之间的区别？

在 MVC 3 Beta 中模板之间有区别吗MVC 3 部分页面 Razor and MVC 3 带布局的视图页面 Razor 我向我的应用程序添加了一个部分页面 partialList 现在当我仅返回部分视图时它会应用 ViewSt
如何在 HTTP POST 请求中处理 2D 数组

我有一个如下所示的 HTML 表单它使用 2D 数组来存储输入元素
如何将 Ant 中的相对路径转换为绝对路径？

我想将相对路径转换为绝对路径这是怎么做到的上的位置属性财产任务 http ant apache org manual Tasks property html会将相对路径转换为绝对路径
为 WooCommerce CSV 导出插件添加自定义字段 - 对于客户首次订单 [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我在用着Woocommerce CSV 导出插入我希望有一种方法来检查客户是否是新客户如果是则按顺序编写元数据custom me
何时使用 @RequestParam 和 @PathVariable

只是想知道我们应该选择哪种场景 RequestParam and PathVariable 我知道 RequestParam接受参数值而 PathVariable取占位符值 RequestParam发出请求时可以是可选的 required
如何以 bean 形式访问 Spring Batch 中的 jobParameters？

我创建了 jobParameter bean 定义如下所示
从数据框中提取特定列

我有一个包含 6 列的 R 数据框我想创建一个仅包含三列的新数据框假设我的数据框是df 我想提取列A B and E 这是我能弄清楚的唯一命令 data frame df A df B df E 有没有更紧凑的方法来做到这一点 Answ
Symfony 4 缓存：没有这样的文件或目录

我尝试使用 symfony 4 创建一个新项目项目文件夹是通过默认的 symfony 4 skelleton 项目创建的composer create project symfony website skeleton test 这是命令的
填充选择元素

我想填充一个
Angular2中如何向服务器提交表单？

现在即使在中使用 action 提交也已被 angular2 捕获演示链接 http plnkr co edit 4wpTwN0iCPeublhNumT5 p preview http plnkr co edit 4wpTwN0iCP
如何在 VB 脚本中为安全字符串分配密码

我有一个由生成 powershell 脚本的批处理文件组成的脚本我自己通过 VB 脚本完成了同样的任务到目前为止我已经将所需的大部分信息分配给了字符串但我希望提示输入密码该密码存储为安全字符串并且可以输出到文本文件以供以后在进一
将 NFA 转换为正则表达式

我在这个网站上发现了同样的问题答案是描述如何将 NFA 转换为正则表达式的 PDF http courses engr illinois edu cs373 sp2009 lectures lect 08 pdf 但这是行不通的因为该方

将 NFA 转换为正则表达式

将 NFA 转换为正则表达式 的相关文章

随机推荐

热门标签

将 NFA 转换为正则表达式的相关文章