如何进行 FST（有限状态换能器）组合

2024-01-11

考虑以下 FST：

T1 

0 1 a : b
0 2 b : b
2 3 b : b
0 0 a : a
1 3 b : a

T2

0 1 b : a
1 2 b : a
1 1 a : d
1 2 a : c

如何对这两个 FST（即 T1 o T2）执行组合操作我看到了一些算法，但不太理解。如果有人能以简单的方式解释它，那将是一个很大的帮助。

请注意，这不是作业。该示例取自讲座幻灯片，其中给出了解决方案，但我不知道如何实现它。

由于您没有指定输入格式，我假设 0 是初始状态，第二列中出现但不是第一列中出现的任何整数都是接受状态（T1 为 3，T2 为 2），并且每行都是转换关系的元素，给出前一个状态、下一个状态、输入字母和输出字母。

对FST的任何操作都需要产生一个新的FST，因此我们需要状态、输入字母表、输出字母表、初始状态、最终状态和转移关系（下面按顺序给出FST A、B和W的规范））。假设我们的 FST 是：


A = (Q, Σ, Γ, Q₀, Q_F, α)
B = (P, Γ, Δ, P₀, P_F, β)

我们想找到


W = (R, Σ, Δ, R₀, R_F, ω) = A ∘ B

请注意，我们不需要确定 W 的字母表；组合的定义就是这样做的。

想象一下串联运行 A 和 B，A 的输出磁带作为 B 的输入磁带。组合 FST 的状态只是 A 和 B 的组合状态。换句话说，组合状态是各个 FST 状态的叉积。


R = Q × P

在您的示例中，W 的状态将是整数对：


R = {(0,0), (0,1), ... (3, 2)}

尽管我们可以重新编号并得到（例如）：


R = {00, 01, 02, 10, 11, 12, 20, 21, 22, 30, 31, 32}

类似地，组合 FST 的初始状态和接受状态是组成 FST 中状态的叉积。特别是，R 接受一个字符串iff http://en.wikipedia.org/wiki/If_and_only_ifA 和 B 都接受该字符串。


R₀ = Q₀ × P₀
R_F = Q_F × P_F

In the example, R₀ = {00} and R_F = {32}.

All that remains is to determine the transition relationship ω. For this, combine each transition rule for A with every transition rule for B that might apply. That is, combine each transition rule of A (q_i, σ) → (q_j, γ) with every rule of B that has a "γ" as the input character.


ω = { ((q_i,p_h), σ) → ((q_j, p_k), δ) : (q_i, σ) → (q_j, γ) ∈ α, 
                                     (p_h, γ) → (p_k, δ) ∈ β}

在示例中，这意味着组合（例如）0 1 a : bT1 的0 1 b : a and 1 2 b : aT2 得到：



00 11 a : a
01 12 a : a

同样，你可以结合0 2 b : bT1 与那些相同0 1 b : a and 1 2 b : a of T2, 0 0 a : aT1 的1 1 a : d and 1 2 a : cT2 等。

请注意，您可能具有无法到达的状态（那些永远不会显示为“下一个”状态的状态）和永远不会发生的转换（来自无法到达的状态的状态）。作为优化步骤，您可以删除这些状态和转换。不过，保留它们不会影响构造的正确性；这只是一个优化。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

如何进行 FST（有限状态换能器）组合的相关文章

可以使用正则表达式来匹配嵌套模式吗？ [复制]

这个问题在这里已经有答案了是否可以编写一个正则表达式来匹配出现次数未知的嵌套模式例如当外大括号内嵌套未知数量的左大括号时正则表达式是否可以匹配左大括号和右大括号例如 public MyMethod if test More Mor
AttributeError：使用 CRF 时“Tensor”对象没有属性“_keras_history”

我知道关于这个问题有很多问题我已经阅读了其中的一些问题但没有一个对我有用 I am trying to build a model with the following architecture 代码如下 token inputs In
在哪里可以找到英语短语列表？ [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我的任务是搜索文本中陈词滥调和常见短语的用法这些短语与您在财富之轮的短语谜题中可能看到的短语类似这
Haskell 中的有限自动机

在 Haskell 中表示有限自动机的好方法是什么它的数据类型是什么样的在我们学院自动机被定义为 5 元组 Q X delta q 0 F 其中 Q 是自动机状态的集合 X 是字母表这部分是否必要 delta 是从 Q X 获取 2
如何使用 python 中的 spacy 库将句子转换为问题 [请参阅下面的我的代码进行更正]

我需要使用 python 中的 spacy 将任何句子转换为问题我下面的代码太长了我需要做更多的工作才能将任何句子完成为问题格式现在在这段代码中我根据以下条件制定条件是形式需要形式有形式做形式通过检查过去时和现在时输入尼娜拉
如何为“转换”状态机定义触发器的枚举？

作为不相关的后续这个答案 https stackoverflow com a 68269299 913098 它使用以下工作代码 from transitions import Machine from transitions import
在非单一维度 1 处，张量 a (2) 的大小必须与张量 b (39) 的大小匹配

这是我第一次从事文本分类工作我正在使用 CamemBert 进行二进制文本分类使用 fast bert 库该库主要受到 fastai 的启发当我运行下面的代码时 from fast bert data cls import Bert
SpaCy 的相似度是如何计算的？

初学者 NLP 问题在这里 similarity 方法如何运作哇 spaCy 太棒了它的tfidf模型可以更容易预处理但w2v只有一行代码 token vector 惊人的 In his spaCy 上的 10 行教程 https g
如何计算两个文本文档之间的相似度？

我正在考虑使用任何编程语言尽管我更喜欢 Python 来从事 NLP 项目我想获取两个文档并确定它们的相似程度常见的方法是将文档转换为 TF IDF 向量然后计算它们之间的余弦相似度任何有关信息检索 IR 的教科书都涵盖了这一点
Spacy 中的自定义句子分割

I want spaCy使用我提供的句子分割边界而不是它自己的处理例如 get sentences Bob meets Alice SentBoundary They play together gt Bob meets Alice Th
访谈：函数指针与 switch case

在面试期间我被要求为具有 100 个状态的系统实现一个状态机其中每个状态又具有 100 个事件我回答了以下 3 种方法 if else 开关盒函数指针 if else 显然不适合这样的状态机因此主要比较是 switch case
如何训练斯坦福 NLP 情感分析工具

地狱大家我正在使用斯坦福核心 NLP 包我的目标是对推文直播进行情感分析按原样使用情感分析工具对文本态度的分析非常差许多积极因素被标记为中性许多消极因素被评为积极我已经在文本文件中获取了超过一百万条推文但我不知道如何实际获
用于估计（一元）困惑度的 NLTK 包

我正在尝试计算我所拥有的数据的困惑度我正在使用的代码是 import sys sys path append usr local anaconda lib python2 7 site packages nltk from nltk co
SpaCy 模型“en_core_web_sm”的词汇量大小

我尝试在 SpaCy 小模型中查看词汇量 model name en core web sm nlpp spacy load model name len list nlpp vocab strings 只给了我 1185 个单词我也在同
gensim如何计算doc2vec段落向量

我正在看这篇论文http cs stanford edu quocle paragraph vector pdf http cs stanford edu quocle paragraph vector pdf 它指出段落向量和词向量被平
如何检测文本是否可读？

我想知道是否有一种方法可以告诉给定的文本是人类可读的我所说的人类可读的意思是它有一些含义格式就像某人写的文章或者至少是由软件翻译器生成的供人类阅读的文章这是背景故事最近我正在制作一个应用程序允许用户将短文本上传到数据库在部署
AttributeError：类型对象“Word2Vec”没有属性“load_word2vec_format”

我正在尝试实现 word2vec 模型并收到属性错误 AttributeError 类型对象 Word2Vec 没有属性 load word2vec format 下面是代码 wv Word2Vec load word2vec format
如何将参数传递给 `transitions` 库中的 on_enter 回调？

我想用过渡 https pypi org project transitions 并且需要一个我在文档中找不到的相当琐碎的功能并且想知道它是否已实现我想定义一个on enter在某些状态上回调但将参数传递给该回调至少知道我是从哪个状
如何提取句子中的主语及其各自的从属短语？

我正在尝试在句子中进行主题提取以便我能够根据主题获得情感我在用nltk在 python2 7 中用于此目的以下面的句子为例 Donald Trump is the worst president of USA but Hillary
使用基于 DFA（线性时间）正则表达式捕获组：可能吗？

是否可以使用基于 DFA 的正则表达式实现捕获组同时保持相对于输入长度的线性时间复杂度直觉上我认为不是因为子集构造过程不知道它可能落在哪个捕获组内但这是我第一次意识到这可能是一个潜在的问题所以我不知道是否可以使用基于 DFA 的

随机推荐

正则表达式非贪婪（惰性）

我正在尝试非贪婪地解析 TD 标签我从这样的事情开始 td stuff td align right More stuff td align left 返回的记录如下 stuff td align right More stuff td
将 À 等特殊字符与常规 A 进行比较

在某些语言中有类似的字母我看到对于表视图部分本机 iOS 将在同一部分下A 我想做同样的事情我通过比较第一个字母来构建我的部分所以我需要那个将等于 A 我尝试使用localizedCompare但我仍然不知道这两者是相等的有
使用 CustomAttributes 与 GetCustomAttributes() 的优点

今天我注意到我的智能感知中出现了一些新属性System Type我的 NET 4 5 项目的对象其中有一个叫做CustomAttributes 我对此很感兴趣因为我之前就明白GetCustomAttributes是最昂贵的反射调用之一
C 编程自动八进制解释

Code 1 int a 0987654321 printf d a Code 2 int a scanf d a printf d a 在这里如果我们输入 0987654321 那么它会打印相同的内容但在第一个代码片段中它会给出一个
基本PHP MySQL数组分组问题

快速问题我认为对于像我一样拥有最基本的 PHP MySQL 知识的人来说这是一个非常简单的解决方案我有一个存储在数据库中的各个州的城市列表其中包含城市州和一些其他变量现在它们被提取为按城市名称排序的列表阿拉斯加安克雷奇马里
DataGridView显示行标题单元格

我正在尝试显示链接到 DataTable 的简单 DataGridView 并且最终我希望 DataTable 中的第一列成为 DataGridView 的行标题单元格此时我将满足于在行标题单元格中包含任何值我可以显示带有所有行和列以
标识符未定义

我使用 VS2012 Express 用 C 编写了以下代码 void ac search uint num patterns uint pattern length const char patterns uint num records
卷曲远程图像并调整其大小

我使用此脚本来下载远程图像并调整其大小在调整大小部分出现问题它是什么
Android 使用自签名证书连接到服务器

编辑下面的代码工作正常没有错误没有异常我知道关于这个主题的大量问题以及谷歌想到的许多博客我已通读它们并设法想出我将要解释的内容我的疑问在于我的方法正确吗它有副作用吗以及在我解释我的方法时最好提出的另一个问题我基于此方法
NIO getParentFile().mkdir() [重复]

这个问题在这里已经有答案了有没有一种方法可以一次性创建文件和目录如下所示使用 Java 7 和 NIO 路径和文件静态方法在哪里您不必键入路径然后将文件分成单独的行代码 File file new File Library te
当调用clock_gettime()时返回的tv_nsec字段实际上可能超过一秒吗？

当你调用clock gettime 它返回一个 timespec 结构 struct timespec time t tv sec seconds long tv nsec nanoseconds 我在手册页中没有找到 tv nsec 不会
从连续的字序列中提取任意范围的位的最有效方法是什么？

假设我们有一个std vector 或任何其他序列容器有时它是一个双端队列它存储uint64 t元素现在让我们将该向量视为一个序列size 64连续的位我需要找到由给定的位组成的单词 begin end 范围鉴于end begi
UItableVIew 中的效果或动画

当我单击 tableView 时它会显示类似这样的内容以显示详细信息我怎样才能做到这一点我认为你需要的是一个类似于手风琴的实现以下是一些示例参考您可以从这里开始如何为 iPhone SDK 应用程序实现手风琴视图 https s
一个由两个弹性项目组成的弹性盒网格，其中一个弹性项目旁边有一个[重复]

这个问题在这里已经有答案了我想在左侧放置一个 div 在右侧放置两个 div 这bottomright应始终低于topRight分区这topRight是唯一一个高度可变的 div 我目前正在尝试使用flexbox你可以在我下面的代码中看到
OpenCV 上的 Libpng 冲突？

我正在尝试使用以下代码在 XCode 4 4 Mountain Lion 上打开 png 文件适用于 jpg 文件 Mat image imread Users user name Desktop result png imshow im
Kafka Connect 不支持主题策略

Context 我编写了几个小代码卡夫卡连接 https docs confluent io current connect index html连接器一个每秒生成随机数据另一个将其记录在控制台中它们集成了一个模式注册表 https
单击后退按钮两次以使用 rxjava 退出活动

寻找一种微妙的接收方法来退出活动同时按两次后退按钮 boolean doubleBackToExitPressedOnce false Override public void onBackPressed if doubleBackToE
content.select() 不适用于 元素
我正在尝试制作一个按钮来选择 a 的内容 code 元素但是它不起作用我得到了 content select 不是一个函数 div div code


                
            
                
                    基于输入的变量                
            
                                   
                    Python版本 3 5 所以我想知道如何根据用户的输入设置变量 例如 如果用户要回答7对此 居民 输入 你家有多少人住 编辑 如果他们输入7 我怎样才能询问每个人的名字 Thanks def get int prompt while Tr                
                        
                
            
                
                    如何进行 FST（有限状态换能器）组合                
            
                                   
                    考虑以下 FST T1 0 1 a b 0 2 b b 2 3 b b 0 0 a a 1 3 b a T2 0 1 b a 1 2 b a 1 1 a d 1 2 a c 如何对这两个 FST 即 T1 o T2 执行组合操作 我看到了一

如何进行 FST（有限状态换能器）组合

如何进行 FST（有限状态换能器）组合 的相关文章

随机推荐

热门标签

如何进行 FST（有限状态换能器）组合的相关文章