如何从给定的 hunspell 词典中获取所有可能的单词？

2023-11-27

我想解析支持 hunspell 格式的开放办公室aff and dic files.

English aff and dic文件可以从这里下载，例如：http://extensions.openoffice.org/en/project/english-dictionaries-apache-openoffice

我想扫描给定的每一行.dic文件并使用提供的生成每行的每个可能的单词.aff file

我怎样才能做到这一点？

我已经安装了 NHunspell 框架，但它没有该功能：https://www.nuget.org/packages/NHunspell/

例如，对于英语，让我们考虑

make/UAGS

使可以make, made, makes, making etc

现在我需要解析器来给我所有这些组合。我怎样才能获得它们？非常喜欢

所以基本上我想扫描字典的每一行并从该行的单词生成所有可能的单词，但我不知道该怎么做

我也可以编写自己的解析器，但在我看来规则相当复杂，并且没有关于此的详细且简单的文档

这基本上是我想要的。图片解释得很清楚

Giving analyze/ADSG, en.dic and en.aff文件并获取以下所有单词

analyze, analyzes, analyzing, analyzed, reanalyze, reanalyzes, reanalyzing, reanalyzed

如果您想要整个数据库，您可以执行unmunch:

unmunch dictionary.dic dictionary.aff

请注意，hunspell 中 unmunch 的当前实现对最大单词数、affs 和生成单词的长度有限制。因此，如果目标语言超出了 unmunch 的限制，unmunch 可能会失败。

如果您只想要可以从条目生成的可能单词的列表，您可以使用wordforms:

wordforms dictionary.aff dictionary.dic word

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

c

spellchecking

hunspell

nhunspell

如何从给定的 hunspell 词典中获取所有可能的单词？的相关文章

VSTS 构建失败/发布无法在 bin 文件夹中找到 roslyn\csc.exe

我们有一个网站项目安装了以下 nuget 软件包 Microsoft CodeDom Providers DotNetCompilerPlatform 1 0 8 Microsoft Net Compilers 2 4 0 The web
MVC Core IActionResult 含义

什么是IActionResult 我尝试查看 MSDN 和其他网站但需要通用常见易于理解的答案 MSDN IActionResult https learn microsoft com en us dotnet api microso
为什么在 C# 中成员初始值设定项中不允许这样做，但在 VB.Net Me 中允许

我正在将 VB Net 应用程序转换为 C 并注意到在 VB Net 代码中有一个私有成员变量它是使用Me像这样 Private m ClassA As New MyCollection Of ClassA Me 当我将其转换为 C 代
用 C# 启动 Windows 服务

我想启动一个刚刚安装的Windows服务 ServiceBase ServicesToRun if bool Parse System Configuration ConfigurationManager AppSettings RunSe
中间件 API 的最佳实践是什么？ [关闭]

Closed 此问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我们正在开发一个中间件 SDK 采用 C 和 Java 语言供游戏开发人员动画软件开发人员阿凡达开
C++ 模板中的名称查找

我有一些 C 代码如果没有 fpermissive 选项就无法再编译这是我无法分享的专有代码但我认为我已经能够提取一个简单的测试用例来演示该问题这是 g 的输出 template eg cpp In instantiation o
基于 MS Bot Framework 中的响应分支对话框/表单

我们正在尝试使用 MS Bot Framework 但尚未完全弄清楚如何实现此场景我们有一个 LUIS 对话框类型它工作正常并且经过适当的培训以常见的三明治为例 LUIS 意图寻找的基本内容是用户询问订单状态如果问题中提供了订单号
将列表（对象）转换为列表（字符串）

有没有办法转换List of Object to a List of String 在 c 或 vb net 中而不迭代所有项目幕后迭代很好我只想要简洁的代码 Update 最好的方法可能就是进行新的选择 myList Select f
Entity Framework 4.1 RC：Code First EntityTypeConfiguration 继承问题

我尝试使用通用的 EntityTypeConfiguration 类来配置所有实体的主键以便每个派生的配置类不会重复自身我的所有实体都实现一个公共接口 IEntity 它表示每个实体必须有一个 int 类型的 Id 属性我的配置基类如
如何在 C++ 中对静态缓冲区执行字符串格式化？

我正在处理一段对性能要求非常高的代码我需要执行一些格式化的字符串操作但我试图避免内存分配甚至是内部库的内存分配在过去我会做类似以下的事情假设是 C 11 constexpr int BUFFER SIZE 200 char bu
Create CFrameWnd 给出了第一次机会异常——为什么？

我正在尝试使用基于 CFrameWnd 的代码编写一个简单的 MFC 应用程序该应用程序在可滚动窗口中绘制下面的代码改编自 Prosise Programming Windows with MFC 第 2 版第 89ff 页当我在调
Active Directory UserPrincipal.Current.GetGroups() 返回本地组而不是 Web 服务器上的组

以下内容在我的本地开发盒上效果很好但是当我将其移动到网络服务器时它失败了甚至不会记录错误 public static List
为什么 std::ranges::filter_view 对象必须是非常量才能查询其元素？

include
如何解释“错误C2018：未知字符'0x40'？[关闭]

Closed 这个问题需要调试细节 help minimal reproducible example 目前不接受答案在编译一些代码时我收到以下信息错误 C2018 未知字符 0x40 我想知道如何解决这样的问题这是我要开始的地方
需要使用 openssl 加密和解密文件的示例 C 代码

我正在用 Linux C 编写代码我需要使用以下命令来加密和解密文件 openssl 目前我使用系统命令 des3 e nosalt k 0123456789012345 in inp file out out file 进行加密使用
如何使用简历实现一个“一网打尽”的异常处理程序？

我想知道我怎样才能写一个抓住他们全部应用程序级别的异常处理程序将为用户提供恢复应用程序流程的选项如果您正在运行 Windows 窗体应用程序将处理程序添加到Application ThreadException event
在类中使用 std::chrono::high_resolution_clock 播种 std::mt19937 的正确方法是什么？

首先大家好这是我在这里提出的第一个问题所以我希望我没有搞砸在写这篇文章之前我用谷歌搜索了很多我对编码 C 很陌生我正在自学考虑到有人告诉我只为任何随机引擎播种一次是一个很好的做法我在这里可能是错的什么是正确最佳更有效
具有多种类型的 C# 泛型类型推断

我有以下通用方法用于将一种类型的输入对象序列化为超类型如下所示 public string SerialiseAs
如何向 ItemsControl 中的 WPF 按钮添加相同的命令

如何将命令添加到 wpf 按钮该按钮是ItemsControl并正在修改ItemsSource itself 这是我的 XAML
什么时候使用静态库需要头文件？

如果我在 Linux 中用 C 创建一个静态库并生成 a 文件我或其他人如何使用该库例如我的库定义了一个类我认为仅仅提供 a 文件是不够的还需要提供头文件我如何知道 a 文件必须提供哪些头文件例如我是否需要提供我的库代码

随机推荐

如何保持 Intent 服务运行

我有两个 Intentservice 的例子一种是commonsware 书中的Download 示例另一个是在http www vogella com articles AndroidServices article html ser
Android 中的反向音频文件

我正处于开发这个应用程序的早期阶段但研究它我已经遇到了一个问题我需要能够向后播放音频文件你知道喜欢揭示隐藏的消息我没有在 Android 上处理音频的经验也不知道这是否可能我在这里发现了一个问题它解决了java中的问题点击这
所有任务的单个工作线程还是多个特定工作线程？

我正在使用 PyQt5 创建一个简单的 GUI 应用程序其中我从 API 请求一些数据然后使用这些数据填充 UI 的各种控件我在 PyQt 中关注的有关工作线程的示例似乎都是子类QThread然后在重写中执行他们的业务逻辑run 方法
将数据帧写入 csv 文件时解决错误“分隔符必须是 1 个字符的字符串”

使用这个问题 Pandas 将数据帧写入 CSV 文件作为模型我编写了以下代码来制作 csv 文件 df to csv Users Lab Desktop filteredwithheading txt sep s header True
C++ 中的 Realloc 等效项

是的另一个realloc vs std vector问题我知道你要说什么我同意忘记手动内存分配只需使用std vector 不幸的是我的教授禁止我在这项作业中使用 STL 中的任何内容所以是的我有一个动态数组T我需要调整它的
如何使用 Nokogiri 和 Ruby 解析 JavaScript

我需要从网站中解析一个数组我想要解析的 JavaScript 部分如下所示 arPic 0 http example org image1 jpg arPic 1 http example org image2 jpg arPic 2 h
Wix / MSI：无法卸载

我为一个内部项目开发了一个 Wix 安装程序但是完全偶然我发现我无法在我的开发计算机上卸载该安装程序因为我收到以下错误消息您尝试使用的功能所在的网络资源不可用有一个对话框指向我从功能安装的 msi 的路径 msi 在那里但是它已
类定义内的自引用

如何在类定义中引用类对象你能告诉我你会怎么做吗或者更具体地说如何在类方法的装饰器中传递类对象这是一个简单的例子我试图将我声明的第二个方法传递给第一个方法的装饰器 def decorate w def wrap f def call
preg_replace：错误的正则表达式==“未知修饰符”？

我正在编造虚假的电子邮件地址我只是想确保它们采用有效的电子邮件格式因此我尝试删除不在以下集合中的任何字符 jusr email preg replace a zA Z0 9 g jusr email 我在 Windows 机器上没有遇到
Laravel 5 + AngularJS 跨域 CORS

我到处寻找答案但到目前为止没有任何效果堆栈上列出的所有解决方案尚未被证明是足够的我的 laravel 日志中没有任何错误形式的信息我只得到标准 XMLHttpRequest cannot load http api domain d
弹性项目是否应该溢出弹性容器而不是换行？

我有这样的布局 A row 柔性容器 with a 确定尺寸 e g width 175px A flex item 与一个在definite flex basis e g flex basis content 这是不灵活的例如flex
为 Scikit-image 构建自定义 AWS Lambda 层

Outline 我需要使用scikit image在一些 AWS lambda 函数内部所以我希望构建一个自定义 AWS lambda 层其中包含scikit image 我的问题一般应该适用于任何 python 模块尤其是 scik
.NET 反射的“成本”是多少？ [复制]

这个问题在这里已经有答案了可能的重复 NET 反射的成本有多高我目前的编程心态是反思是我最好的朋友我经常使用它来动态加载内容允许松散实现而不是严格的接口以及许多自定义属性使用反射的实际成本是多少对于频繁反射的类型是否值
如何检测webgl中的碰撞？

如何在不使用诸如 Three js 之类的库的情况下检测 webgl 中的碰撞如何在webgl中检测碰撞你不知道 WebGL 与 OpenGL 一样仅用于绘图它不管理场景它没有对象或碰撞等高级事物的概念这都是关于点线三角
如何为所有浏览器使用 jQuery 绑定到 localStorage 更改事件？

如何使用 jQuery 将函数绑定到 HTML5 localStorage 更改事件 function window bind storage function e alert storage changed localStorage se
如何清除日期选择器

我有一个日期选择器用于选择生日这将用于一些过滤过滤后我希望该值为重置即 DatePicker 应该变为空白有什么帮助吗如果您想清除TextField of the DatePicker 您可以使用 datepicker getE
找不到 ffprobe？

我正在尝试在我的节点项目中生成视频缩略图 thumbsupply 和 video thumbnail npm 都返回相同的错误称为not found ffprobe const thumbsupply require thumbsuppl
iOS 可以使用 TTS 吗

有谁知道在iOS开发中是否可以像Android一样实现TTS 是在图书馆还是什么地方我相信我听说过一些有关 iOS 中的实用程序和 TTS 的信息但我很难找到有关此问题的任何文档任何帮助将不胜感激 flite TTS 已转为 iOS
在 Javascript 中添加延迟

我需要在我的 Javascript 代码中添加大约 100 毫秒的延迟但我不想使用setTimeout的功能window对象我不想使用繁忙的循环有没有人有什么建议很遗憾 setTimeout 是唯一的reliable方式不是唯一的
如何从给定的 hunspell 词典中获取所有可能的单词？

我想解析支持 hunspell 格式的开放办公室aff and dic files English aff and dic文件可以从这里下载例如 http extensions openoffice org en project engl

如何从给定的 hunspell 词典中获取所有可能的单词？

如何从给定的 hunspell 词典中获取所有可能的单词？ 的相关文章

随机推荐

热门标签

如何从给定的 hunspell 词典中获取所有可能的单词？的相关文章