一个 StringToken 解析器,它提供 Google 搜索样式“您的意思是:”建议

2023-12-02

寻求一种方法:

在字符串中采用空格分隔的标记;返回建议的单词


ie:
谷歌搜索可以采取《拼音词翻译》,
并在结果页面顶部显示“您是说:拼音词翻译器”

首选使用任何 C* 语言或 Java 的解决方案。


是否有任何现有的开放库可以执行此类功能?

或者有没有办法利用 Google API 来请求建议的单词?


在他的文章中如何编写拼写纠正器,Peter Norvig 讨论了如何实现类似 Google 的拼写检查器。本文包含一个 20 行的 Python 实现,以及几个用 C、C++、C# 和 Java 重新实现的链接。以下是摘录:

的完整详细信息 工业级拼写纠正器 像谷歌的会更混乱 比启发,但我认为 在回家的飞机上,不到 一页代码,我可以写一个玩具 拼写纠正器达到 80 或 处理速度为 90% 的准确度 每秒至少 10 个字。

使用 Norvig 的代码和本文作为训练集,我得到以下结果:

>>> import spellch
>>> [spellch.correct(w) for w in 'fonetic wrd nterpreterr'.split()]
['phonetic', 'word', 'interpreters']
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

一个 StringToken 解析器,它提供 Google 搜索样式“您的意思是:”建议 的相关文章

  • 获取单个方程的脚本

    在文本文件中输入 a 2 8 b 3 9 c 4 8 d 5 9 e a b f c d g 0 6 h 1 7 i e g j f h output i j 期望的输出 输出 2 8 3 9 0 6 4 8 5 9 1 7 如果输入文件名
  • 如何使用 string#split 用分隔符 + - * / ( ) 和空格分割字符串并将它们保留为额外标记?

    我需要拆分包含基本数学表达式的字符串 例如 a b c or a c d 分隔符是 和空格 我需要它们作为独立的标记 基本上结果应该是这样的 a b c 对于第二个例子 a 我读了很多关于具有不太复杂的分隔符的类似问题的问题 常见的答案是使
  • Win32:是否可以构建一个容纳其他应用程序的应用程序?

    我想知道 您将如何编写一个基本上包含其他应用程序的应用程序 我问这个问题的原因是我想构建一个应用程序来 征服 我目前打开的窗口数量激增的情况 我以前使用过虚拟窗口管理器 它们非常好 但是我可以使用我提到的应用程序做很多事情 或者 有人知道有
  • 学习树顶

    我正在尝试自学 Ruby 的 Treetop 语法生成器 我发现 对于 最好的 文档来说 不仅文档非常稀疏 而且它的工作方式似乎并不像我希望的那样直观 从高层次上来说 我真的很喜欢比现场文档或视频更好的教程 如果有的话 在较低的层面上 这是
  • 线性模式匹配算法?

    我有一个由 0 和 1 组成的线性列表 我需要匹配多个简单模式并找到第一个出现的情况 例如 我可能需要找到0001101101 01010100100 OR 10100100010长度为 800 万的列表内 我只需要找到第一次出现的情况 然
  • 使用 DataContractJsonSerializer WP7 将数组解析为 Json 字符串

    如何使用 DataContractJsonSerializer 解析 Json 字符串中的数组元素 语法是 array elementsProperies SomeLiteral 您不一定使用 DataContractJsonSeriali
  • 什么是 NOR 逻辑运算符?

    Is nor a 或 b a 或 b a 和 b 还有什么吗 a 或 b see http en wikipedia org wiki Logical NOR http en wikipedia org wiki Logical NOR了解
  • 为什么 NASM 在使用有效的指令助记符作为操作数中的符号名称方面没有问题?

    我编写了以下简单程序 但 nasm 拒绝编译它 section text global start start mov rax 0x01 mov rdi 0x01 mov rsi str mov rdx 0x03 syscall mov r
  • 如何检查 AJAX 请求的真实性

    我正在设计一个网站 让用户尽快解决谜题 JavaScript 用于为每个谜题计时 当谜题完成时 毫秒数通过 AJAX 发送到服务器 如何保证服务器收到的时间不是用户伪造的 我不认为基于会话的真实性令牌 Rails 中用于表单的那种 就足够了
  • 如何从Python中的阿拉伯字符串中删除英文文本?

    我有一个带有英文文本和标点符号的阿拉伯字符串 我需要过滤阿拉伯文本 我尝试使用 sting 删除标点符号和英语单词 但是 我失去了阿拉伯语单词之间的空格 我哪里错了 import string exclude set string punc
  • 在 C 中解析字符串的最简单方法是什么?

    我必须在 C 中解析这个字符串 XFR 3 NS 207 46 106 118 1863 0 207 46 104 20 1863 r n 并且能够得到207 46 106 118部分和1863部分 第一个 IP 地址 我知道我可以一个字符
  • 使用 Huggingface 变压器仅保存最佳权重

    目前 我正在使用 Huggingface transformers 构建一个新的基于 Transformer 的模型 其中注意力层与原始模型不同 我用了run glue py检查我的模型在 GLUE 基准测试上的性能 但是 我发现huggi
  • 从 HTML 文件中获取 jpg 图像

    我正在尝试使用 grep 获取 HTML 文件中 jpg 图像的完整 url 地址 一个问题是其中没有很多换行符 所以当我使用 grep 时 它会获取路径 但也会获取很多我不感兴趣的其他内容 我怎样才能获取 jpg 图像的 url 一张单人
  • 一个对大文件有效的轻量级 XML 解析器?

    我需要解析潜在的巨大 XML 文件 所以我猜这排除了 DOM 解析器 是否有任何优秀的 C 轻量级 SAX 解析器 在占用空间上可与 TinyXML 相媲美 XML的结构非常简单 不需要诸如命名空间和DTD之类的高级东西 只是元素 属性和
  • 解析 XML 并检索信息 多层节点 Deep Java/Android

    我正在使用我的教授提供的示例 该示例从天气预报站点获取数据并解析 XML 文件以在列表中显示天气状况 我的程序类似 但我想检索嵌套在多个节点中的信息 但我不知道如何获取它 这是我正在处理的 XML 文件
  • 如何使用WordNet或与wordnet相关的类别来实现基于类别的文本标记?

    如何使用wordnet按单词类别标记文本 java作为接口 Example 考虑以下句子 1 计算机需要键盘 显示器 CPU才能工作 2 汽车使用齿轮和离合器 现在我的目标是 例句必须标记为 第 1 句话 电脑 电子键盘 电子中央处理器 电
  • Scala 组合器解析器 - 区分数字字符串和变量字符串

    我正在做 Cay Horstmann 的组合器解析器练习 我想知道区分代表数字的字符串和代表匹配语句中变量的字符串的最佳方法 def factor Parser ExprTree wholeNumber expr ident case a
  • 为什么这个函数不是纯粹的?

    在维基百科文章中https en wikipedia org wiki Pure function Impure functions https en wikipedia org wiki Pure function Impure func
  • ANTLR4 在导入时找不到语法

    我正在尝试将 ANTLR4 语法拆分为多个文件 以便我可以更轻松地测试它们 我在 java 项目中使用 gradle 作为构建工具 两种语法都单独正确编译 但是当我将导入添加到我的主语法中时 我收到下一个编译错误 错误 110 kaneko
  • 如何在 Java 中解析这样的 URI

    我正在尝试解析以下 URI http translate google com zh CN en 你 http translate google com zh CN 7Cen 7C E4 BD A0 但收到此错误消息 java net UR

随机推荐

  • Hadoop 和 Python:禁用排序

    我意识到 当使用 Python 代码运行 Hadoop 时 映射器或减速器 不确定是哪一个 在打印输出之前对我的输出进行排序减速器 py 目前它似乎是按字母数字排序的 我想知道是否有办法完全禁用此功能 我希望程序的输出基于其打印顺序映射器
  • JQuery - 如何向某些 html 添加单个 html 标签?

    我只想插入一个在下面的文本之前 就在 LINK 之前 li a href LINK a li 所以 上面就变成了 li a href span LINK span a li 这是我的 JQuery 代码 mainnav li a prepe
  • 循环绘制和保存 PDF

    我有一个半熔化的数据框 如下所示 head final melt Group Source variable value Control Whole Kidney MZF1 0 23879 Control Whole Kidney MZF1
  • QML - 如何拥有不被剪切的弹出窗口

    我需要有一个在主窗口边界之外保持可见的弹出窗口 我在 Qt 文档中找不到任何内容 这是代码 import QtQuick 2 15 import QtQuick Window 2 2 import QtQuick Controls 2 12
  • 通用冒泡排序扩展

    public static T BubbleSort
  • 对project.pbxproj 文件中已删除框架的引用

    我最近从我的 iOS 项目中删除了一个框架 并通过依赖项管理器 CocoaPods 安装它 然而 我注意到 在检查对源代码管理的更改时 删除了对框架的一些引用 但添加了一个绝对路径 从差异中 第一行被删除 第二行添加到我的项目文件中 767
  • 如何重置 Redux 存储的状态?

    我正在使用 Redux 进行状态管理 如何将商店重置为初始状态 例如 假设我有两个用户帐户 u1 and u2 想象一下以下事件顺序 User u1登录应用程序并执行某些操作 因此我们在商店中缓存一些数据 User u1注销 User u2
  • 基于 JWT 的身份验证、验证和授权方案的 Spring Security 过滤器,举例

    Java Spring 和 Spring Security 有兴趣使用不记名令牌为我的 Web 服务实现基于 JWT 的身份验证机制 我的理解使用 Spring Security 进行身份验证和授权的正确方法是通过使用提供的 或自定义的 过
  • 设置 open_basedir 时无法使用 cURL 跟踪位置 (URL) - API 回调失败

    向 API 发布值的现有方法根据 API 文档 必须将表单发布到 API URL 方法 POST 和操作 API URL 其中包含一些输入字段和客户令牌字段 API 处理然后将响应发布到我的服务器上的callback php 文件 已修复
  • 删除 CFStringTransform 结果中的撇号

    我正在将俄语 或任何语言 字符串转换为好看的拉丁字符串 以便在 URL 中使用 例如example com obezd pedestala 我使用这段代码 CFMutableStringRef bufferRef bridge CFMuta
  • PHP 中的 SQL 查询返回 false

    我正在尝试在 PHP 中执行此查询 但它始终返回 false 我已经在 phpMyAdmin 中尝试过查询 它工作正常 所以如果有人能发现问题所在 那就太好了 另外 对于此类问题 我怎样才能获得更好的错误消息 以便我可以尝试解决问题 stm
  • 如何在不使用 NumberInt(...) 进行任何包装的情况下导出 mongodb?

    我想将mongodb导出为json 这里有一条记录 id oid 554f042c0e81bf483e4a4e2f batch 3 bz NumberInt 1 问题是当我使用 json 加载它时 json loads id oid 554
  • MS Access (MDB) 并发

    对于一个小型项目 我需要使用一个要求非常低的简单数据库 几个表 总共不超过几千条记录 2 或 3 个用户 我在 NET环境中工作 由于数据库服务器 即使是那些 Express 版本 在这种情况下似乎是一个巨大的杀伤力 一个非常简单的 MDB
  • 使用参数作为泛型类型,并为其指定默认值

    我有一个简单的课程Board带参数width height and types在构造函数中 高度和宽度始终具有类型number but types是任意类型的数组 我想做的是捕获的类型types使用泛型类型的参数
  • Javascript 正则表达式查找基本 URL

    我对 JS 中的这个正则表达式感到疯狂 var patt1 http s a z0 9 a z0 9 0 9 i 如果我给出像 http www eitb com servicios concursos 516522 这样的输入字符串 这个
  • JS 中的高阶函数

    我现在正在学习 JavaScript 我有一些问题 以下代码来自 Eloquent JavaScript 一书 function forEach array action for var i 0 i lt array length i ac
  • 将视图作为参数添加到自定义 ViewModifier

    这更多的是一个语法问题 我试图在不使用 AnyView 的情况下将视图传递到 ViewModifier 初始化程序中 目前我有一些使用 AnyView 运行的东西 但我想使用通用视图语法 就像您将 某些视图 传递到此答案中概述的视图一样 如
  • 通过字符串引用类名?

    我需要解析一些文本文件 为文本中遇到的各种实体创建对象 并将它们放入某种数据结构 例如列表 中以进行进一步处理 文本示例 laptop 17 dell weight 12 lb desktop 24 hp 我事先知道文本中可能存在哪些实体
  • 使用 Polybase 将数据并行加载到现有表中

    使用 CTAS 我们可以利用 Polybase 提供的并行性将数据加载到new以高度可扩展和高性能的方式创建表 有没有办法使用类似的方法将数据加载到existing桌子 桌子甚至可能是空的 创建外部表并使用INSERT INTO SELEC
  • 一个 StringToken 解析器,它提供 Google 搜索样式“您的意思是:”建议

    寻求一种方法 在字符串中采用空格分隔的标记 返回建议的单词 ie 谷歌搜索可以采取 拼音词翻译 并在结果页面顶部显示 您是说 拼音词翻译器 首选使用任何 C 语言或 Java 的解决方案 是否有任何现有的开放库可以执行此类功能 或者有没有办