如何使用 PyEnchant 更正文本并自动返回更正后的文本

2023-12-13

import enchant
import wx
from enchant.checker import SpellChecker
from enchant.checker.wxSpellCheckerDialog import wxSpellCheckerDialog
from enchant.checker.CmdLineChecker import CmdLineChecker

a = "Ceci est un text avec beuacuop d'ereurs et pas snychro"
chkr = enchant.checker.SpellChecker("fr_FR")
chkr.set_text(a)
cmdln = CmdLineChecker()
cmdln.set_checker(chkr)
b = cmdln.run()
c = chkr.get_text()  # returns corrected text
print c

如何得到c返回更正后的文本而不使用0手动从cmdlinechecker?

该程序应该运行包含未更正文本的字符串,更正它,并将其保存在变量中以导出到 MySQL 数据库。


a = "Ceci est un text avec beuacuop d'ereurs et pas snychro"
chkr = enchant.checker.SpellChecker("fr_FR")
chkr.set_text(a)
for err in chkr:
    print err.word
    sug = err.suggest()[0]
    err.replace(sug)

c = chkr.get_text()#returns corrected text
print c

完全按照我的预期工作。添加过滤器并自动更正所有小文本,使您能够执行关键字搜索等...

我花了 13 个小时才弄清楚;(

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

如何使用 PyEnchant 更正文本并自动返回更正后的文本 的相关文章

  • 如何在python 3.7中生成条形码

    我正在使用 python 3 7 为了生成条形码 我尝试使用安装 pyBarcode 库pip install pyBarcode 但它显示以下错误 找不到满足 pyBarcode 要求的版本 来自版本 找不到 pyBarcode 的匹配分
  • 为什么删除临时文件时出现WindowsError?

    我创建了一个临时文件 向创建的文件添加了一些数据 已保存 然后尝试将其删除 但我越来越WindowsError 编辑后我已关闭该文件 如何检查哪个其他进程正在访问该文件 C Documents and Settings Administra
  • 如何检查python xlrd库中的excel文件是否有效

    有什么办法与xlrd库来检查您使用的文件是否是有效的 Excel 文件 我知道还有其他库可以检查文件头 我可以使用文件扩展名检查 但为了多平台性我想知道是否有任何我可以使用的功能xlrd库本身在尝试打开文件时可能会返回类似 false 的内
  • Python - 来自 .进口

    我第一次尝试图书馆 我注意到解决图书馆内导入问题的最简单方法是使用如下结构 from import x from some module import y 我觉得这件事有些 糟糕 也许只是因为我不记得经常看到它 尽管公平地说我还没有深入研究
  • pyspark 数据框中的自定义排序

    是否有推荐的方法在 pyspark 中实现分类数据的自定义排序 我理想地寻找 pandas 分类数据类型提供的功能 因此 给定一个数据集Speed列 可能的选项是 Super Fast Fast Medium Slow 我想实现适合上下文的
  • 如果未引发异常,则通过 Python 单元测试

    在Python中unittest框架 是否有一种方法可以在未引发异常的情况下通过单元测试 否则会因 AssertRaise 而失败 如果我正确理解你的问题 你could做这样的事情 def test does not raise on va
  • 搜索多个字段

    我想我没有正确理解 django haystack 我有一个包含多个字段的数据模型 我希望搜索其中两个字段 class UserProfile models Model user models ForeignKey User unique
  • 一段时间后终止线程的最 Pythonic 方法

    我想在线程中运行一个进程 它正在迭代一个大型数据库表 当线程运行时 我只想让程序等待 如果该线程花费的时间超过 30 秒 我想终止该线程并执行其他操作 通过终止线程 我的意思是我希望它停止活动并优雅地释放资源 我认为最好的方法是通过Thre
  • 结构差异 sudo() run('sudo 命令')

    我想知道函数之间有什么区别sudo 和函数run sudo u user smth 文档上有 sudo 在所有运行方式上都是相同的 除了它总是换行 调用 sudo 程序中的给定命令以提供超级用户 特权 但有几次 sudo cmd 提示我输入
  • Django 的 request.FILES 出现 UnicodeDecodeError

    我在视图调用中有以下代码 def view request body u for filename f in request FILES items body body Filename filename n f read n 在某些情况下
  • Geodjango距离查询未检索到正确的结果

    我正在尝试根据地理位置的接近程度来检索一些帖子 正如您在代码中看到的 我正在使用 GeoDjango 并且代码在视图中执行 问题是距离过滤器似乎被完全忽略了 当我检查查询集上的距离时 我得到了预期距离 1m 和 18km 但 18km 的帖
  • 通过索引访问Python字典的元素

    考虑一个像这样的字典 mydict Apple American 16 Mexican 10 Chinese 5 Grapes Arabian 25 Indian 20 例如 我如何访问该字典的特定元素 例如 我想在对 Apple 的第一个
  • 在 keras 中保存和加载权重

    我试图从我训练过的模型中保存和加载权重 我用来保存模型的代码是 TensorBoard log dir output model fit generator image a b gen batch size steps per epoch
  • 从 NumPy 数组到 Mat 的 C++ 转换 (OpenCV)

    我正在围绕 ArUco 增强现实库 基于 OpenCV 编写一个薄包装器 我试图构建的界面非常简单 Python 将图像传递给 C 代码 C 代码检测标记并将其位置和其他信息作为字典元组返回给 Python 但是 我不知道如何在 Pytho
  • 动态过滤 pandas 数据框

    我正在尝试使用三列的阈值来过滤 pandas 数据框 import pandas as pd df pd DataFrame A 6 2 10 5 3 B 2 5 3 2 6 C 5 2 1 8 2 df df loc df A gt 0
  • 混淆矩阵不支持多标签指示符

    multilabel indicator is not supported是我在尝试运行时收到的错误消息 confusion matrix y test predictions y test is a DataFrame其形状为 Horse
  • Django 与谷歌图表

    我试图让谷歌图表显示在我的页面上 但我不知道如何将值从 django 视图传递到 javascript 以便我可以绘制图表 姜戈代码 array Year Sales Expenses 2004 1000 400 2005 1170 460
  • TKinter 中的禁用/启用按钮

    我正在尝试制作一个像开关一样的按钮 所以如果我单击禁用按钮 它将禁用 按钮 有效 如果我再次按下它 它将再次启用它 我尝试了 if else 之类的东西 但没有成功 这是一个例子 from tkinter import fenster Tk
  • 从 pandas DataFrame 中删除少于 K 个连续 NaN

    我正在处理时间序列数据 我在从数据帧列中删除小于或等于阈值的连续 NaN 时遇到问题 我尝试查看一些链接 例如 标识连续 NaN 出现的位置以及计数 Pandas NaN 孔的游程长度 https stackoverflow com que
  • 查找总和为给定数字的值组合的函数

    这个帖子查找提供的 Sum 值的组合 https stackoverflow com a 20194023 1561176呈现函数subsets with sum 它在数组中查找总和等于给定值的值的组合 但由于这个帖子已经有6年多了 我发这

随机推荐

  • 设置 Keras 模型可训练与使每一层可训练之间有什么区别

    我有一个由一些密集层组成的 Keras 顺序模型 我将整个模型的可训练属性设置为 False 但我看到各个层的可训练属性仍然设置为 True 我是否需要将图层的可训练属性也单独设置为 False 那么将整个模型的trainable属性设置为
  • 使用 PHP 生成随机的十六进制颜色代码

    我正在开发一个项目 需要生成未定义数量的随机 十六进制颜色代码 我将如何在 PHP 中构建这样的函数 RGB 十六进制字符串只是从 0x0 到 0xFFFFFF 的数字 因此只需生成该范围内的数字并将其转换为十六进制即可 function
  • 从自定义类管理 NSURLSession 的完成处理程序

    我的应用程序的一部分涉及根据提供给用户的唯一代码为用户创建登录检查 为了使我的应用程序结构正确 我创建了一个网络助手类来处理所有网络操作 这是我从控制器类 ViewController m 调用我的帮助器类的方法 LoginNetworkH
  • 在用户的 Google 帐户上存储数据

    有什么方法可以让 PHP 支持的 Web 应用程序将数据存储在用户的 Google 帐户中吗 请求用户许可后 基本上我不想在我的服务器上存储私人用户数据 应用程序将主要处理文档 文本数据 有谷歌文档API http code google
  • 我无法清除和重置单元格的背景颜色

    在以下命令的帮助下 我可以清除单元格的内容 但不能清除其背景颜色 如何清除和设置范围内单元格的背景颜色 ob9 Range ob9 Cells 1 StartCol ob9 Cells 1 maxcolumn ClearContents E
  • 如何根据 value_counts() 条件替换 pandas dataframe 列中的值? [复制]

    这个问题在这里已经有答案了 我有一个数据框 其中一列本质上是分类的 并且该列中的许多值都是重复的 但是有许多值的计数非常小 即一位数计数 而其他值的计数为 3 或 4 位数字 我想将此分类列中值计数小于 10 的所有值替换为值 其他 下面
  • .NET Remoting 真的已被弃用吗?

    每个人都在说 NET Remoting 如何被 WCF 取代 但我想知道这到底有多准确 我还没有看到任何关于 Remoting 被弃用的官方消息 而且在我看来 在某些情况下 Remoting 比 WCF 更有意义 即使在框架的 4 0 版本
  • 通过google play私人频道部署android应用程序

    您好 我正在尝试在 Google Play 商店的私人频道中上传我的 Android 应用程序 这将是我们组织的第一个应用程序 我们尚未上传任何应用程序 但我们正在尝试在私人频道中上传我们的第一个应用程序 我没有找到如何开始使用 Googl
  • 无效的短期购买代币

    我有带有订阅应用内购买功能的 Android 应用程序 因为我使用订阅从在线服务传递数据 所以我通过 google play API 在服务器端使用购买验证 使用应用程序在购买后向我发送的购买令牌 我的数据库中的大多数购买令牌都是长字母数字
  • 类对象 getter 上的 @ConditionalonExpression

    我想知道是否有一种方法可以通过评估在运行时获取其值的类的对象来在运行时使用 conditionalonexpression 来启用类 例如 ConditionalOnExpression propertyobject getexenable
  • 量角器测试获取表条目的值

    我现在正在编写一些量角器测试 遇到了一些问题 如何从第一行的条目中获取 value1 value2 和 value3 的值 HTML 看起来像这样 table tr td object value1 td td object value2
  • 文本文件解析 - 如何搜索特定字符串并返回整行?

    例如 txt 文件具有以下条目 england is cold country India is poor country england is cold country england is cold country India is p
  • 使用 jquery 幻灯片中的 FadeIn() 图像

    我正在制作图像幻灯片 并且fadeOut 功能适用于每个图像更改 但下一个图像突然出现 我想让它淡入 我似乎无法让它工作 这是没有任何内容的代码fadeIn HTML div img class active src background1
  • 如何在Qt中的QTimeEdit中读取当前时间?

    如何读取用户设置的当前小时和分钟QTimeEdit在 Qt 中 以及如何在QDateTime 读取当前日 月 年 分钟和小时 Use time and date 方法 const int hour timeEdit gt time hour
  • C# directx 精灵起源

    当我的精灵旋转原点固定在窗口的左上角时 与精灵绘制 and 精灵 Draw2D 不管怎样 如果我改变旋转中心 它仍然在左上角 我需要精灵绕其 Z 轴旋转 Edit 我已经尝试过这个 hereMatrix pm Matrix Translat
  • 如何在 iOS 中计算对数? [复制]

    这个问题在这里已经有答案了 我想在 iOS 中计算对数 Objective C 可以做到这一点吗 您可以使用C 函数用于计算对数 import
  • 语音识别 Android 应用程序

    我正在制作一个应用程序 它接受用户的命令并实时写入 我最好的选择是什么 像 sphinx 这样的第三方软件还是应该使用内置的 android 语音识别 其次 我希望它能够实时写入 就像我说话时它就开始写入一样 您应该使用内置的 Androi
  • 函数 simplexml_load_string() 上的 XML_PARSE_HUGE

    常数XML PARSE HUGE可以作为第三个参数传递给simplexml load string 根据php net这个标志 放宽解析器的任何硬编码限制 什么是 解析器的默认硬编码限制 我认为放松也有点含糊 它是否消除或增加了 硬编码限制
  • 按钮中的图像 - j2me

    我正在尝试使用 J2ME 构建一个简单的基于菜单的 GUI 菜单项当前是从 Button 类派生的类的对象 有什么办法我可以 替换按钮中的文本并显示图像 类似图标 使文本和图像并排显示在同一菜单栏上 如果我的问题不清楚 请告诉我 我会编辑它
  • 如何使用 PyEnchant 更正文本并自动返回更正后的文本

    import enchant import wx from enchant checker import SpellChecker from enchant checker wxSpellCheckerDialog import wxSpe