OCR 处理前的图像预处理

2024-02-13

我当前的项目涉及将 pdf 中的文本转录为文本文件,我首先尝试将图像文件直接放入 OCR 程序(tesseract)中,但效果不佳。 原始图像文件基本上是旧报纸,并且有一些背景噪音,我确信 tesseract 存在问题。因此,我尝试在将图像输入超正方体之前对其进行一些预处理。有没有适合这种情况的开源图像预处理引擎的建议???以及有关如何使用它的说明将更加感激!


我从来没有听说过“图像预处理引擎“为此目的,但你可以看看OpenCV http://opencv.org/(开源计算机视觉库)并实现您自己的“预处理引擎". OpenCV是一个计算机视觉库,提供许多执行图像处理的功能。

您可能想要测试的一件有趣的事情预处理步骤是应用一个临界点到图像中去除噪音和东西。反正,我曾在这个线程 https://stackoverflow.com/a/11471322/176769.

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

OCR 处理前的图像预处理 的相关文章

  • 不使用 OpenCV 获取图像掩模

    我正在尝试以下方法从该图像中获取蒙版 但不幸的是我失败了 import numpy as np import skimage color import skimage filters import skimage io get filena
  • 图像处理编程

    我想知道是否有任何方法可以使用某种编程语言检测图像中对象的位置 例如 如果我有一个球的图像 每 100 毫秒更新一次 是否可以通过某些程序使用某些东西来获取球的坐标 看一下OpenCV http opencv willowgarage co
  • 使用 python 突出显示图像中的特定文本

    我想突出显示网站屏幕截图中的特定单词 句子 截取屏幕截图后 我使用提取文本pytesseract and cv2 效果很好 我可以获得有关它的文本和数据 import pytesseract import cv2 if name main
  • 使用 openCV 和 python 检测物体

    我正在尝试使用 OpenCV 和 Python 检测下图中的白点 我尝试使用函数 cv2 HoughCircles 但没有成功 我需要使用不同的方法吗 这是我的代码 import cv2 cv import numpy as np impo
  • LockBits 性能关键代码

    我有一个方法需要尽可能快 它使用不安全的内存指针 这是我第一次尝试这种类型的编码 所以我知道它可能会更快
  • 如何在Eclipse中配置Tesseract进行Android开发?

    我已经从事 Android 工作 6 个月了 至此我对Android开发有了基本的了解 现在我想使用 Tesseract 开发一个 OCR Android 应用程序 为此 我从 Tesseract 下载了 android ndk r6b t
  • 提高 pytesseract 从图像中正确识别文本的能力

    我正在尝试使用读取验证码pytesseract模块 大多数时候它都能提供准确的文本 但并非总是如此 这是读取图像 操作图像以及从图像中提取文本的代码 import cv2 import numpy as np import pytesser
  • Tesseract 是否会忽略扫描文档中的任何非文本区域?

    我正在使用 Tesseract 但我不知道它是否忽略任何非文本区域并仅针对文本 我是否必须删除任何非文本区域作为预处理步骤以获得更好的输出 Tesseract 有一个非常好的算法来检测文本 但它最终会给出误报匹配 理想情况下 您应该在将图像
  • 如何将任意颜色的色度键滤镜应用到实时摄像头源ios?

    基本上我想将色度键滤镜应用到 ios 实时摄像头源 但我希望用户选择将被另一种颜色替换的颜色 我找到了一些使用绿屏的示例 但我不知道如何动态替换颜色而不仅仅是绿色 知道如何以最佳性能实现这一目标吗 您之前曾询问过我的情况GPUImage h
  • 在discord.py中访问成员的横幅

    我正在制作图像配置文件命令 我想为此访问会员的横幅 我们有什么办法可以在discord py 中做到这一点吗 如果不清楚我所说的横幅是什么意思 那么蓝色背景的图像就是横幅 我想访问它 在discord py v2 0中你可以使用 You m
  • 如何在 OpenCV 中从 YUV 文件读取帧?

    如何在 OpenCV 中从 YUV 文件读取帧 我编写了一个非常简单的 python 代码来从二进制文件读取 YUV NV21 流 import cv2 import numpy as np class VideoCaptureYUV de
  • 归一化互相关的基础知识

    我正在尝试使用范数校正2 归一化互相关 http en wikipedia org wiki Cross correlation Normalized cross correlation 来自 MATLAB 用于计算发育中胚胎中移动形状的速
  • setImageCompressionQuality 与 setCompressionQuality 之间有什么区别 - Imagick

    我在Imagick中找到了两种设置图像压缩质量的方法 A 设置图像压缩质量 B 设置压缩质量 所以我想知道哪一个是最好的以及为什么在以下条件下 我读到了setCompressionQuality方法仅适用于新图像 我正在尝试压缩文件 jpe
  • OpenCV 2.4.3 中的阴影去除

    我正在使用 OpenCV 2 4 3 最新版本 使用内置的视频流检测前景GMG http docs opencv org modules gpu doc video html highlight gmg gpu 3a 3aGMG GPU算法
  • 将姓名拆分为名字和姓氏 Java(Android OCR)[关闭]

    Closed 这个问题需要细节或清晰度 help closed questions 目前不接受答案 我使用本机 Android JAVA 创建了一个 OCR 光学字符识别 应用程序 我可以将图像转换为文本视图 但是我如何使用这些词分别识别名
  • 如何使用 Python 裁剪图像中的矩形

    谁能给我关于如何裁剪两个矩形框并保存它的建议 我已经尝试过这段代码 但效果不佳 import cv2 import numpy as np Run the code with the image name keep pressing spa
  • numpy:大量线段/点的快速规则间隔平均值

    我沿着一维线有许多 约 100 万个 不规则间隔的点 P 这些标记线段 这样 如果点是 0 x a x b x c x d 则线段从 0 gt x a x a gt x b x b gt x c x c gt x d 等 我还有每个段的 y
  • 从点云检测平面集

    我有一组点云 我想测试3D房间中是否有角落 所以我想讨论一下我的方法 以及在速度方面是否有更好的方法 因为我想在手机上测试它 我将尝试使用霍夫变换来检测线 然后我将尝试查看是否有三条线相交 并且它们也形成了两个相交的平面 如果点云数据来自深
  • 如何绘制更大的边界框和仅裁剪边界框文本 Python Opencv

    我正在使用 easyocr 来检测图像中的文本 该方法给出输出边界框 输入图像如下所示 Image 1 Image 2 使用下面的代码获得输出图像 But I want to draw a Single Bigger bounding bo
  • 计算机视觉/道路跟踪入门

    我想开发一个可以跟踪和沿着道路行驶的系统 最初 我只想处理定义明确的道路 稍后可能会合并对定义不明确的道路的跟踪 我面临的问题是我不知道从哪里开始 我是图像处理领域的新手 我希望能得到一些关于从哪里开始以及应该阅读哪些关于该主题的书籍的指导

随机推荐

  • 跨 pandas 行/回归线应用公式

    我正在尝试在数据框的行上应用公式来获取行中数字的趋势 下面的示例一直有效 直到部分 apply用来 df pd DataFrame np random randn 10 4 columns list ABCD axisvalues list
  • $.ajax删除请求在capybara-webkit中不发送数据参数

    我发现当我通过 capybara webkit 执行 ajax DELETE 请求时 它们没有向控制器发送数据参数 但是 当我使用 selenium 运行测试套件时 数据参数确实被发送 并且测试通过 我的代码如下所示 document on
  • 类型转换和类型断言有什么区别?

    之间的主要区别是什么 v t aType type assertion v aType t type conversion 我应该在哪里使用类型断言或类型转换 类型断言断言t 接口类型 实际上是一个aType and t将是一个aType
  • 以编程方式检测 Android 上是否安装了应用程序

    我已经为我的 Android 应用程序注册了一个 url 方案 假设 myapp host 在我的其他应用程序上 我可以使用 Intent 启动该应用程序 但如何在不启动它的情况下检查第一个应用程序是否已安装 在 iOS 中 这很简单 UI
  • Bokeh:使用复选框小部件隐藏和显示绘图

    我在将 Widget 回调与 Bokeh 一起使用时遇到一些困难 在复选框小部件的帮助下 我想显示 隐藏相应的绘图 与的区别这个问题 https stackoverflow com questions 38705123 using mult
  • Kafka 反序列化嵌套泛型类型

    给定一个这样的类 public class Message
  • 找到图像 src :包含?

    大家早 我有一个图像列表 如下所示 ul style display none li img src afx4000z navy icon 1 thumb jpg li li img src afx4000z green icon 1 th
  • AngularJs 完整的 Jquery 选择不起作用

    我正在尝试使用 Jquery 插件在 AngularJS 指令中操作 DOM 我不确定 AngularJs 是否使用完整版本的 Jquery 尽管完整版本脚本位于头部 而 AngularJs 脚本位于主体 所以理论上 AngularJS 应
  • 如何在 ClearCase 中创建某些项目或流的快照视图?

    我想获取可以在clearcase项目资源管理器中找到的某些流或项目的内容 2 1 cleartool descr l project myProject myPVob 通过一些 grep 您可以获得组件 可写或不可写 和策略的列表 如果您只
  • 在 C/C++ 中打印前导空格和零

    我需要在数字前打印一些前导空格和零 以便输出如下所示 00015 22 00111 8 126 在这里 我需要打印leading spaces当数字是even and leading zero when odd 我是这样做的 int i d
  • 应用程序脚本我的执行条目延迟/丢失

    最近 我的执行遇到了添加执行条目延迟的问题 Google Sheet 上的应用程序脚本将成功运行 基于输出 但执行日志中没有条目或条目延迟 10 分钟以上 更令人担忧的是 今天我收到一封自动生成的电子邮件 其中包含脚本错误 很抱歉 服务器发
  • 按主页按钮并从应用程序图标调用 onCreate 再次访问应用程序?

    我有一个离线在线应用程序 我发现其中有一个奇怪的问题 可能不是 但我不明白 应用程序的要求是 如果互联网可用 即使从启动应用程序或恢复 我也会调用网络服务并将数据存储在 sqlite 中 否则应用程序将保持离线模式 我有 2 个活动 第二个
  • 如何在 Excel 中通过 OleDB 使用命名范围?

    我正在尝试使用 ASP NET C 从 Excel 中的特定命名范围中提取数据 这是我试图提取的示例 我想要的是使用名称 RANGE NAMED 的 B C D 可以用 OleDB 做到这一点吗 此致 Alex 你可以试试这个代码 usin
  • Galaxy Nexus:采样更多传感器时,传感器采样率会变得更快

    我正在尝试从 Samsung Galaxy Nexus 带 Android 4 0 尽快读取传感器值 为此 我使用不同的传感器和采样率做了一些实验 并发现了一个非常奇怪的行为 当我只使用 Acc Sensor 时 采样率约为 50Hz 但是
  • Haskell 中的短路 (&&)

    最近一直困扰我的一个快速问题 Haskell 是否在返回布尔值的函数中执行所有等价测试 即使返回一个假值 例如 f a b a b 2 a b 2 如果第一个测试返回 false 是否会执行第二个测试 或者 Haskell 是否足够懒 不做
  • 如何更改数据表中日期列的日期格式?

    我正在从数据库填充数据表 它包含两个字段 DATE TIME 两个字段都是datetime column 我想遍历数据表并更改日期格式DATE列即dd MM yyyy int i 0 string d foreach DataRow dr
  • 使用 mpatches.Patch 自定义图例

    我使用以下代码创建自定义 matplotlib 图例 import matplotlib patches as mpatches import matplotlib pyplot as plt colors g w texts Green
  • 对非 PHP 文件使用 Laravel @include 指令?

    我一直在寻找一种使用带有非 PHP 文件扩展名的 Laravels Blade 模板引擎 而不是file name blade php能够使用file name blade js or file name blade css 无济于事 我找
  • 1and1 域名、Heroku 托管 - 如何设置电子邮件?

    我刚刚从 1and1 购买了一个域名 并将 cname 设置为指向我在 heroku 上的应用程序 不过 我想要一个电子邮件 电子邮件受保护 cdn cgi l email protection 我需要通过 1and1 或 heroku 执
  • OCR 处理前的图像预处理

    我当前的项目涉及将 pdf 中的文本转录为文本文件 我首先尝试将图像文件直接放入 OCR 程序 tesseract 中 但效果不佳 原始图像文件基本上是旧报纸 并且有一些背景噪音 我确信 tesseract 存在问题 因此 我尝试在将图像输