确定图像中的文本和图形区域

2024-01-22

我不知道我是否应该在这里发布这个问题?但如果有人知道请回答一下?

用于确定图像中哪个区域是文本、哪个区域是图形的算法是什么?意味着如何分离这些区域? (图或图)


大多数 OCR 软件,例如Ocropus http://code.google.com/p/ocropus/,支持布局分析,这就是你所需要的。

毛泽东、罗森菲尔德和卡南戈 (2003)提供了布局分析算法的最新调查。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

确定图像中的文本和图形区域 的相关文章

  • 压缩很多小字符串的算法?

    我正在寻找一种压缩小 ASCII 字符串的算法 它们包含大量字母 但也可以包含数字和很少的特殊字符 它们很小 平均约为 50 100 字节 最多 250 个字节 例子 Android show EditText setError above
  • 布隆过滤器的使用

    我正在努力理解布隆过滤器的用处 我了解了它的底层逻辑 空间压缩 快速查找 误报等 我只是不能将这个概念应用到现实生活中 因为它是有益的 一种常见的应用是在 Web 缓存中使用布隆过滤器 我们使用布隆过滤器来确定给定的 URL 是否在缓存中
  • 氡变换线检测

    我正在尝试检测灰度图像中的线条 为此 我在 MATLAB 中使用 Radon 变换 我的 m 文件的示例如下所示 我可以使用此代码检测多行 我还使用线条的移位和旋转属性来绘制线条 但是 我不明白在获取rho和theta值后如何获取检测线的起
  • 为什么这个 gif 的持续时间似乎是 0 毫秒?如何找到真实的持续时间?

    我正在尝试从动画 gif 文件中获取持续时间和帧数 以便计算 gif 的平均帧速率 然后将其转换为视频 我最近在测试过程中看到了这张图片 它似乎让一切都相信它的持续时间为 0 毫秒 为什么 如何找到真实的持续时间 到目前为止我已经尝试过 e
  • 在骨架图像中查找线 OpenCV python

    我有以下图片 我想找到一些线来进行一些计算 平均长度等 我尝试使用HoughLinesP 但它找不到线 我能怎么做 这是我的代码 sk skeleton mask rows cols sk shape imgOut np zeros row
  • 数字求和的算法?

    我正在寻找一种数字求和的算法 让我概述一下基本原则 假设你有一个号码 18268 1 8 2 6 8 25 2 5 7 7 是我们的最终数字 它基本上是将整个数字中的每个数字相加 直到我们得到一个 也称为 核心 数字 它经常被命理学家使用
  • 按步长值变化对数组中的数字进行分组

    我有一个像 101 107 106 199 204 205 207 306 310 312 312 314 317 318 380 377 379 382 466 469 471 472 557 559 562 566 569 在这个数组中
  • 在Python中确定句子中2个单词之间的邻近度

    我需要确定 Python 句子中两个单词之间的接近度 例如 在下面的句子中 the foo and the bar is foo bar 我想确定单词之间的距离foo and bar 确定之间出现的单词数foo and bar 请注意 该词
  • 计算给出数组中最小标准差的子集

    让我们有一个大小的向量N 例如 x rand N 1 我想计算长度子集的最小标准差K在向量中 When N and K很小 很容易找到最好的子集 因为我可以使用nchoosek N K 枚举所有可能的子集 但是当值N and K比我们说的要
  • 免费/开放图书馆查找相似图像

    我正在寻找稳定且成熟的免费 开源库 允许比较两个图像 我找到了这个 但我想知道你是否使用更好的 相似图像查找器 C 和 RGB 中的 NET 图像处理 http similarimagesfinder codeplex com 我做的很简单
  • 是否可以将 ppm 文件从 p3 转换为 p6 或使用pillow lib 打开 ppm p3 文件

    是否可以将 ppm 文件从 p3 转换为 p6 或使用pillow lib 打开并读取 ppm p3 文件 我实际上有 ppm p3 文件 并尝试使用pillow lib 将它们转换为 jpg 但不幸的是 它不读取 p3 文件 只读取 p6
  • Python绕相机轴旋转图像

    假设我有一个图像 是在对某些原始图像应用单应性变换 H 后获得的 未显示原始图像 将单应性 H 应用于原始图像的结果是该图像 我想围绕合适的轴 可能是相机所在的位置 如果有的话 将此图像旋转 30 度以获得此图像 如果我不知道相机参数 如何
  • 为什么这个基本的 imagejpeg() resizer 返回黑色图像?

    EDIT 感谢您的所有回答 特别是 Mailerdaimon 他注意到我没有在imagecopyresampled功能 我不再得到黑色图像 但我仍然得到一些黑色部分 所以我认为我的比例公式应该更新 如果我上传横向图像 新图像的高度小于 17
  • 在大文件中查找重复项

    我有一个非常大的文件 大约有 1500 万个条目 文件中的每一行都包含一个字符串 称为键 我需要使用 java 查找文件中的重复条目 我尝试使用哈希图并检测重复的条目 显然 这种方法向我抛出了 java lang OutOfMemoryEr
  • 查找两个大小为 n 的数组中第 n 大数的算法

    我有这个问题 给定两个大小为 n 的排序列表 存储在数组中 找到 O log n 计算并集中第 n 大元素的算法 两个列表 我可以看到这里可能有一个技巧 因为它需要第 n 个最大的元素 并且数组的大小也是 n 但我不知道它是什么 我在想我可
  • 递归:n项级数之和

    需要递归函数 系列是 1 2 3 3 4 5 4 5 6 7 递归求 n 的级数之和 我无法想到应该在函数中传递哪些参数 我的方法 我认为我应该传递 n 要相乘的项数 但我无法想到的是我应该如何在同一个函数中 和 以及我的 return 语
  • 查找数组中 2 个缺失数字的最快方法

    这个问题的存在只是出于纯粹的好奇心 不是作业 找到在数组 1 n 中找到两个缺失数字的最快方法 因此 在相关帖子中 查找数字数组中缺失数字的最快方法 https stackoverflow com questions 2113795 qui
  • Alpha 混合可消除图像中的接缝

    我缝合了两张图像 但在最终图像中存在可见的接缝 我正在尝试使用阿尔法混合去除那条接缝 我知道 Alpha 混合是使用cvAddweight 函数 但在此函数参数是两个图像 alpha beta gamma和目的地 我正在服用gamma 0
  • Pytorch TypeError:eq() 收到无效的参数组合

    num samples 10 def predict x sampled models guide None None for in range num samples yhats model x data for model in sam
  • 广度优先搜索:检查访问状态的时机

    在有向图的广度优先搜索中 可能循环 当一个节点出队时 其所有尚未访问的子节点都会入队 并且该过程将继续 直到队列为空 有一次 我以相反的方式实现它 将节点的所有子节点排队 并在节点出队时检查访问状态 如果正在出队的节点之前已被访问过 则该节

随机推荐

  • 在Python中解析JSON MSG

    我正在尝试将 json MSG 解析为 python 字典 作为参考 该消息是使用 python MQTT 处理程序从物联网接收的 这是我打印对象时收到的格式 msg MSG variable group MSG data0 0 data1
  • 路线 [登录] 未定义

    今天第一次尝试玩 Laravel 当我尝试访问 localhost project public 时收到以下错误 无效参数异常路线 登录 未定义 应用程序 routes php
  • TypeCasting:下面两行代码有什么区别?

    下面两行代码有什么区别 两者都试图获取路径 其中一个正在工作 另一个正在抛出错误 我正在开发 Delphi 7 Path FFormOwner as TForm Designer as IDesigner GetPrivateDirecto
  • 如何在实体框架中执行SqlCommand而不将其包含在事务中

    我需要使用实体框架执行存储过程 通常我这样称呼它 this Context Database ExecuteSqlCommand EXEC edi UploadTransmission 然而 这个特定的存储过程包括访问链接服务器 由于 EF
  • 强类型 DataContext 如何工作?

    这是一个深入的延续我今天早上早些时候提出的问题 https stackoverflow com questions 2178090 is this a spurious warning when using linq to sql 我仍然对
  • 如何使用 mongoose 连接到 mongoDB Atlas

    我正在尝试通过 Mongoose connect 连接到 mongoDB Atlas 上的集群 但每次尝试连接时都会收到异常 MongoError 身份验证失败 我知道 MongoDB Atlas 是新的 mongo 即服务 mongoos
  • 谷歌浏览器错误?

    此消息始终出现在 Chrome 开发人员工具控制台中 Port error Could not establish connection Receiving end does not exist miscellaneous bindings
  • 如何在 Mac OS 上开发 Blackberry 应用程序?

    我正在 Apple MacBook 上开发 iPhone 和 Android 应用程序 我想开发黑莓应用程序 我现在正在使用Windows来学习 是否有任何软件或 Eclipse 插件可以在 Mac OS 而不是 Windows 上开发 B
  • 如何将毕加索与列表视图一起使用?

    我想向 ListView 添加有关小部件的信息 public class Widget String w type String title String desc String img 如果 img 字段不为空 我想在列表视图中显示图像
  • 如何获取数组中同一键的最大值

    如何获取数组中同一键的最大值 E x 我有这个数组 Array id gt 1 amount gt 4 Array id gt 1 amount gt 3 Array id gt 2 amount gt 3 我想要以下结果 意味着我想要相同
  • 递归:幕后[关闭]

    Closed 这个问题需要细节或清晰度 help closed questions 目前不接受答案 虽然众所周知 递归是 一种调用自身的方法 但我倾向于想知道到底发生了什么 举个经典的阶乘例子 public static int fact
  • 以角度显示时间/时钟

    我正在使用以下方法在我的应用程序中显示时间 constructor private datePipe DatePipe ngOnInit this getTime this date this datePipe transform new
  • 为什么指定模式名称时 PostgreSQL SELECT 查询会返回不同的结果?

    我有一个 PostgreSQL 数据库表 有 4 列 标记为 column a column b 等 我想使用简单的选择查询来查询该表 select from table name 我得到一些结果 如下所示 column a column
  • GCE - 如果我使用 SSH 或从终端登录,用户名会不同吗?

    我创建了一个新项目 里面什么都没有 当我创建第一个微实例时 我执行了以下操作 使用浏览器窗口 SSH 连接到它 我懂了 用户名 instance 1 如果我使用 gcloud 命令进行连接 gcloud 计算 project project
  • C 中 Union 的示例 [关闭]

    很难说出这里问的是什么 这个问题是含糊的 模糊的 不完整的 过于宽泛的或修辞性的 无法以目前的形式得到合理的回答 如需帮助澄清此问题以便重新打开 访问帮助中心 help reopen questions 我正在寻找一些工会的例子 不是为了了
  • Flutter:使用导航器推送到新屏幕时保留 BottomNavigationBar

    在iOS中 我们有一个UITabBar控制器 https developer apple com documentation uikit uitabbarcontroller当我们推送到新的 ViewController 时 它会永久保留在
  • 如何使用 Google Cloud Pub/Sub 进行 Junit 测试

    我在我的系统中使用Google Cloud Pub Sub的push pub sub 我想构建我的CI测试代码 但我不知道如何去做 例如 一些代码是这样的 final Pubsub pubsub PubsubUtils getClient
  • Clang:将函数的 AST 从原始文件写入新文件

    我是 Clang 的新手 正在尝试通过 libtooling 分析 AST 我想找到一个特定的函数 并将其 AST 从原始源文件移动到新文件 我已经知道如何通过 MatchFinder 找到该函数 现在 我想知道如何将其 AST 写入新文件
  • 在 Gstreamer 上流式传输 MP4 视频文件

    我第一次使用 gstreamer 并尝试使用 Gstreamer RTP 和 UDP 将 MP4 视频文件从服务器流式传输到客户端 我尝试使用的命令行 在服务器端 gst launch 1 0 v filesrc location file
  • 确定图像中的文本和图形区域

    我不知道我是否应该在这里发布这个问题 但如果有人知道请回答一下 用于确定图像中哪个区域是文本 哪个区域是图形的算法是什么 意味着如何分离这些区域 图或图 大多数 OCR 软件 例如Ocropus http code google com p