OCR 扑克牌 [关闭]

2024-04-21

我决定做一个有趣的项目,我想将扑克牌的图像作为输入并返回其等级和花色。我认为我只需要查看左上角,因为那里包含了所有信息。它应该是稳健的 - 如果我有一张方块 A 的大图像,我应该能够将其缩放到 20% 到 200% 的任意位置,并且仍然得到正确的答案。

第一个问题 - 有没有已经写过的东西可以做到这一点?如果是这样,我会找到其他 OCR 工具,这样我就不会重复工作。

第二——执行此操作的最佳方法是什么?神经网络?手工编码的东西?有人可以指点一下吗? (0xCAAF9452 不是可接受的答案)。


我不认为已经为您想要完成的任务编写了一些东西(至少是开源的和用 Python 编写的)。

至于你的第二个问题,这取决于你想要认识什么。如果输入可以来自不同的来源——例如,具有独特风格的不同品牌的扑克牌——那么你可能应该使用机器学习基于算法(例如神经网络或支持向量机[SVM]),以便让它学习如何识别未知输入。但是,如果输入的形状或样式始终相同,那么一个简单的图像比较算法就足够了(例如,将切片左上角的像素与每个等级的像素进行比较)。

如果您确实决定使用基于机器学习的算法,我也认为您不需要非常复杂的功能,因为花色和等级在形状或风格上并没有太大变化,并且您应该只使用左上角的像素作为特征。

有一个 OCR 玩具示例here http://code.google.com/p/svm-ocr-demo/您可能会觉得有趣。使用的库(LibSVM)也有一个Python版本,我已经使用过,并且发现使用起来非常简单。

希望能帮助到你。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

OCR 扑克牌 [关闭] 的相关文章

随机推荐

  • 为什么在 .NET 4 下运行时此行会导致 VerificationException?

    请帮助我 为什么此代码在 NET 4 0 下运行时会导致 VerificationException public T parseEnum
  • Gemfile - 将生产 gem 与开发 gem 分开

    所以我知道在 Gemfile 中我可以做这样的事情 group development test do gem gem1 gem gem2 end 我想要完成的是这样的事情 group production do gem gem1 gem
  • Xcode动态实时更新折线图

    我正在尝试创建一个折线图 在其中连续绘制数据 以便可以实时观察图表更新 每秒绘制大约 5 个点左右 我正在寻找的图表类似于此处显示的图表 https www vanmil org live heart rate with ios and m
  • 用 typescript 重新定义 window.console

    我的错误记录代码中有以下 javascript 它定义了console log for 某些浏览器不存在 https stackoverflow com questions 3326650 console is undefined erro
  • 如何更改 Java 文件的字体大小和字体颜色?

    如何从 Eclipse 中的 Java 文件而不是 XML 文件更改字体颜色 大小和按钮颜色 对于字体大小 您可以将其写为 tv setTextSize 20 0f 对于字体颜色 您可以将其写为 tv setTextColor Color
  • docker run 使用包含变量的 ENTRYPOINT

    我有一个私人 git 存储库github com http github com我想自动化docker build过程使用Dockerfile 我天真地认为最好的地方Dockerfile位于我的存储库的根文件夹中 例子 git clone
  • 尝试从文件创建 python 字典,但我不断收到“太多值无法解压”之类的错误

    我在记事本中保存了一个文本文件 但移到了我的 python 文件夹中 该文件夹左侧有一个国家 地区的三个字母缩写 右侧有大约四个或五个空格 它有与其对应的国家 地区 如下所示 AFG 阿富汗ARM亚美尼亚 etc 我需要字典使用三个字母作为
  • 如何防止在 Chrome 扩展程序中放大弹出窗口

    我刚刚注意到 如果我在选项卡中放大网页 通过执行 Ctrl Plus 然后打开弹出窗口对于我的 Chrome 扩展 它也得到了扩展 不幸的是 这使得它显示垂直滚动条 在更大的范围内 甚至显示水平滚动条 我发现其他扩展程序仅以 100 缩放显
  • 如何在 FakeHttpContext 中设置 Request.Header 进行单元测试

    我有一个假HttpContext我一直在尝试修改以包含一些用于测试目的的标头 public static HttpContext FakeHttpContext var httpRequest new HttpRequest http st
  • expo-auth-session 无法在 Android 独立应用程序上完成 Google 登录

    我正在使用 expo 开发一个反应本机应用程序 我用过expo auth session providers google包登录 它在世博环境中工作正常 但是当我为 Android 平台构建应用程序时 由于 google 登录未完成 因此不
  • Android - 将点击焦点设置在按钮上

    我的布局中有 4 个按钮 现在每当我单击任何按钮时 在单击事件之后 按钮应该突出显示 显示它是最后单击的 为了制作这样的东西 我尝试了以下方法 code btn1 setOnClickListener new button click li
  • 为什么 std::string("\x00") 报告长度为 0?

    我有一个需要对字符串进行编码的函数 它需要能够接受 0x00 作为有效的 字节 我的程序需要检查字符串的长度 但是如果我传入 x00 to std string the length 方法返回 0 即使字符串是单个空字符 如何获取实际长度
  • Ado.Net - 如何使用连接池?

    Net 允许连接池 根据我所读到的内容 只需向 App config 添加参数即可 问题是 我是否应该在代码中执行任何操作来使用连接池 在我的代码中 每次需要数据时我都会打开一个连接 并在完成后立即关闭它 我应该做一些特别的事情来重用连接吗
  • swing 中的登录和注销[关闭]

    很难说出这里问的是什么 这个问题是含糊的 模糊的 不完整的 过于宽泛的或修辞性的 无法以目前的形式得到合理的回答 如需帮助澄清此问题以便重新打开 访问帮助中心 help reopen questions 我制作了一个包含用户名和密码的表单
  • Mininet 找不到所需的可执行控制器

    每当我想在 mininet 中运行 sshd py 示例或我自己编写的一些客户代码时 我都会得到 Creating network Adding controller Adding hosts h1 h2 h3 h4 h5 Adding s
  • 将 TypeScript 类型打印到控制台/文件中

    我有多种类型 形成了当前在我的服务器上使用的更大 复杂的类型 是否可以将更大 复杂的类型打印到控制台 文件中 Example type TypeA prop1 string prop2 number type TypeB Omit
  • 是否有一个在线工具可以像 JSON 一样自动缩进和格式化 Clojure 代码?

    有很多在线工具可以获取 JSON 文本 并向您显示该文本的格式化和缩进格式 有些甚至更进一步 形成了一个漂亮的树状结构 http jsonviewer stack hu http jsonviewer stack hu 我们有类似的 Clo
  • 无法访问org.springframework.core.env.EnvironmentCapable

    我正在尝试使用它在 Web 应用程序中获取 spring bean WebApplicationContext wac WebApplicationContextUtils getRequiredWebApplicationContext
  • Groovy 中没有参数的模拟静态方法

    我需要模拟一个静态方法 我正在使用 EMC 方法 描述于使用 groovy 模拟静态方法 http groovy codehaus org Mocking Static Methods using Groovy 像这样 TestDaemon
  • OCR 扑克牌 [关闭]

    Closed 这个问题需要多问focused help closed questions 目前不接受答案 我决定做一个有趣的项目 我想将扑克牌的图像作为输入并返回其等级和花色 我认为我只需要查看左上角 因为那里包含了所有信息 它应该是稳健的