在 google Vision OCR 中被识别为单个单词的特殊字符？

2024-05-07

我试图让谷歌视觉 OCR 正则表达式可搜索。我已经完成了它，并且当文档仅包含英文字符时效果很好。但当有其他语言的文本时，它就会失败。

发生这种情况是因为我在谷歌视觉单词组件中只有英文字符，如下所示。

VISION_API_WORD_COUNTERS = "([a-zA-Z0-9]+)|([^a-zA-Z0-9 ])";
VISION_API_WORD_COMPONENTS = "[a-zA-Z0-9]";
VISION_API_NOT_WORD_COMPONENTS = "[^a-zA-Z0-9]";

由于我无法包含所有语言的字符，因此我正在考虑包含上述相反的字符。就像是

VISION_API_WORD_COMPONENTS = "[^*ALL THE SPECIAL CHARACTERS WHICH ARE IDENTIFIED AS WORD BY GOOGLE VISION*]"

例如[^!@#$%^&*()_+=].

那么我在哪里可以找到GOOGLE VISION 识别为单独单词的所有特殊字符?

反复试验，不断添加特殊字符，我发现这是一个选择。但这将是我的最后一个选择。

None

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Text

googleapi

OCR

googlecloudvision

googlevision

在 google Vision OCR 中被识别为单个单词的特殊字符？的相关文章

Tesseract OCR 将削减的 0 混淆为 8

我已经在终点字体上训练了 tesseract 但无论如何我都无法让它识别 0 我正在使用 jTessEditor 创建训练 tif 和框即使在验证时它也会将所有 0 读取为 8 我有什么遗漏的吗下面是 0 的示例它将其读作 8 我
在达到 API 配额限制之前 YouTube 视频上传被拒绝

我的项目的API配额通过申请过程成功增加到4M 通过以下方式在配额详细信息中确认了这一点谷歌开发者控制台 https console developers google com已启用 API 的配额页面然而在标准的 50 次上传后视
使用 python 突出显示图像中的特定文本

我想突出显示网站屏幕截图中的特定单词句子截取屏幕截图后我使用提取文本pytesseract and cv2 效果很好我可以获得有关它的文本和数据 import pytesseract import cv2 if name main
如何突出显示最靠近鼠标的文本行？

我有一篇很长的文本我想为用户提供阅读帮助当前行应该突出显示为了更简单我将只使用鼠标的 Y 坐标这样鼠标指针就不会妨碍我有一个带有 id 的大 DIVcontent它用类填充整个宽度和一个小 DIVcontent对于文本请参阅
在 google Vision OCR 中被识别为单个单词的特殊字符？

我试图让谷歌视觉 OCR 正则表达式可搜索我已经完成了它并且当文档仅包含英文字符时效果很好但当有其他语言的文本时它就会失败发生这种情况是因为我在谷歌视觉单词组件中只有英文字符如下所示 VISION API WORD COUNTE
Pygame 文本不渲染

好的我正在用 python 和 pygame 制作一个多项选择测验游戏不过我已经完成了开始屏幕并尝试制作问题屏幕我根本不明白为什么文本不呈现这是我的代码 enter pressed False random question ra
Android 简单 TextView 动画

我有一个 TextView 我想倒计时 3 2 1 发生了事情为了使其更有趣我希望每个数字都以完全不透明开始然后淡出至透明有没有一种简单的方法可以做到这一点尝试这样的事情 private void countDown final
无法删除 OAuth 同意屏幕

我前段时间为一个项目创建了一个OAuth 同意屏幕 https console cloud google com apis credentials consent关于 Google API 和凭证这是非常愚蠢的但似乎一旦创建就无法删除它
从 Gmail 获取 pdf 附件作为文本

我在网络和 Stack Overflow 上搜索但没有找到解决方案我尝试做的事情如下我通过邮件收到某些附件我希望将其作为纯文本进行进一步处理我的脚本如下所示 function MyFunction var threads Gma
Linux 文本文件操作

我有一个格式的文件 a href a href a href a href 我需要选择之后但之前的文本并将其打印在行尾添加后例如 a href http www wowhead com search Su a a a a a
如何将 Xml 文件转换为文本文件 [关闭]

Closed 这个问题需要多问focused help closed questions 目前不接受答案我有大约 8000 个 xml 文件需要转换为文本文件文本文件必须包含 xml 文件的标题描述和关键字不含标签并删除其他元素和
RefreshToken 在我获得新的令牌 Google Sheets API 后没有发回

我正在使用带有 PHP 的 Google Sheets API 并遵循可以在此处找到的快速入门指南https developers google com sheets quickstart php https developers goog
以编程方式识别 PDF 文件中的扫描文本 [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我有一个 PDF 文件其中包含我们需要导入数据库的数据这些文件似乎是打印的字母数字文本的 pdf
如何在html中设置按钮的文本大小

您好我想在我的网站上有一个按钮并且我想调整按钮上的文本大小我该怎么做呢我的代码如下
如何去除给定图像中的噪声，使 ocr 输出完美？

我已经对这个孟加拉文本图像进行了大津阈值处理并使用 tesseract 进行 OCR 但输出非常糟糕我应该应用什么预处理来消除噪音我也想校正图像因为它有轻微的倾斜我的代码如下 import tesserocr from PIL i
位置数据 Google 照片 API

当我通过 API 查询 Google 照片中的照片时它不会返回与该图像关联的任何位置数据当我在 Google Photos 中查看有关图像的信息时我可以在地图上看到该位置但是 API 没有给我这些坐标 mediaMetadata g
如何调用 google 的 getBasicProfile() 来仅单击按钮即可登录 google？

我在我的网站上使用谷歌登录
尝试获取 Google accessToken

看起来无论我做什么谷歌都在竭尽全力阻止我完成这个研究项目我的项目让我使用 Google 电子表格作为数据库并使用所述电子表格中的数据执行程序化的 Google 图片搜索并向最终用户显示一些结果设置说明我开始按照此处的说明进行操
将纯文本转换为 HTML

我有一个脚本在某个时刻我可以通过 Ajax 调用获取 HTML 数据我必须将此 HTML 转换为纯文本如下所示 div text data 我现在想扭转这一局面再次将文本设为 HTML 我有一个简单的 Jquery 方法可以做到这一
如何测试 UITextField 是否为零？

我正在尝试制作我的应用程序的一部分如果该人不更改我的 UITextField 中的空白文本那么他她将无法继续下一步基本上我想测试 UITextField 的 nil 文本我已经使用了 if text 方法但是如果用户单击 UI

随机推荐

如何以最大窗口形式保存 matplotlib 图而不是默认大小？

有人知道我应该如何解决这个问题吗我知道有一个保存按钮我可以手动执行此操作但我正在绘制 100 多个图表所以我希望有一种方法可以自动执行此操作我正在使用 TkAgg 后端并寻找任何可能的解决方案通过在我的绘图函数末尾使用以下内容
如何在 Android RecyclerView 中显示一组项目的日期/日期

您好我在 JSONArray 中获取数据如下 chatArray msg id 193 user id 15235 first name Vishal user name vishal13 message twilio chat time
是否可以在 R 中为 data.frame 命名别名

使用某些数据标准时使用多种方法来查看 data frame 的列会更简单作为一个具体示例在使用 SDTM 数据进行临床试验时每种数据类型如实验室或生命体征都有一列时间点实验室名称为 LBPT 生命体征名称为 VSTPT 理想情
在 C 中使用 sqrtf()：“未定义对‘sqrtf’的引用”

我正在使用Linux Ubuntu 12 04 https en wikipedia org wiki Ubuntu version history Ubuntu 12 04 LTS 28Precise Pangolin 29 Precis
Linux shell 命令逐块读取/打印文件

是否有一个标准的 Linux 命令可以用来逐块读取文件例如我有一个大小为 6kB 的文件我想读取打印第一个 1kB 然后是第二个 1kB 看来猫头尾在这种情况下不起作用非常感谢你可以这样做read n在循环中 while r
将类添加到一组
我有一群 ul 是动态创建的我需要在最后添加一个类 li 每一个 I have ul li last each function this addClass last 但这仅仅增加了一个class last 到最后 ul 不在所有的 ul
jQuery 选择除最后一个之外的所有内容

使用 jQuery 如何选择除最后一个元素之外的所有元素 div class elem 1 div div class elem 2 div div class elem 3 div 例如我想隐藏 div 的 1 和 2 但保留 3 di
为什么人们在 ICommand 上使用 CommandManager.InvalidateRequerySuggested()？

我正在制作自己的一些自定义 ICommand 实现我看到很多实现都是这样的 public event EventHandler CanExecuteChanged add CommandManager RequerySuggested v
Lego Mindstorm NXT 的 C# 库 [关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案是否有适用于 Lego Mindstorm NXT 的最新 C NET 库 NXT NET 乐高头脑风暴最后更新时间 2008 年 4
subprocess.Popen args 参数的最大长度是多少？

我在用Popen http docs python org library subprocess html using the subprocess modulesubprocess 模块中的函数来执行命令行工具 subprocess Po
Xcode 4.4 和 4.5 在项目关闭时冻结

自从升级到 Xcode 4 4 并再次升级到 4 5 在 Lion 上运行后每次我关闭应用程序项目或退出时 Xcode 都会冻结大约 3 5 分钟在此期间活动监视器显示 CPU 占用率为 95 但几乎没有发生磁盘活动我尝试过卸载并
URL 重写 .htaccess

我正准备开发一个具有以下 url 结构的网站我是 url 重写的新手想知道处理此问题的最佳方法 http domain com index php http domain com about about php http domain
在 PowerShell 中调用静态通用 LINQ 扩展方法

人们可以使用以下简单的表示法在 PowerShell 中调用许多 LINQ 方法 int numbers 1 10000 Linq Enumerable Sum numbers 在调用中包含 lambda 甚至是一件相对简单的事情 Func
AngularJS/Bootstrap 推荐的日期选择器是什么？ [关闭]

Closed 这个问题是基于意见的 help closed questions 目前不接受答案使用 Angular Bootstrap 时有多种添加日期选择器控件的选择有更好的吗这是我发现的 HTML 5 日期输入类型不同浏览
在使用 Ant/Jenkins 时，如何查看同一 Java 项目的不同 Subversion 标签/分支？

这是我的开发配置颠覆之下我有我的project X trunk 带有我最新的开发人员我有我的project X tags 具有不同的版本我正在考虑添加一个分支文件夹我正在使用 Jenkins 使用 Ant 脚本构建我的projec
Java中的引用变量到底是什么？它与其他变量有何不同？

我一直在研究 Java 中的继承作者声明被引用的对象类型而不是引用变量的类型决定了将执行哪个版本的重写方法这种说法非常令人困惑这本书所指的是多态性更具体地通过动态调度简而言之想象一下以下类 public class Per
Spring Data MongoDB 支持枚举吗？

对于Java枚举类型我了解到MongoDB有两种解决方案序列化 http www vineetmanohar com 2010 01 3 ways to serialize java enums and 使用 Jackson 的 Obj
如何将模块化 Sinatra 应用程序部署到 Heroku？

由于某种原因我无法访问公共目录中的任何文件未发现错误我不会把public显然 URL 中的一部分查看GitHub 上的 Lovers 源代码存储库 https github com mattdipasquale loversapp
PDO::debugDumpParams 的输出是否有最大值？

使用 PDO debugDumpParams 时对于选定查询输出显示的字符数是否有最大限制大约 500 个字符后查询将在查询中间结束而在输出准备 query 变量时将显示完整的查询此外当删除查询的某些部分时它仍然显示一
在 google Vision OCR 中被识别为单个单词的特殊字符？

我试图让谷歌视觉 OCR 正则表达式可搜索我已经完成了它并且当文档仅包含英文字符时效果很好但当有其他语言的文本时它就会失败发生这种情况是因为我在谷歌视觉单词组件中只有英文字符如下所示 VISION API WORD COUNTE

在 google Vision OCR 中被识别为单个单词的特殊字符？

在 google Vision OCR 中被识别为单个单词的特殊字符？ 的相关文章

随机推荐

热门标签

在 google Vision OCR 中被识别为单个单词的特殊字符？的相关文章