百度OCR接口使用详细教程

2023-05-16

如何把图片、PDF文件中的文字进行识别提取，这个问题仿佛困扰了我们很多年，直到现在，当急需OCR功能时也没有一个快速、高效且免费的在线工具或软件能马上拿来用。

前阵子的工作中正好有这个需求，我要把一篇PDF格式论文中的表格内容提取出来，供数据可视化使用。这些表格包含少量文字和大量数字，说多不多，说少也不少，人工提取数字出错率比较高。这时候！我又想找个“在线OCR工具”了！

一些号称在线快速OCR的网页，广告横飞且速度慢，上传文件后无反应，大都是标题党骗点击赚广告费的…… 个别看起来比较正经的OCR软件，全都收费，由于我的需求不多，而且就用这么一两次，还是不愿意花这个钱的。这时候我突然想起来一直飘在广告位的「百度文字识别OCR」，万一有试用可以白嫖一下呢。果然有免费额度赠送！

除通用场景文字识别外，还提供卡证文字识别、财务票据文字识别、医疗票据文字识别、汽车场景文字识别、教育场景文字识别、iOCR自定义模板文字识别等OCR服务场景，每个类别下还有细分的服务API，但除通用场景以外的大都不提供免费额度。

于是我试用了一下四种通用文字识别的API，按照官方的文档一步步来就可以了，这里我简化一下使用流程，仅需三步，十分钟满足你的OCR需求！

第一步，注册一个百度账号（https://passport.baidu.com/v2/?reg），如果已有请直接登陆。登录后点击页面中的「创建应用」：

“应用名称”随便取一个就好，接口选择用默认就可以（通用文字识别服务已作默认勾选），应用归属选“个人”，最后简单写一下“应用描述”即可。

填写完毕后，点击“立即创建”就可以了。

点击“返回应用列表”，点击“显示”查看所创建应用的 Secret Key：

至此，API 就申请好了。这里申请到的 API Key 和 Secret Key 复杂存好，等下要在脚本中调用。

第二步，准备好你的数据，图片形式即可，以这张图举例（随手拍一张书页内容）：

最后一步，修改脚本中的 API_KEY 和 SECRET_KEY（第一步在应用列表里复制来的），然后修改你需要进行识别的图片路径 file_content，改完这三个参数，就可以运行脚本啦！

识别输出的文字结果如下：

完整的代码脚本可以参考官方指南（https://cloud.baidu.com/doc/OCR/s/dk3iqnq51），也可以参考我分解的 Jupyter 版，关注公众号「数据池塘」，回复「百度OCR」即可获取完整代码。

希望可以帮助到大家，祝顺利！

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

OCR

接口使用详细教程

百度OCR接口使用详细教程的相关文章

Python、pyPdf、Adobe PDF OCR 错误：不支持的过滤器 /lzwdecode

我的东西 python 2 6 64 位安装了 pyPdf 1 13 win32 exe 翼IDE Windows 7 64 位我收到以下错误 NotImplementedError 不支持的过滤器 LZWDecode 当我运行以下代码
是否有任何免费的 .NET OCR 库可以直接在应用程序窗口上执行 OCR？

我正在寻找一个免费的 NET OCR 库它能够对给定的应用程序窗口甚至内存中的图像进行 OCR 我可以自己拍摄应用程序窗口的快照我看过tessnet2 http pixel technology com freeware tessnet
Tesseract 虚假空间识别

我正在使用 tesseract 来识别序列号这是可以接受的存在常见问题例如错误识别零和 O 6 和 5 或 M 和 H 除此之外这个超正方体还向识别的单词添加了空格而图像中没有空格下图被识别为 HI 3H 这张图片的结果是 FB
【OCR】实战使用 - 如何提高识别文字的精准度？

实战使用如何提高文字识别的精准度我们在平常使用OCR的时候经常会出现文字识别不精准的情况我们改如何提高文字识别的精度呢以下是一些提高OCR Optical Character Recognition 光学字符识别文字识别精准度的
除了 Tesseract 之外还存在哪些 OCR 选项？ [关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心 help reopen questi
描边宽度变换 (SWT) 实现（Java、C#...）[关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我最近发现了笔划宽度变换如以下研究论文中所述使用笔划宽度变换检测自然场景中的文本 https ie
如何使用OCR（TesseractOCR）php库

我使用此链接克隆了 OCR 的 git 库 git clone git github com thiagoalessio tesseract ocr for php git 然后我只需按照以下步骤包含所需的文件example http th
识别图像中的 visio 形状

在提供 SCADA 解决方案时我们经常会获得结构化控制图如下所示的 visio 类似流程图中指定的最终用户规范这些规范通常以 PDF 格式或图像形式提交为了在 C 中访问这些我希望使用 OpenCV 库之一我正在研究模板识别
OCR 处理前的图像预处理

我当前的项目涉及将 pdf 中的文本转录为文本文件我首先尝试将图像文件直接放入 OCR 程序 tesseract 中但效果不佳原始图像文件基本上是旧报纸并且有一些背景噪音我确信 tesseract 存在问题因此我尝试在将图像输
目录：资产/tessdata

我从 github 下载了 OCR 文本识别器我的问题是我想在不在线的情况下启动我的应用程序但每次我在手机上安装 apk 时它都会开始下载英语和 tesseract OCR 引擎我找到了一个在线指南其中说我必须在资产文件夹中创建
使用Python从具有两列或三列数据的图像中使用OCR读取图像中的文本

在示例图像中仅作为参考我的图像将具有相同的图案一个页面具有完整的水平文本其他页面具有两个水平文本列如何在python中自动检测文档的模式并逐一读取另一列数据我将 Tesseract OCR 与 Psm 6 一起使用它是水平读取
Android Studio 上的 Android Tesseract OCR [关闭]

Closed 此问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案一段时间以来我一直在尝试将 tesseract 包含在 Android Studio 上的 Andro
使用 OpenCV 对 Tesseract OCR 进行图像预处理

我正在尝试开发一个应用程序它使用 Tesseract 来识别手机摄像头拍摄的文档中的文本我使用 OpenCV 来预处理图像以实现更好的识别应用高斯模糊和阈值方法进行二值化但结果非常糟糕 Here https s6 postimg c
图像中的文本检测

I am using below sample code for text detection in images not handwritten using coreml and vision https github com DrNeu
断言失败 - 训练 Tesseract

我正在尝试使用 Serak Tesseract Trainer 训练 tesseract https code google com p serak tesseract trainer https code google com p ser
从图像中识别数字

我正在尝试编写一个应用程序来查找图像内的数字并将它们相加如何识别图像中的书写数字图像中有很多框我需要获取左侧的数字并将它们相加得出总数我怎样才能实现这个目标编辑我对图像进行了 java tesseract ocr 但没有得到任何
Tesseract OCR 将削减的 0 混淆为 8

我已经在终点字体上训练了 tesseract 但无论如何我都无法让它识别 0 我正在使用 jTessEditor 创建训练 tif 和框即使在验证时它也会将所有 0 读取为 8 我有什么遗漏的吗下面是 0 的示例它将其读作 8 我
如何提取图像中的表格

我想从图像中提取表格这个 python 模块https pypi org project ExtractTable https pypi org project ExtractTable 与他们的网站https www extractta
使用 python 突出显示图像中的特定文本

我想突出显示网站屏幕截图中的特定单词句子截取屏幕截图后我使用提取文本pytesseract and cv2 效果很好我可以获得有关它的文本和数据 import pytesseract import cv2 if name main
如何去除给定图像中的噪声，使 ocr 输出完美？

我已经对这个孟加拉文本图像进行了大津阈值处理并使用 tesseract 进行 OCR 但输出非常糟糕我应该应用什么预处理来消除噪音我也想校正图像因为它有轻微的倾斜我的代码如下 import tesserocr from PIL i

随机推荐

mac版Sublime Text菜单如何汉化

1 打开Sublime Text xff0c 点击菜单栏中的 Sublime Text gt About Sublime Text xff0c 显示如图版本信息 xff1a 目前是4143版本 2 点击快捷键Shift 43 Command
如何使用国内镜像源下载安装python使用的软件包

如何使用国内镜像源下载安装python中使用的库使用镜像下载的会是安装的包的速度快很多 xff0c 下面简单介绍使用pip命令下载所用的包 xff0c 添加镜像下载的方法一方法例如 xff1a 使用pip命令安装numpy库 pip
Windows远程连接Ubuntu详细操作

一设置允许远程控制 1 在VMware中打开Ubuntu操作系统界面 2 点击搜索您的计算机图标 3 在搜索栏里输入 xff1a zhuo xff0c 搜索到桌面共享 4 点击桌面共享 xff0c 按照如下所示进行设置 xff1a
anaconda在cmd下无法使用的问题

使用anaconda的时候遇到这个问题 xff0c 在CMD界面下无法使用pip命令安装python模块 xff0c 提示错误信息 xff1a pip is configured with locations that require TL
双系统 Win10下安装Linux（单/双硬盘）

双系统 Win10下安装Linux xff08 单双硬盘 xff09 单硬盘CentosUbuntu准备工作正式安装Ubuntu系统踩坑双硬盘首先非常感谢博客作者们分享的双系统安装教程 xff0c 其中一些博客对笔者双系统的安装非常
mac使用命令升级node时提示sudo: n: command not found

mac使用命令升级node时提示sudo n command not found 一问题介绍 mac在使用命令升级node版本时提示sudo n command not found如下 span class token comment 命
在ubuntu-22.04-desktop下安装arm虚拟机(坑已踩完)

96 96 96 https mirror nju edu cn ubuntu releases 22 04 ubuntu 22 04 desktop amd64 iso 安装见百度 96 96 96 开启root登录和远程ssh 96 9
洛谷刷题记录——是题刷我不是我刷题

P1003 铺地毯思想是倒着读 xff0c 读到符合条件的就输出 span class token macro property span class token directive keyword include span span c
FireFox在哪里存储Cookies？

简单的问题 xff0c 但不是所有人都会知道答案实际上 xff0c Firefox 3 x确实将Cookies储存在以下文件夹中 C Documents and Settings your username Application Dat
01 ceph离线安装

一前置环境 1 修改主机名 xff0c 加入映射 2 关闭防火墙 xff0c selinux 3 配置本地yum源 4 集群时间同步 5 集群免密登录二配置本地ceph源本地epel源 1 安装httpd服务 xff0c 开机自启
conda安装包报错:The current user does not have write permissions to the target environment(当前用户没有写入权限）

问题 xff1a 在Winodws 10下使用conda安装第三方包时报错 xff1a EnvironmentNotWritableError The current user does not have write permissions
HJ5 进制转换

描述写出一个程序 xff0c 接受一个十六进制的数 xff0c 输出该数值的十进制表示数据范围 xff1a 保证结果在注意本题有多组输入输入描述 xff1a 输入一个十六进制的数值字符串注意 xff1a 一个用例会同时有多组输入数
Anaconda重新下载安装导致cmd无法打开（闪退）

Anaconda重新下载安装导致cmd无法打开 xff08 闪退 xff09 strong 写在前面 xff1a strong 由于自己的错误使用conda 导致conda崩掉 xff0c 于是自己重新下载安装conda xff0c 但是尴
tp5多文件域上传报错处理SplFileObject::__construct(/tmp/php4LYVI3)

我是同时两个file文件域 xff0c 报错 xff1a SplFileObject construct tmp php4LYVI3 failed to open stream No such file or directory 解决是 x
解决composer报错：Could not find a version of package xxx/yyy

解决composer报错 xff1a Could not find a version of package xxx yyy matching your minimum stability stable Require it with an
Linux防火墙iptables重启生效解决方案

输入完iptables t nat A PREROUTING p tcp dport 80 j REDIRECT to port 8080 后执行iptables save 注意 xff1a iptables save是连在一起的 xff
Docker安装Oracle数据库

一准备工作 1 安装docker ce xff08 有docker老版本也可以直接使用 xff09 安装依赖的软件包 yum install y yum utils device mapper persistent data lvm2 配
ubuntu20.04 -vm-扩展硬盘后30G后不能联网，没IP

之前虚拟机ssh连接没问题 xff0c 今天竟然连不上了打开虚拟机 ip a 网卡ens33没有ip root 64 ubuntu Desktop ip a 1 lo lt LOOPBACK UP LOWER UP gt mtu 6553
【数据库】navicat --oracle数据库创建

第一次登录 xff0c 与plsql相同 xff0c 以管理员身份登录图0 1 图0 2 请注意 xff0c 这里需要sysdba xff1f 1 navicat连接到数据库服务器上的本地或相同 xff0c 此屏幕快照演示了本地数据库
百度OCR接口使用详细教程

如何把图片 PDF文件中的文字进行识别提取 xff0c 这个问题仿佛困扰了我们很多年 xff0c 直到现在 xff0c 当急需OCR功能时也没有一个快速高效且免费的在线工具或软件能马上拿来用前阵子的工作中正好有这个需求 xff0c 我要

百度OCR接口使用详细教程

百度OCR接口使用详细教程 的相关文章

随机推荐

热门标签

百度OCR接口使用详细教程的相关文章