中如何调取api_sdk和api使用实例-OCR文字识别接入指南

2023-05-16

本篇文章将会手把手介绍sdk和apiOCR文字识别,以及如何通过不用手敲代码实现调取OCR的免费sdk服务,让大家深入了解深度学习以及sdk和api的调取实例

  • 首先,什么是OCR文字识别
  • OCR 是英文Optical Character Recognition的缩写,意思是光学字符识别,简单来说就是识别图片里的文字信息。”其应用方式有,身份证OCR、行驶证OCR、驾驶证OCR、营业执照OCR、银行卡OCR、手写体OCR、车牌OCR等。

其次,令大家困惑已久并傻傻分不清楚的sdk和api到底是什么?在《产品经理必懂的后端技术》中已经讲过:

还昏吗?用一个贴近生活的例子来解释

  • 有一杯密封饮料,它的名字叫做“SDK”。
  • 饮料上插着吸管,吸管的名字叫“API”。
  • 如果你想喝到SDK里的饮料(让系统拥有SDK中的功能),你必须通过API这根吸管来实现(通过API连接你的系统和SDK工具包),否则你就喝不到饮料

因此本篇文章的内容就是,如果你不想通过写代码来实现图片里的文字识别(OCR),那么你就可以通过调用大牛们已经训练好的超高精度的深度学习模型的软件开发包(sdk)应用程序接口(api)来达到你的目的。

如果想看实践的完整教学视频可以登录腾讯云大学的OCR 文字识别接入指引,若想直接上手操作可阅读全文。

OCR 文字识别接入指引 - 腾讯云大学​cloud.tencent.com

本文将通过在线调用sdkpython调用sdk两种方式实现OCR图像识别和提取以下周董的歌词《爱在西元前》图片文字。

1. 使用在线sdk调用

步骤一 登录腾讯云官网,点击产品人工智能产品通用文字识别

步骤二 点击右上方“接口文档”,查看api示例(ps产品经理必须一定要学会读api哦)。

文字识别产品界面

接口的参数有很多,其中最重要的是“Region(产品支持的地域)”“ImageUrl*(图片url地址)”

接口参数介绍

步骤三 刚刚那个界面一直拉到下面,点击API 3.0 Explorer,进入sdk调用界面

接口文档

步骤四 点击个人密钥查看文档,获取个人密钥(接口调用必须使用个人密钥)。

点击“查看文档”

步骤五 点击“新建密钥”,查看和复制SecretId”和“SecretKey”到sdk调用界面的对应位置。

步骤六 接着填写输入参数,只需填写“Region(产品支持的地域,选择离你所在地最近的地址)”“ImageUrl*(图片url地址)”,然后点击“在线调用”“发送请求”,即可获取OCR模型的文字提取结果。

ps. 图片的url地址可以右键任意一个网络上的图片获取

识别结果以json格式返回

看到了“《爱在西元前》”,及其x轴y轴坐标位置。

2. 使用python调用

不会码代码不要紧,通过刚刚的调用过程已经自动根据填写的“个人密钥”和“输入参数”生成了对应的Java、python、Node.js、PHP等语言的代码,下面以python为例。

步骤一 在刚刚那个界面点击“代码生成”,选择“python”,点击右上角的“python SDK使用说明”。

步骤二 根据教程在python中pip安装sdk

关于更多的pip技巧查看

小西小子:万能python pip install大法​zhuanlan.zhihu.com

步骤三 复制刚刚的代码,然后到python的IDE界面进行运行调用sdk,即可完成OCR图像识别!

成功!

自此手把手教会了如何介绍了sdk和api的概念,并用OCR深度学习算法模型进行了实践,大家紧赶动手实操,之后就可以举一反三实现更多AI黑科技

笔芯

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

中如何调取api_sdk和api使用实例-OCR文字识别接入指南 的相关文章

  • android studio 错误:缺少功能:WATCH

    我尝试在我的智能手表上使用 android studio 运行一个简单的应用程序 并收到以下消息 我的智能手表运行 Android 4 4 2 其 API 级别为 19 我尝试过但没有帮助的事情 将最低 SDK 版本更改为 API 19 r
  • 无法启动 UI Automator 查看器

    我无法启动 UI Automator 查看器 任何人都可以帮助我吗 我怎样才能启动它 当我双击 uiautomatorviewer 一段时间时 黑色窗口打开但自动关闭 即使我在 Windows 路径变量中设置了变量 ANDROID HOME
  • 增加 Instagram API 350 个请求限制

    根据开发人员文档 客户端每小时可以发出 5000 个请求 但目前我的应用程序被限制为每小时 350 个请求 我收到的错误代码是 400 消息是 已超出每小时最大请求数 您在过去一小时内发出了 XXX 个请求 超过了允许的 350 个请求 您
  • 将 Dwolla 与 PHP 及其 API 集成

    前言 好吧 我过去使用过 API 例如 TwitterAPI 但我总是使用库和一些文档来帮助我进行连接和检索令牌 我对 API 的工作原理有了基本的了解 好的 我尝试了多种使用 PHP 请求 dwolla API 的方法 我尝试过制作一个
  • 如何以编程方式在 Google 文档中创建文档?

    The Google 文档列表 API 的文档 http code google com apis documents overview html 好像说可以创建本地文档并上传 有没有办法实际创建和编辑文档on通过 API 的 Google
  • Tesseract OCR 将削减的 0 混淆为 8

    我已经在终点字体上训练了 tesseract 但无论如何 我都无法让它识别 0 我正在使用 jTessEditor 创建训练 tif 和框 即使在验证时 它也会将所有 0 读取为 8 我有什么遗漏的吗 下面是 0 的示例 它将其读作 8 我
  • Rails:使用 RestClient 的外部 API 集成(未定义的局部变量或方法“user”)

    我正在建设一个数字图书馆 我已经完成了很多需要的功能 我目前在将数字图书馆与学习管理系统 LMS 集成时遇到问题 我已经有一个数字图书馆的管理员身份验证系统 使用设计宝石 我的目标是允许想要访问数字图书馆的用户使用其学习管理系统 LMS 凭
  • 从 Django Rest Framework 中的令牌获取经过身份验证的用户

    我是 Django 新手 我已经成功使用 DRF 构建了一个小型 API 我的 angular js 客户端发布了用户身份验证详细信息 DRF 返回一个令牌 如下所示 token 9944b09199c62bcf9418ad846dd0e4
  • 如何提取图像中的表格

    我想从图像中提取表格 这个 python 模块https pypi org project ExtractTable https pypi org project ExtractTable 与他们的网站https www extractta
  • 响应中的有效 JSON

    我正在开发客户端和服务器应用程序 遇到了一个有趣的问题 我们正在创建一个 Restful API 并通过 JSON 响应与客户端进行通信 执行 DELETE 时 我们将返回 200 OK 和空白响应 我们的客户收到 200 OK 但解析 J
  • 如何修复无效的 API 密钥、IP 或操作权限错误?

    这是币安加密货币交易所 API 我试图获取帐户信息 但我无法做到这一点 它是官方 C Api 这是github链接 https github com binance exchange binacpp 这是终端上的错误 回答问题时 请轻松一点
  • ReSharper API...呃...它在哪里?

    好吧 我一定正在享受金发时刻 但我一生都找不到去哪里 下载 ReSharper API 与我获得的项目一起使用here http devlicio us blogs hadi hariri archive 2010 01 12 writin
  • PyCurl 请求在执行时无限挂起

    我编写了一个脚本来从 Qualys 获取扫描结果 每周运行一次以收集指标 该脚本的第一部分涉及获取过去一周运行的每个扫描的引用列表以进行进一步处理 问题是 虽然有时这会完美地工作 但有时脚本会挂在c perform 线 手动运行脚本时这是可
  • 在 SDK 中找不到文件夹“tools”

    我在做安卓开发使用 Eclipse 我已经下载了所有必需的软件 但遇到了与中讨论的相同的问题 无法在 Eclipse 中设置 Android Target https stackoverflow com questions 6384328
  • 用于分享帖子的 Yammers REST API

    我想使用 REST API 从我的业务应用程序共享帖子 不是发布新消息 而是共享现有帖子 有谁知道要使用哪个端点以及如何实现它 当您使用 Yammer API 创建新帖子时 请将参数 shared message id 与要共享的消息的 m
  • 在 google Vision OCR 中被识别为单个单词的特殊字符?

    我试图让谷歌视觉 OCR 正则表达式可搜索 我已经完成了它 并且当文档仅包含英文字符时效果很好 但当有其他语言的文本时 它就会失败 发生这种情况是因为我在谷歌视觉单词组件中只有英文字符 如下所示 VISION API WORD COUNTE
  • Android Studio 不允许我更改 SDK 位置

    我打开 Android Studio 然后我打开 SDK 管理器 我拥有最新版本 但是我的 SDK 平台需要 Android 6 0 它甚至不让我点击任何东西 在此图像中 您可以看到文本和复选框变色 我无法单击 SDK 平台内的任何内容 甚
  • 提高 pytesseract 从图像中正确识别文本的能力

    我正在尝试使用读取验证码pytesseract模块 大多数时候它都能提供准确的文本 但并非总是如此 这是读取图像 操作图像以及从图像中提取文本的代码 import cv2 import numpy as np import pytesser
  • 在react.js中调用API渲染数组图片

    我有 API 其中包括 pictures http storage web source images 2016 10 28 edac054f88fd16aee7bc144545fea4b2 jpg http storage web sou
  • 如何自动更新Android Studio?

    我需要将 Android Studio 更新到 0 9 9 版本 但是当我按 下载 在更新信息对话框上 时 它会将我发送到此处 http developer android com sdk index html http developer

随机推荐