OCR常用公开数据集整理

2023-11-04

OCR常用的数据集

在这个代码仓库里,提供了常用的OCR检测和识别中的通用公开数据集的下载链接。并且提供了json标签转成.txt标签的代码和转换好的.txt标签。

该项目的详细github地址如下:https://github.com/zcswdt/OCR_ICDAR_label_revise

数据集介绍

数据集 数据介绍 标注格式 下载地址
ICDAR_2013 语言: 英文 train:229 test:233 x1 y1 x2 y2 text 下载链接1.
ICDAR_2015 语言: 英文 train:1000 test:500 x1,y1,x2,y2,x3,y3,x4,y4,text 下载链接2.
ICDAR2017-MLT 语言: 混合 train:7200 test:1800 x1,y1,x2,y2,x3,y3,x4,y4,text 下载链接3. 提取码: z9ey
ICDAR2017-RCTW 语言: 混合 train:8034 test:4229 x1,y1,x2,y2,x3,y3,x4,y4,<识别难易程度>,text 下载链接4
天池比赛2018 语言: 混合 train:10000 test:10000 x1,y1,x2,y2,x3,y3,x4,y4,text 检测5识别6
ICDAR2019-MLT 语言: 混合 train:10000 test:10000 x1,y1,x2,y2,x3,y3,x4,y4,语言类别,text 下载链接7. 提取码: xofo
ICDAR2019-LSVT 语言: 混合 train:30000 test:20000 json格式标签 下载链接8
ICDAR2019-ReCTS 语言: 混合 train:20000 test:5000 json格式标签 下载链接9
ICDAR2019-ArT 语言: 混合 train:5603 test:4563 json格式标签 下载链接10
Synth800k 语言: 英文 80k 基于字符标注 下载链接11
360万中文数据集 语言: 中文 360k 每张图片由10个字符构成 下载链接12. 提取码:lu7m
中文街景数据集CTW 语言:中文 32285 基于字符标注的中文街景图片 下载链接13
百度中文场景文字识别 语言: 混合 29万 下载链接14

数据集标签的修正与更改

1.ICDAR2019-MLT

由于在ICDAR2019-MLT数据中存在着人为坐标点标错,这在训练文字检测模型计算文字区域会存在报错,所以本仓库对该数据集进行清洗并且最后到新的数据集。ICDAR2019-MLT新. 提取码:3y8q
在这里插入图片描述

温馨提示

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

OCR常用公开数据集整理 的相关文章

随机推荐

  • 【MATLAB第60期】【更新中】基于MATLAB的ARMAX具有外生回归因子的移动平均自回归模型

    MATLAB第60期 更新中 基于MATLAB的ARMAX具有外生回归因子的移动平均自回归模型 版本更新 2023 7 29版本 1 增加自定义参数 方便直接套数据运行 pre num 3 预采样数据个数 learn pr 0 85 训练数
  • 【Antlr】WHITESPACE is not a recognized channel name

    1 背景 antlr4 权威指南中的文件 第十二章 Simple statically typed programming language with functions and variables taken from Language
  • 51单片机 并行I/O端口介绍

    在51单片机中 共有32只I O引脚 分属于4个端口 P0 P3 端口的功能介绍 1 可作为并行I O输入通道 例如按键开关连接通路 图中P1端口的作用便是作为并行I O输入通道 2 可作为并行I O输出通道 例如 数码显示器 图中P2端口
  • 重写equals()方法

    1 如果想把持久类的实例放入set中 多值关联时 1对多 建议实现equals和hashcode2 想重用托管实例时 也要实现equals和hashcode 3 多个字段组合作为联合主键 必须实现equals和hashcode方法 equa
  • Pycharm安装opencv的几种办法(windows下)

    Pycharm安装opencv的几种方法 之前在默认环境中用pip安装过一次opencv 当时就是参考别人方法弄 稀里糊涂的 然后今天想在自己别的环境下 tensorflow 下安装终于弄懂了一些 暂时发现了几种安装的方法 特此记录下 方法
  • 基于XGBoost-LSTM的天然气价格预测研究(Python代码实现)

    个人主页 研学社的博客 欢迎来到本博客 博主优势 博客内容尽量做到思维缜密 逻辑清晰 为了方便读者 座右铭 行百里者 半于九十 本文目录如下 目录 1 概述 2 运行结果 3 参考文献 4 Python代码实现 1 概述 预测成本模型是开发
  • 调试最长的一帧(第八天)

    先看看总体进度 先获取所有的图形上下文 然后进行checkEvents 请求分发消息并通过takeEvents 获取交互事件 再交由GUIEventHandler处理交互事件 中间的步骤 在checkeEvents里面 消息分发函数 消息处
  • java.lang.IllegalThreadStateException异常原因解析

    同一个Thread不能重复调用start方法 要 implements Runnable 通过使用匿名对象 如new Thread new MyThread start 可多次调用 public class test public stat
  • IOS自动打包

    打包过程 xcodebuild负责将工程源文件编译成xxx app xcrun负责给xxx app 签名并 打包成xxx ipa 第一步清理 xcodebuild clean 第二步编译 xcodebuild 第三步打包 xcrun sdk
  • ECC椭圆曲线加解密原理详解(配图)

    ECC椭圆曲线加解密原理详解 配图 本文主要参照 ECC加密算法入门介绍及 ECC椭圆曲线详解 有具体实例 前言 椭圆曲线 ECC 加密原理跟RSA加解密原理比起来 可真是晦涩难懂 拜读了Kalafinaian的文章 ECC椭圆曲线详解 有
  • Docker进入容器命令

    docker exec it 容器名称 bash 输入 exit 退出容器
  • No module named 'tensorflow.contrib'

    命令行报错如下 import tensorflow contrib slim as slim ModuleNotFoundError No module named tensorflow contrib tensorflow 2 0以后没有
  • (Struts2学习篇) Struts2数据校验之一

    数据校验的意义 WEB数据收集的复杂性 客户数据输入的误操作 其他恶意攻击 struts2数据校验的方法 客户端校验和服务端校验 客户端校验是指 在HTML画面上自动生成JavaScript校验代码 在用户提交到服务器之前在客户端浏览器中进
  • jq校验复选框是否选择了

    jq校验复选框是否选择了 var arr sup input checkbox name custom brand ids checked each function i arr sup i this val if arr sup leng
  • remote: Support for password authentication was removed on August 13, 2021. Please use a personal ac

    报错 remote Support for password authentication was removed on August 13 2021 Please use a personal access token instead r
  • 安装Ubuntu20.04后时间不准

    安装Ubuntu20 04后时间不准 买了一台瘦客户机 原先是安装Windows操作系统的 后面安装Ubuntu20 04后导致时间一直有问题 不准 解决办法 1 安装 ntpdate sudo apt get install ntpdat
  • 超硬核!程序员10种副业赚钱之道,实现月收入增加20k!

    大家好 我是良许 经常有小伙伴问我说 良许 你的副业搞得那么溜 能不能给我们介绍一些可操作性的副业 让我们在让我们在工作之余能有另外一份收入 为了响应大家的需求 本文我就整理了一些我所知道的适合程序员的副业 向大家做一个分享 这些副业 每个
  • Node.js一些报错的解决方案

    安装 https blog csdn net qq 48485223 article details 122709354 报错1 查询版本 npm v npm WARN logfile could not create logs dir E
  • Json的格式规范

    解决报错 Resolved org springframework web HttpMediaTypeNotSupportedException Content type application x www form urlencoded
  • OCR常用公开数据集整理

    OCR常用的数据集 在这个代码仓库里 提供了常用的OCR检测和识别中的通用公开数据集的下载链接 并且提供了json标签转成 txt标签的代码和转换好的 txt标签 该项目的详细github地址如下 https github com zcsw