本人在工作生活中收集了各个方面比较多的真实的数据集如下:
一、手写中文数据集
1、档案类数据:
此数据集为手写档案数据,数量较大,大约128G,图像均未标注。
ex:
2、手写作文数据:
此数据集为手写作文数据,是大约800M左右,图像按行提供位置和内容标注,十分珍贵。
ex:
二、发票数据集:
1、增值税发票
此数据集包含了大量真实的增值税发票数据,大约9G,标注了发票位置数据,未提供详细标注。
ex:
2、购车发票
此数据集未提供标注。
ex:
三、快递单数据集:
此数据集包含了真实的快递单数据,大约3G,提供了详细的位置标注信息。
ex:
四、车牌数据:
此数据集包含了真实的车牌数据(黄牌、蓝牌、绿牌),大概10G,提供了车牌内容标注。
ex:
另外还有常用的tableBank、docBank等开源数据集,如果下载不便,我这也整理了。
由于发票和快递单数据中包含了部分个人敏感信息,传播出去可能会有问题,所以不便对外提供。除此之外,其他数据如果大家有需要的话,可以私信我。