python识别图像中的文字

2023-11-18

我们想识别图像中对我们有用的评论，所以需要卡一个阈值来仅仅获得对我们有用的信息


import easyocr

# 创建reader对象
import json
reader = easyocr.Reader(['en'])
result_list = reader.readtext('review2.png')
def use_result_list_to_recentangle(result_list):
    pos_list = []
    text_list = []
    for sample in result_list:
        if int(sample[0][1][0])>560:
            pos_list.append(sample[0])
            text_list.append(sample[1])
    return pos_list,text_list

def get_important_information(pos_list,text_list):
    tmp_sample = {}
    content = ''
    all_samples = []
    flag = 'review_background'
    for index in range(len(text_list)):
        if 'Reviewed in the' in text_list[index]:
            place = text_list[index]
            title = text_list[index-1]
            tmp_sample['title'] = title
            tmp_sample['place'] = place
            
        if 'Color' in text_list[index]:
            color = text_list[index]
            tmp_sample['color'] = color
        if flag == 'content':
            content += text_list[index]
        if 'Purchase' in text_list[index]:
            Verify_purchase = text_list[index]
            tmp_sample['Verify_purchase'] = Verify_purchase
            flag = 'content'

        if 'Helpful' == text_list[index]:
            flag = 'review_background'
            tmp_sample['content'] = content
            all_samples.append(tmp_sample)
            content = ''
            tmp_sample = {}
    return all_samples

            

pos_list,text_list = use_result_list_to_recentangle(result_list)
all_samples = get_important_information(pos_list,text_list)
json_path = '/cloud/cloud_disk/users/huh/nlp/vision-reptile/vision_reptile/data/result.json'
out_file = open(json_path, "w")
json.dump(all_samples, out_file, indent=6)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

NLP

OCR

python识别图像中的文字的相关文章

下载变压器模型以供离线使用

我有一个训练有素的 Transformer NER 模型我想在未连接到互联网的机器上使用它加载此类模型时当前会将缓存文件下载到 cache 文件夹要离线加载并运行模型需要将 cache 文件夹中的文件复制到离线机器上然而这些文
python 中单词的动名词形式

我想获得字符串的动名词形式我还没有找到调用库来获取动名词的直接方法我应用了以 ing 结尾的单词的规则但是因为异常导致我收到了一些错误然后我检查 cmu 单词以确保生成的动名词单词正确代码如下 import cmudict im
比较文本文档含义的最佳方法？

我正在尝试找到使用人工智能和机器学习方法来比较两个文本文档的最佳方法我使用了 TF IDF Cosine 相似度和其他相似度度量但这会在单词或 n gram 级别上比较文档我正在寻找一种方法来比较meaning的文件最好的方法是什
从图像中识别数字

我正在尝试编写一个应用程序来查找图像内的数字并将它们相加如何识别图像中的书写数字图像中有很多框我需要获取左侧的数字并将它们相加得出总数我怎样才能实现这个目标编辑我对图像进行了 java tesseract ocr 但没有得到任何
target_vocab_size 在方法 tfds.features.text.SubwordTextEncoder.build_from_corpus 中到底意味着什么？

根据这个链接 https www tensorflow org datasets api docs python tfds features text SubwordTextEncoder build from corpus target
Spacy 中的自定义句子分割

I want spaCy使用我提供的句子分割边界而不是它自己的处理例如 get sentences Bob meets Alice SentBoundary They play together gt Bob meets Alice Th
将 python NLTK 解析树保存到图像文件[重复]

这个问题在这里已经有答案了这可能会复制这个 stackoverflowquestion https stackoverflow com questions 23429117 saving nltk drawn parse tree to
Node2vec 的工作原理

我一直在读关于node2vec https cs stanford edu jure pubs node2vec kdd16 pdf嵌入算法我有点困惑它是如何工作的作为参考 node2vec 由 p 和 q 参数化并通过模拟来自节点的
SpaCy 模型“en_core_web_sm”的词汇量大小

我尝试在 SpaCy 小模型中查看词汇量 model name en core web sm nlpp spacy load model name len list nlpp vocab strings 只给了我 1185 个单词我也在同
将复数名词转换为单数名词

如何使用 R 将复数名词转换为单数名词我使用 tagPOS 函数来标记每个文本然后提取所有标记为 NNS 的复数名词但是如果我想将这些复数名词转换为单数该怎么办 library openNLP library tm acq o lt
如何提取图像中的表格

我想从图像中提取表格这个 python 模块https pypi org project ExtractTable https pypi org project ExtractTable 与他们的网站https www extractta
gensim如何计算doc2vec段落向量

我正在看这篇论文http cs stanford edu quocle paragraph vector pdf http cs stanford edu quocle paragraph vector pdf 它指出段落向量和词向量被平
快速 shell 命令删除文本文件中的停用词

我有一个 2GB 的文本文件我正在尝试从此文件中删除经常出现的英语停用词我有 stopwords txt 包含这样的 a an the for and I 使用 shell 命令例如 tr sed 或 awk 执行此操作的快速方法是什
NLTK 中的 wordnet lemmatizer 不适用于副词 [重复]

这个问题在这里已经有答案了 from nltk stem import WordNetLemmatizer x WordNetLemmatizer x lemmatize angrily pos r Out 41 angrily 这是 nl
保存具有自定义前向功能的 Bert 模型并将其置于 Huggingface 上

我创建了自己的 BertClassifier 模型从预训练开始然后添加由不同层组成的我自己的分类头微调后我想使用 model save pretrained 保存模型但是当我打印它并从预训练上传时我看不到我的分类器头代码如下
Tess4j 问题 java.lang.UnsatisfiedLinkError

我正在尝试解决 Tess4J 安装问题 1 我在 WEB INF win32 x86 中创建了一个文件夹2 我把 libtesseract302 dll 和 liblept168 dll 放在那里然后将其添加到 java 构建路径中的源
如何去除给定图像中的噪声，使 ocr 输出完美？

我已经对这个孟加拉文本图像进行了大津阈值处理并使用 tesseract 进行 OCR 但输出非常糟糕我应该应用什么预处理来消除噪音我也想校正图像因为它有轻微的倾斜我的代码如下 import tesserocr from PIL i
验证 Transformer 中多头注意力的实现

我已经实施了MultiAttention head in Transformers 周围有太多的实现所以很混乱有人可以验证我的实施是否正确 DotProductAttention 引用自 https www tensorflow org
用于词性标记的优秀 Java 库是什么？ [关闭]

就目前情况而言这个问题不太适合我们的问答形式我们希望答案得到事实参考资料或专业知识的支持但这个问题可能会引发辩论争论民意调查或扩展讨论如果您觉得这个问题可以改进并可能重新开放访问帮助中心 help reopen questi
如何从 Pandas DataFrame 转换为 Tensorflow BatchDataset 以进行 NLP？

老实说我想弄清楚如何转换数据集格式 pandasDataFrame或 numpy 数组转换为简单文本分类张量流模型可以训练用于情感分析的形式我使用的数据集类似于 IMDB 包含文本和标签正面或负面我看过的每个教程要么以不同的方式

随机推荐

Quartz 体系结构

Quartz的体系结构 Quartz的重要组件 Scheduler 用于与调度程序交互的主程序接口 Scheduler调度程序任务执行计划表只有安排进执行计划的任务Job 通过scheduler scheduleJob方法安排进执行计划
TFT-LCD显示屏工作原理图文解析

一直很好奇手机屏幕的显示原理这是LCD的 OLED 屏幕的与此不同直接贴上原文链接 http www 58display com article zixun 208 html 以下是复制的原文液晶显示器是什么不同的应用环境有不同的
C++-对四个智能指针：shared_ptr,unique_ptr,weak_ptr,auto_ptr的理解

回答如下 C 的智能指针是一种特殊类型的指针其主要目的是自动跟踪内存分配和释放以避免程序中出现内存泄露或空悬指针等问题主要采用的技术是借助于类的生命周期当超出了类的作用域时类对象会自动调用析构函数然后就可以释放内存等资源无
Mac M1安装Homebrew 简单实用

1 首先创建安装目录 sudo mkdir p opt homebrew 2 将目录属主修改为当前用户方便直接实用brew install sudo chown R whoami opt homebrew 3 进入 opt文件夹 cd o
第08章 Spring-Boot 使用简介

第08章 Spring Boot 简介 Spring框架功能很强大但是就算是一个很简单的项目我们也要配置很多东西因此就有了Spring Boot框架它的作用很简单就是帮我们自动配置 Spring Boot框架的核心就是自动配置只
轻量级自动化测试框架WebZ

一什么是WebZ WebZ是我用Python写的关键字驱动的自动化测试框架基于WebDriver 设计该框架的初衷是用自动化测试让测试人员从一些简单却重复的测试中解放出来之所以用关键字驱动模式是因为我觉得这样能让测试人员测
数据库中索引会失效的几种情况（oracle）

文章目录数据库中索引会失效的几种情况 oracle 1 没有 WHERE 子句 2 使用 IS NULL 和 IS NOT NULL 3 WHERE 子句中使用函数 4 使用 LIKE T 进行模糊查询 5 WHERE 子句中使用不等于操
输入两个正整数，输出它们的最大公约数和最小公倍数

include
python 列表元组字典集合相关知识

python 数据类型列表可变数据类型列表的创建或者 list 列表的索引由下标0开始最后一个为 1 列表的切片 list start end step 列表的计算支持等方法列表的方法格式列表名称方法名字 index
如何结束8080端口的进程

1 找到8080端口进程 win r 输入cmd打开终端窗口输入netstat aon findstr 8080 找出所有的进程 2 结束对应的进程 taskkill F PID 53408
tinymce 去掉编辑器换行默认增加的p标签

问题 tinymce 编辑器里面使用回车换行后会自动添加p标签解决方法增加forced root block这个属性替换为空后换行就没有p标签了格式 forced root block 删除在tinymce中自动添加的p标签如下
HashMap中为何X % length = X & (length - 1)（求余%和与运算&转换问题）

目录一引出问题二结论三分析过程总结一引出问题在前面讲解 HashMap 的源码实现时有如下几点初始容量为 1 lt lt 4 也就是24 16 负载因子是0 75 当存入HashMap的元素占比超过整个容量的75 时
Pod控制器（一）ReplicaSet

目录 1 关于Pod控制器 1 1Pod控制器概述 1 2 控制器与Pod对象 1 3 ReplicaSet控制器 1 3 1 ReplicaSet概述 1 3 2 创建ReplicaSet 1 3 3 ReplicaSet管控下的Pod对
ajax同步异步的具体事例,Ajax同步和异步(示例代码)

Ajax在默认情况下是异步执行的即其属性 async boolean 是否异步同步和异步的区别同步 Client 向 Server请求数据直到该部分数据返回时 Client在请求返回值后的相应程序队列才会按顺序执行在此期间 Cli
微信小程序车牌号输入组件

概述一个小组件用于方便用户输入车牌号码详细概述有时候我们开发过程中会遇到需要用户输入车牌号的情况让客户通过自带键盘输入体验不好且容易出错例如车牌号是不能输入O和I的因此需要有一个自定义的键盘让客户输入正确的车牌号详细
基于MyApps低代码平台生成的CRM实现客户的高效管理

随着市场的发展客户开始变得越来越重要因此很多公司开始追求客户数量用尽浑身解数可盲目发展一股脑的想要扩大客户数量也导致企业无法对客户进行有效的管理不可避免地出现以下问题 1 没有对新客户做好分析也疏于老客户的管理导致客户流失的
基于Qt的OpenGL编程（3.x以上GLSL可编程管线版）---(十七)深度测试

Vries的教程是我看过的最好的可编程管线OpenGL教程没有之一其原地址如下 https learnopengl cn github io 04 20Advanced 20OpenGL 01 20Depth 20testing 关于深
双目标定（二）单目标定基本原理

主体思路先处理纯二维平面的畸变问题此处略过矫正图片后再来求解相机内外参数基本思路是求得每个标定板对应的单应矩阵再联合优化所有标定板数据得到相机内参矩阵再得到每个标定板对应的外参 1 标定板平面到像平面的单应矩阵H 则对于每个棋
短视频制作难度大吗？怎么剪辑短视频？

随着抖音快手等视频分享软件的兴起很多人已经开始尝试制作短视频分享那么对于视频制作新手来说短视频的制作难度大吗其实只要选对了视频制作软件视频制作将会变得相当简单在众多视频剪辑软件中会声会影因其丰富的视频制作功能直观的操作
python识别图像中的文字

我们想识别图像中对我们有用的评论所以需要卡一个阈值来仅仅获得对我们有用的信息 import easyocr 创建reader对象 import json reader easyocr Reader en result list reade

python识别图像中的文字

python识别图像中的文字 的相关文章

随机推荐

热门标签

python识别图像中的文字的相关文章