opencv3+python3.5成语填字游戏（一）印刷体汉字的分割

2023-11-09

首先这是一个成语填字游戏，大概就是一张成语填字游戏图片，通过opencv图像识别后转为矩阵，再通过解算法，解出答案，在显示到图片上。

源代码：https://github.com/mayue801/crossword-puzzle--idiom

本文采用投影分割法对印刷体汉字进行分割。

投影分割是先水平方向投影，在竖直方向投影，或者先竖直方向再水平方向投影。本文选用先竖直，再水平。

1.竖直投影。

------------

----------------

代码：

#针对的是印刷版的汉字，所以采用了投影法分割
#此函数是行分割，结果是一行文字
def YShadow(path):
    img  = cv2.imread(path)   #原图像
    gray = cv2.cvtColor(img,cv2.COLOR_BGR2GRAY) #灰度图像
    height,width = img.shape[:2]
    
    #blur = cv2.GaussianBlur(gray,(5,5),0) #高斯模糊
    
    blur = cv2.blur(gray,(8,8)) #均值模糊
    thresh = cv2.adaptiveThreshold(blur,255,1,1,11,2)  #自适应阈值分割
    temp = thresh
    
    if(width > 500 and height > 400): #图像字体较小时，需要进行膨胀操作
        kernel = np.ones((5,5),np.uint8) #卷积核
        dilation = cv2.dilate(thresh,kernel,iterations = 1) #膨胀操作使得单个文字图像被黑像素填充
        temp = dilation
    
    '''
    cv2.imshow('image',temp)
    cv2.waitKey(0)
    cv2.destroyAllWindows()
    '''
    
    perPixelValue = 1 #每个像素的值
    projectValArry = np.zeros(width, np.int8) #创建一个用于储存每列黑色像素个数的数组


    for i in range(0,height):
        for j in range(0,width):
            perPixelValue = temp[i,j]
            if (perPixelValue == 255): #如果是黑字，对应位置的值+1
                projectValArry[i] += 1
       # print(projectValArry[i])
            
    canvas = np.zeros((height,width), dtype="uint8")
    
    for i in range(0,height):
        for j in range(0,width):
            perPixelValue = 255 #白色背景
            canvas[i, j] = perPixelValue
   

    for i in range(0,height):
        for j in range(0,projectValArry[i]):
            perPixelValue = 0 #黑色直方图投影
            canvas[i, width-j-1] = perPixelValue
    '''
    cv2.imshow('canvas',canvas)
    cv2.waitKey(0)
    cv2.destroyAllWindows()
    '''
    
    list = []
    startIndex = 0 #记录进入字符区的索引  
    endIndex = 0 #记录进入空白区域的索引  
    inBlock = 0 #是否遍历到了字符区内  


    for i in range(height):
        if (inBlock == 0 and projectValArry[i] != 0): #进入字符区
            inBlock = 1  
            startIndex = i
        elif (inBlock == 1 and projectValArry[i] == 0):#进入空白区
            endIndex = i
            inBlock = 0
            subImg = gray[startIndex:endIndex+1,0:width] #将对应字的图片截取下来
            #print(startIndex,endIndex+1)
            list.append(subImg)#添加这个字图像到list
    #print(len(list))
    return list

2.水平投影

------------------------

------------------

#对行字进行单个字的分割
def XShadow(path):
    img  = cv2.imread(path)       
    gray = cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)
    height,width = img.shape[:2]
   # print(height,width)
    #blur = cv2.GaussianBlur(gray,(5,5),0)
    
    blur = cv2.blur(gray,(8,8))
    thresh = cv2.adaptiveThreshold(blur,255,1,1,11,2) 
    
    if(width > 500):
        kernel = np.ones((4, 4),np.uint8) #卷积核
    else:
        kernel = np.ones((2, 2),np.uint8) #卷积核
    dilation = cv2.dilate(thresh,kernel,iterations = 1) #膨胀操作使得单个文字图像被黑像素填充
    
    '''
    cv2.imshow('image',thresh)
    cv2.waitKey(0)
    cv2.destroyAllWindows()
    '''
    
    perPixelValue = 1 #每个像素的值
    projectValArry = np.zeros(width, np.int8) #创建一个用于储存每列黑色像素个数的数组


    for i in range(0,width):
        for j in range(0,height):
            perPixelValue = dilation[j,i]
            if (perPixelValue == 255): #如果是黑字
                projectValArry[i] += 1
       # print(projectValArry[i])
            
    canvas = np.zeros((height,width), dtype="uint8")
    
    for i in range(0,width):
        for j in range(0,height):
            perPixelValue = 255 #白色背景
            canvas[j, i] = perPixelValue
   

    for i in range(0,width):
        for j in range(0,projectValArry[i]):
            perPixelValue = 0 #黑色直方图投影
            canvas[height-j-1, i] = perPixelValue
    '''
    cv2.imshow('canvas',canvas)
    cv2.waitKey(0)
    cv2.destroyAllWindows()
    '''
    
    list = []
    startIndex = 0 #记录进入字符区的索引  
    endIndex = 0 #记录进入空白区域的索引  
    inBlock = 0 #是否遍历到了字符区内  


    for i in range(width):
        if (inBlock == 0 and projectValArry[i] != 0): #进入字符区
            inBlock = 1  
            startIndex = i
        elif (inBlock == 1 and projectValArry[i] == 0): #进入投影区
            endIndex = i
            inBlock = 0
            #subImg = gray[0:height, startIndex:endIndex+1] #endIndex+1
            #print(startIndex,endIndex+1)
            list.append([startIndex, 0, endIndex-startIndex-1, height])
    #print(len(list))
    return list

分割完后，将对应图片样本存储到对应文件夹，每个字共10种样本

将这些样本及标记保存后，分别加载到samples.npy, label.npy中。供后续的机器学习算法训练使用。

下篇讲解填字图片汉字的提取与机器学习算法训练样本，识别汉字的过程。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python3x

opencv3

opencv3+python3.5成语填字游戏（一）印刷体汉字的分割的相关文章

Pyramid 调试工具栏通过 HTTP 而不是 HTTPS 提供静态内容

在我们的测试服务器上我们使用金字塔调试工具栏 http docs pylonsproject org projects pyramid debugtoolbar en latest 但是它生成http 指向静态内容如 CSS 和 Ja
Python pandas：删除字符串中分隔符之后的所有内容

我有数据框其中包含例如 vendor a ProductA vendor b ProductA vendor a Productb 我需要删除所有内容包括两个以便我最终得到 vendor a vendor b vendor a 我尝
在Python中将罗马数字转换为整数

根据 user2486 所说这是我当前的代码 def romanMap map M 1000 CM 900 D 500 CD 400 C 100 XC 90 L 50 XL 40 X 10 IX 9 V 5 V 4 I 1 return
为什么 tkinter 在 Mac 上失败

我在 Mac 上使用 tkinter 但是当我使用以下简单代码时计算机将重新启动 import tkinter as tk window tk Tk 问题是什么谢谢你 Mac 莫哈韦沙漠版本 10 14 6 tkinter 版本 8
Python ctypes from_buffer 使用上下文管理器映射到内存映射文件（mmap）

我在用着ctypes from buffer 将 ctypes 结构映射到内存映射文件以执行某些任务通常这些文件包含结构化标头和二进制数据的串联 ctypes 结构允许稳定的二进制表示和对字段的简单 Python 访问在这方面是真正的
Windows 10 conda 未被识别为内部或外部命令

试着 conda install c conda forge requests futures 0 9 7 但失败了 conda is not recognized as an internal or external command C
使用 rpy2 将 NULL 从 Python 转换为 R

在 R 中经常NULL值用作默认值使用 Python 和 RPy2 如何显式提供NULL争论 None不可兑换 NotImplementedError 字符串 NULL 只会被转换为字符串并在执行过程中导致错误采取以下示例使用tsi
有什么理由不在Python中混合使用多处理和线程模块

我正在考虑使用Python来实现一个需要大量多线程的程序另一个要求是它将在桌面上运行因此拥有许多进程将使应用程序显得混乱且难以杀死在任务管理器中因此我正在考虑使用线程和多处理模块来减少进程数量据我了解 GIL 仅适用于单个进程
为什么变量不在循环外更新？

无法弄清楚为什么结果中的第一个键是 abc 而不是我期望的 c 我使用的是Python 3 6 4 数据结构很奇怪因为我删除了不相关的键和值 f replace ab r data abc 1 def 2 ghi 3 jkf 4 lmn
Python SQLAlchemy 用户身份验证失败

我尝试使用 SQLAlchemy 连接 PostgreSQL 数据库我创建了一个像这样的新角色首先我使用以下命令登录到 postgres 帐户 sudo i u postgres 接下来发出命令 createuser interac
不可能通过简单地返回它们来链接本机异步协程

我一直在使用 py3 4 的基于生成器的协程并且在几个地方我通过简单地进行一个协程调用来链接它们return inner coroutine 如下例所示但是我现在将它们转换为使用 py3 5 的本机协程并且我发现它不再起作用因为内
Qt WebEngine 中 QWebInspector 的替代品是什么？

代码片段的示例在这里 from PySide2 import QtCore QtGui QtWidgets QtWebChannel from PySide2 QtWebEngineWidgets import QWebEngineView
Numpy ，Python3.6 - 无法理解为什么地址不同？

这是我的代码 my array 1 np arange 25 reshape 5 5 print my array 1 my array red my array 1 1 2 print my array red my array blue
哪些 2to3 修复程序输出有效的 Python 2 代码？

2to3 是一个 Python 程序它读取 Python 2 x 源代码并应用一系列修复程序将其转换为有效的 Python 3 x 代码考虑一下列出的四十个修复者https docs python org 3 library 2to3
发送fulfillmentText并使用followupEventInput转移到另一个意图

我使用 Python Flask 设置了一个简单的 Webhook 来处理各种 Dialogflow 功能在这一点上一切都进展顺利该机器人通过 DialogFlow API V2 集成到 Facebook Messenger 问题是关
Django Rest Framework 完整性错误捕获

在 Django Rest Framework 中我使用了序列化器视图集和路由器方法每当我在 django Rest 框架的 API 视图中发布故意错误时它都会抛出完整性错误有没有办法尝试捕获错误例如如果数据中没有错误则继续保
将 async-for 与 if 条件结合起来以中断中间等待的正确方法是什么？

如果我有一个协程正在消耗异步生成器中的项目那么从外部条件终止该循环的最佳方法是什么考虑到这一点 while not self shutdown event is set async with self external lib cl
存储整数列表的最有效方法

我最近一直在做一个项目其中一个目标是使用尽可能少的内存来使用 Python 3 存储一系列文件除了一个整数列表之外几乎所有文件都占用很少的空间大致333 000整数长且整数可达约8000在尺寸方面我目前正在使用pickle存储列表
使用unicode在hdf5中存储字符串数据集

我试图从包含特殊字符的文件中存储变量字符串表达式例如 and 这是我的代码 import h5py as h5 file h5 File deleteme hdf5 a dt h5 special dtype vlen str dset
如果出现重复，则主键取正值

我有一个数据框df Key1 Key2 Value K11 K21 V1 K11 K21 V1 K13 K23 V2 K13 K23 V2 现在例如对于相同的键 K11 K21 组合我们有 2 个值一负一正如何从此 df 中仅获取正

随机推荐

数据统计（基于文件输入输出）

输入一些整数求出它们的最大值最小值平均值保留三位小数输入保证这些数都是不超过1000的整数样例输入 2 8 3 5 1 7 3 6 样例输出 1 8 4 375 基于文件重定向 define LOCAL 作用仅在本机使用重定向
小程序报错：{“errMsg”:“navigateTo:fail can not navigateTo a tabbar page”}

小程序报错 errMsg navigateTo fail can not navigateTo a tabbar page 错误显示 VM791 1 Error MiniProgramError errMsg navigateTo fail
验证码报错 java.desktop/sun.awt.FontConfiguration.getVersion(FontConfiguration.java: 问题解决

验证码报错 org springframework web util NestedServletException Handler dispatch failed nested exception is java lang Internal
【C语言】选择排序

一算法描述在一遍遍历中将最小的数排到前面几次遍历后前面就是排号序的经过n 1次遍历二选择排序代码 void select int a int n int i j min temp for i 0 i
矩阵和向量的乘法顺序

矩阵和向量的乘法顺序似乎经常有人被这个问题转晕向量有两种表达形式行向量和列向量对应的矩阵也有行矩阵和列矩阵采用哪种形式和左右手系无关行矩阵三个轴向量为前三行最后一行为位移变换连乘时从左到右接合左边的变换先应用变换向量时
Ubuntu 18.02编译opencv

https blog csdn net public669 article details 99044895 spm 1001 2014 3001 5506 https blog csdn net Mr robot strange arti
利用STM32CubeMX软件生成USB_HOST读写U盘

一测试平台 MCU STM32F429IGT6 工具 STM32CubeMX软件编译软件 MDK 二配置步骤 1 打开STM32CubeMX软件创建新的工程文件点击ACCESS TO MCU SELECTOR选项 2 选择芯片型号
1-4、Lua基本语法

1 4 Lua基本语法文章目录 1 4 Lua基本语法 1 赋值语句 2 局部变量与代码块 3 控制结构语句 if语句 while语句 for语句有两大类 Lua像C和PASCAL几乎支持所有的传统语句赋值语句控制结构语句函数调用等
MFC之图标(标题)的动态使用15

1 图标标题的动态使用我们将实现左上角动态图标的显示首先按照向导创建新的项目由于我们的图标是属于框架所以在框架类处理 1 首先在框架类定义图标数组用于存储图片我这里有四张所以大小为4 private HICON m icon
程序员35岁以后就没有出路了吗？听听京东10年测开的分析

国内的互联网行业发展较快所以造成了技术研发类员工工作强度比较大同时技术的快速更新又需要员工不断的学习新的技术因此淘汰率也比较高超过35岁的基层研发类员工往往因为家庭原因身体原因比较难以跟得上工作节奏所以裁员往往优先考虑这类员
MCU接收串口字符型数据转换成数据型数据

转自 http blog csdn net langaopeng article details 7672252 做MCU开发时常常碰到串口接收的数据是字符型数据是ASCII码而我们需要解析的是数据型的如串口接收到的是 236 8
【机器学习实战】1、机器学习主要任务

文章目录 1 1 何谓机器学习 1 2 机器学习重要性 1 3 机器学习主要任务 1 4 如何选择合适的算法 1 5 开发机器学习应用程序的步骤 1 6 python语言的优势 1 6 1 python语言特色 1 6 2 python语言
npm、cnpm、yarn之间的区别

npm 在使用 npm 安装包的时候给人的第一感觉就是慢而且还会在命令行打印出一堆的东西而且经常会出现在我的电脑上可以这个问题着实是有点难受但也不得不说 npm 是 node 如此成功的主要原因之一 npm的缺点如下 1 由于
网站html保存,如何保存网页内容（高级篇）

上一篇介绍了允许另存为的网站保存网页的方法本篇继续介绍禁止另存为的网站也实现保存网页的方法步骤比上一篇麻烦一些但也不难以下是具体步骤提示对于这类网站尽管文件菜单中的另存为是可用的但当你试图另存为网页快要保存
[网络安全自学篇] 七十八.XSS跨站脚本攻击案例分享及总结（二）

这是作者网络安全自学教程系列主要是关于安全工具和实践操作的在线笔记特分享出来与博友们学习希望您喜欢一起进步前文分享了肖老师 Seak 的分享介绍恶意代码与APT攻击中的武器包括A2PT的攻击武器普通APT组织的自研恶意代码
虚拟机Parallels Desktop

Mac上安装Windows虚拟机 Parallels Desktop 之前在Mac上安装虚拟机使用的是VMware Fusion 用起来感觉不是很流畅很不舒服所以今天试试号称Mac上最好的虚拟机Parallels Desktop 概述
迷你气象站（雨量计，风速，风向）

天气预报对于计划我们的日常活动很重要农民需要信息来帮助他们计划农作物的种植和收割航空公司需要了解当地天气状况才能安排航班天气预报可以帮助我们做出更明智的日常决策甚至可以帮助我们摆脱危险在本教程中我们将制作一个微型气象站该气象站
python迷宫游戏的课程设计,Python迷宫游戏（基础版）

画地图 map data 1 1 1 1 1 1 1 1 1 1 1 0 1 1 1 1 1 1 1 1 1 2 1 0 0 0 0 0 0 1 1 0 1 0 1 0 1 1 0 1 1 0 1 0 1 0 1 1 0 1 1 0 0 0
互联网晚报

教育部回应降低英语教学比重建议中小学外语课时占比低于语文等学科教育部网站9月23日公布对关于增强文化自信增加中国文化内容教学改革和降低英语教学比重的建议的答复答复显示根据规定外语课时占比为6 8 明显低于语文数学体育艺
opencv3+python3.5成语填字游戏（一）印刷体汉字的分割

首先这是一个成语填字游戏大概就是一张成语填字游戏图片通过opencv图像识别后转为矩阵再通过解算法解出答案在显示到图片上源代码 https github com mayue801 crossword puzzle idiom 本

opencv3+python3.5成语填字游戏（一）印刷体汉字的分割

opencv3+python3.5成语填字游戏（一）印刷体汉字的分割 的相关文章

随机推荐

热门标签

opencv3+python3.5成语填字游戏（一）印刷体汉字的分割的相关文章