自动保存分割结果 - Matlab 阿拉伯语 OCR

2023-12-02

完整的分割代码：

% Preprocessing + Segmentation
 % // Original Code of Segmentation by Soumyadeep Sinha with several modification by Ana//
 % Saving each  single segmented character as one file 
    function [s] = seg (a)

myFolder = 'D:\1. Thesis FINISH!!!\Simulasi I\Segmented Images';
% a = imread ('adv1.png');

% Binarization %
level = graythresh (a);
b = im2bw (a, level);

% Complement %
c = imcomplement (b);

% Morphological Operation - Dilation %
se = strel ('square', 1);
% se = strel('rectangle', [1 2]);
r = imerode(c, se); 

i=padarray(r,[0 10]);
% i=padarray(c,[0 10]);

% Morphological Operation - Dilation %
% se = strel('rectangle', [1 2]);
% se = strel ('square', 1);
% i = imerode(r, se); 

%VP
verticalProjection = sum(i, 1);
set(gcf, 'Name', 'Segmentation Trial', 'NumberTitle', 'Off') 
subplot(2, 2, 1);imshow(i); 
subplot(2,2,3);
plot(verticalProjection, 'b-');
grid on;
t = verticalProjection;
t(t==0) = inf;
mayukh=min(t)
% 0 where there is background, 1 where there are letters
letterLocations = verticalProjection > mayukh; 
% Find Rising and falling edges
d = diff(letterLocations);
startingColumns = find(d>0);
endingColumns = find(d<0);

% Extract each region
y=1;
for k = 1 : length(startingColumns)
  % Get sub image of just one character...
  subImage = i(:, startingColumns(k):endingColumns(k)); 
   % im = subImage;
   s = subImage;
   % figure, imshow (s);

   % Normalization %
   [p] =  normalization (s); 

%  se = strel ('square', 1);
%  se = strel('rectangle', [2 1]);
%  im = imdilate(p, se); 

   % Morphological Operation - Thinning %
   im = bwmorph(p,'thin',Inf);

% Save %
[L,num] = bwlabel(im);
for z= 1 : num
    bw= ismember( L, z);
    % Construct filename for this particular image.
    baseFileName = sprintf('data.%d.png', y);
    y=y+1;
    % Prepend the folder to make the full file name.
    fullFileName = fullfile(myFolder, baseFileName);
    % Do the write to disk.
    imwrite(bw, fullFileName);
    subplot(2,2,4);
    pause(1);
    imshow(bw);
end
% y=y+1;
end;
s = (im);

我已将图像加载到 matlab 工作区中，以对单词图像进行字符分割过程。例如：data(1).png、data(2).png 等。
分割过程将为每个分割的字符提供多个图像作为输出。文字图像包含不同数量的字符，因此输出也会有所不同。例如，图像分割结果输出 = data(1).png 变为 data(1)_1.png、data(1)_2.png、data(1)_3.png、data(2).png 变为 data (2)_1.png、数据(2)_2.png等。

文字图像

最近，我是手动完成的，但是数据集会更大，并且对一张一张图像进行分割非常浪费时间。有什么建议吗？我该怎么做才能使其简单且更有效？获取每个分段字符的结果（按顺序）。

    % Save %
    [L,num] = bwlabel(im);
    for z= 1 : num
    bw= ismember( L, z);
    % Construct filename for this particular image.
    % Change basefilename for each word images %
    baseFileName = sprintf('data (1).%d.png', y);
    y=y+1;
    % Prepend the folder to make the full file name.
    fullFileName = fullfile(myFolder, baseFileName);
    % Do the write to disk.
    imwrite(bw, fullFileName);
    subplot(2,2,4);
    pause(1);
    imshow(bw);end

使用此代码后，它会产生良好的结果，但仅对于一个数据，下一个数据将替换最近的数据。因此，最近，对于每个单词图像，我都逐一运行分割过程并更改这部分以获得合适的结果。将 sprintf('data (1).%d.png', y) 更改为 sprintf('data (2).%d.png', y);等等。

% Change basefilename for each word images %
    baseFileName = sprintf('data (1).%d.png', y);
    y=y+1;

The result that I hope. I hope, I can get it automatically.

任何帮助将不胜感激。

由于阿拉伯语是我的母语，我将在这方面为您提供帮助。首先让我明确一点：一些阿拉伯字母包含不相连的区域。因此，仅使用图像处理技术是不够的。几年前，我设计了一个系统，利用了这个想法：与同一字母相关的区域要么位于该字母的上方，要么位于该字母的下方。步骤：

将图像转换为二进制。
补充图像。文字为白色，背景为黑色
处理图像将其分成多个行。这可以通过在垂直轴上进行投影来完成。山谷将与线之间的空间相关。
每一行都会拼命进行：区域检测。彼此上方或下方的所有区域将被分割在一起

如果文本是由人们“手写”来写的，问题就会变得更加复杂。然后您需要一个机器学习解决方案来验证分段区域。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

自动保存分割结果 - Matlab 阿拉伯语 OCR 的相关文章

单元格的 Fieldnames 函数的等效项

正如标题所说只是想知道是否有一个函数可以用作字段名 http www mathworks co uk help matlab ref fieldnames html 但适用于单元格所以如果我有类似的东西 a imread redsqua
非模态 questdlg.m 提示

我的代码绘制了一个图然后提示用户是否想使用不同的参数绘制另一个图问题是当 questdlg m 打开时用户无法查看绘图的详细信息这是代码 while strcmp Cont Yes 1 Some code modifying da
MATLAB - GUI 和 OPC 服务器

我想在 MATLAB 中设计一个图形用户界面可以使用 MATLAB 的过程控制对象链接和嵌入 OPC 工具箱连续读取数据我怎样才能实现这个我已经设计了图形用户界面但我无法将数据读入图形用户界面就这样做 type opctoolMA
从筛查乳腺 X 光检查数字数据库 (DDSM) 获取数据

我正在尝试以可读格式获取 DDSM 数据集有谁有 DDSM heathusf 程序的工作版本可以在 Linux 或 Windows 上正常运行吗我知道 DDSM 的 jpeg 程序有一个适用于 linux 的工作版本位于http w
Matlab颜色检测

我试图一致地检测同一场景的图像之间的某种颜色这个想法是根据颜色配置文件识别一组对象因此例如如果给我一个带有绿色球的场景并且我选择绿色作为我的调色板的一部分我想要一个具有反映它检测到球的矩阵的函数任何人都可以为这个项目推荐一些
如何在Matlab中绘制网络？

我有一个矩阵AMatlab中的维数mx2每行包含两个节点的标签显示网络中的直接链接例如如果网络有4矩阵的节点A可能A 1 2 1 3 2 1 2 4 3 2 4 1 4 2 其中第一行表示有一个链接来自1 to 2 第二行表示有一个链
如何在向量中的所有点之间绘制线？

我有一个包含二维空间中一些点的向量我希望 MATLAB 用从每个点到每个其他点绘制的线来绘制这些点基本上我想要一个所有顶点都连接的图你能用情节来做到这一点吗如果可以怎么做一种解决方案是使用该函数为每个点组合创建一组索引MESH
Matlab的导入函数的范围是什么？

我正在尝试将一些用 Matlab 编写的代码转换为独立的编译的 Matlab 应用程序然而在出现一些奇怪的错误之后我意识到代码大量使用了从路径中添加和删除的操作以避免多次使用多个具有相同名称但结果计算不同的函数这一事实环顾
Tesseract OCR - 手写字体

我正在尝试使用Tesseract OCR http code google com p tesseract ocr 检测其中包含纯文本的图像文本但这些文本具有名为的手写字体Journal Example 结果不是最好的千里马尺寸宽
Ilnumerics Ilpanel 在 winform 中编译成 dll 并加载到 matlab 时不激活

我想将 Visual studio 2012 中用 C 编写的 winform 编译为 dll 然后将其加载到 matlab 2013a 中然后我想使用 matlab net 接口与 winform 进行交互侦听其事件并通过一组预定义
将 Matlab 数组移植到 C/C++

我正在将 matlab 程序移植到 C C 我有几个问题但最重要的问题之一是 Matlab 将任何维度的数组都视为相同假设我们有一个这样的函数 function result f A B C result A 2 B C A B and
如何将数据传递给 MATLAB oncleanup 函数？

我有一个编译好的 matlab 程序可以自动调整机器参数在调整周期结束时我需要恢复一些原始设置有时会发生意外错误有时用户会发现调整算法未正常工作因此应终止使用 control C 如果发生可预测的错误我可以使用 try ca
MATLAB 除法...29/128 应该返回 0 吗？

我真的不认为这是一个精度问题答案应该是0 226左右这是确切的代码 val I i j bucketSize pos val bucketSize I只是我从中获取值的矩阵以下是 MATLAB 的输出 val 29 bucketSiz
MATLAB - 通过垂直连接子矩阵重新排列矩阵

我在执行以下任务时遇到问题假设一个 3x6 矩阵 A 0 2787 0 2948 0 4635 0 8388 0 0627 0 0435 0 6917 0 1185 0 3660 0 1867 0 2383 0 7577 0 6179 0
在 Matlab 中保存 Kinect 深度图像？

通过使用 Kinect 我可以获得深度图像其中每个深度图像像素存储相机和物体之间的距离以毫米为单位现在我想保存它们以便以后使用最好的推荐是什么我正在考虑将深度图像保存为图像 jpg png等然而该值通常是从50毫米到10000
MATLAB：将当前文件夹设置为脚本位置

我在不同的文件夹中有一些脚本和数据我使用addpath和相对路径经常我的问题是只有当我的当前文件夹是我执行的脚本所在的位置时这才有效例如如果我执行添加路径 X 的脚本 A 然后执行位于路径 X 中的脚本 B 则 Matlab 不
使用简单矩阵乘法时出错

我在一次简单的乘法运算中偶然发现了一个错误这让我感到非常惊讶我一直以为这里发生了什么只为矩阵乘法 http www mathworks nl help matlab matlab prog operators html x 2 y z
如何在 MATLAB 中将矩阵元素除以列总和？

有没有一种简单的方法可以将每个矩阵元素除以列和例如 input 1 4 4 10 output 1 5 4 14 4 5 10 14 以下是执行此操作的不同方法的列表使用bsxfun https www mathworks com he
图像梯度角计算

我实际上是按照论文的说明进行操作的输入应该是二进制边缘图像输出应该是一个新图像并根据论文中的说明进行了修改我对指令的理解是获取边缘图像的梯度图像并对其进行修改并使用修改后的梯度创建一个新图像因此在 MATLAB Open
matlab 中的动画绘图

我正在尝试创建一个三角形的动画图最终结果应该是十个三角形后面跟着两个更大的三角形后面跟着一条直线使用matlab文档 https de mathworks com help matlab ref drawnow html 我最终得到

随机推荐

将单词列表转换为数组[关闭]

Closed 这个问题需要细节或清晰度目前不接受答案我试图查看是否有任何脚本可以将单词列表转换为数组但我似乎找不到有人知道我在哪里可以找到一个吗 Input Dog Cat Hamster 转换为 Dog Cat Hamster 不
cURL 错误 58：SSL：无法加载证书“...”及其私钥：Mac 上的 OSStatus -25299

该代码在 Ubuntu vagrant box 上运行良好但在本地 MacO 上它不会加载证书说 cURL error 58 SSL Can t load the certificate and its private key OSSt
如何像矩阵乘法一样将行向量添加到列向量

我有一个 nx1 向量和一个 1xn 向量我想以一种特殊的方式添加它们例如以有效的方式矢量化矩阵乘法 Example A 1 2 3 B 4 5 6 A odd add B 1 4 1 5 1 6 2 4 2 5 2 6 3 4 3
命名空间::变量的多重定义，甚至使用 ifndef

我知道我在这里一定做错了什么 rank h ifndef RANK H define RANK H namespace mmi int chunk void rank int my rank endif rank cpp include r
如何检测 Python 是否作为 64 位应用程序运行？ [复制]

这个问题在这里已经有答案了我正在对 Windows 注册表进行一些工作根据 Python 运行为 32 位还是 64 位某些键值会有所不同如何检测 Python 是作为 64 位应用程序运行还是作为 32 位应用程序运行我对检测
在悬停时添加边框时如何防止移动？（透明边框不是解决方案）[重复]

这个问题在这里已经有答案了我想在悬停时为 div 添加边框但是添加边框时 div 稍微有点拉屎这是一个众所周知的问题常见的解决方案是添加透明边框例如但是我的 div 中有一张包含一些文本的图像我希望该图像占据 div 的全宽
正则表达式西班牙语和阿拉伯语单词

如何编写匹配所有有效的西班牙语和阿拉伯语单词的正则表达式用我知道的英语来说它是a zA z 在希伯来语中是俄语我使用 JavaScript 范围a zA Z因为英语单词的简单和天真令人难以接受它省略了所有带有重音符号的字母以及在借
过渡到 vim。存在缩进问题

我正在从手术中恢复因此我正在过渡到 VIM 作为起点我选择使用 vim sensible 插件作为我的配置的基础此外我还安装了 vim rails 和 vim ruby 插件这些都是通过 Pathogen 加载的无论出于何种原
序列化 JFrame 并通过网络发送

我想做的是通过套接字发送 JFrame 问题是在我发送表格并按下按钮查看它之后我得到以下异常 package ds3 import java io IOException import java io ObjectInputStream
Android - 在 UI Fragment 中保留对象

在我的项目中我最初使用的是这个方案活动A UI gt 片段B 非 UI gt 适配器 AsyncTask B保留与setRetainInstance true 并更新A UI A实例化B with getFragmentManager
在 .NET 中按换行符拆分字符串

我需要在 NET 中将字符串拆分为换行符我知道拆分字符串的唯一方法是使用Split方法然而这不允许我轻松地在换行符上拆分那么最好的方法是什么要分割字符串您需要使用采用字符串数组的重载 string lines theText
jQuery Mobile 站点中所有页面通用的弹出窗口

我正在尝试使用 jQuery Mobile 制作一个网站它由 HTML 文件中的许多页面组成有些只有一页有些有多个页面使用它们的多页功能该网站将有一些通知弹出窗口它们在所有页面上看起来都一样我正在使用他们的弹出窗口新的弹出功能
Python-按前两个单词对行进行分组

我想按文件中的前两个单词对文件进行分组然后重新排列和打印我想做 lines file readlines i 0 for line in lines word1 line split 0 word2 line split 1 if wo
c - 嵌入式系统中Long Long到char的转换函数

我正在使用嵌入式系统我需要实现一种将 long long 转换为 char 的方法问题是我不能在这个系统中使用 sprintf 来做到这一点所以我正在寻找替代方法函数来实现这一点欢迎提出 LongLongToChar 函数的实现建
FindBugs 希望 readObject(...) 为私有序列化，为什么？

我正在某些代码上运行 findbugs 它说 readObject 方法必须是私有的才能调用序列化反序列化为什么如果公开的话会有什么问题呢 About readObject writeObject 作为私有的情况如下如果你的类 B
图像比较 - 旋转、对齐和缩放

我有以下需求有一些表格即空白表格例如调查中使用的表格那些没有填充信息的从现在开始我将称之为图像模板除了图像模板之外我还有很多图像这些图像本质上都是充满信息的图像模板例如有一项调查有两个空白需要填写这些是图像模板许多
在 Windows XP 中从数据包中检索标头目标地址的函数

我有兴趣检索入站数据包发送到的目标地址例如在 Linux 上你可以使用recvmsg res recvmsg socket msghdr 0 get cmsg CMSG FIRSTHDR msghdr struct in pktinfo
Win2D 在 C++/WinRT 中可用吗？

我需要在我的 cppwinrt 项目中使用 win2D 使用 Win2D 示例文件作为模型我尝试模仿其设置放入该项目中的 win2d 包文件复制自定义构建步骤但我无法编译它我记得有人谈论过 Win2D 很快就会添加到标准 cppw
如何在 u32 和 usize 之间进行惯用转换？

此代码有效并打印 b fn main let s abc let ch s chars nth 1 unwrap println ch 另一方面此代码会导致类型不匹配错误 fn main let s abc let n u32 1 let
自动保存分割结果 - Matlab 阿拉伯语 OCR

完整的分割代码 Preprocessing Segmentation Original Code of Segmentation by Soumyadeep Sinha with several modification by Ana Sa

自动保存分割结果 - Matlab 阿拉伯语 OCR

自动保存分割结果 - Matlab 阿拉伯语 OCR 的相关文章

随机推荐

热门标签