比较旋转图像

2023-12-13

我正在寻找一种方法来比较几乎相同（相似度超过 95%）但可以绕中心轴旋转的图像。

我对整个计算机图形/视觉领域很陌生，不太确定是否有现成的工具或系统，或者即使这是否是正确的堆栈交换。

目前，我正在研究使用 C# 生成位图直方图，然后通过 Panda 运行它进行分析，并根据直方图的相似性对图像进行理想的分组，尽管我听说 OpenCv + tesseract 之类的东西可能是一个可行的替代方案。

您需要计算两个图像之间的仿射变换矩阵，以便获取有关缩放、平移和rotation.

这个矩阵看起来怎么样以及如何获得旋转差？

从这个答案：

我用过以下Java代码（使用 OpenCV 3.2）计算scaling, 翻译 and rotation两个 Mat 图像之间的差异。我希望你会发现它很有用。

static void calculateDifferences(Mat img1, Mat img2){

        // Initialization
        FeatureDetector detector = FeatureDetector.create(FeatureDetector.ORB);
        DescriptorExtractor descriptor = DescriptorExtractor.create(DescriptorExtractor.ORB);
        DescriptorMatcher matcher = DescriptorMatcher.create(DescriptorMatcher.BRUTEFORCE_HAMMING);

        // First image objects
        Mat img1_descriptors = new Mat();
        MatOfKeyPoint img1_keypoints_mat = new MatOfKeyPoint();

        // Detect KeyPoints for first image
        detector.detect(img1, img1_keypoints_mat);
        descriptor.compute(img1, img1_keypoints_mat, img1_descriptors);

        // Second image objects
        Mat img2_descriptors = new Mat();
        MatOfKeyPoint img2_keypoints_mat = new MatOfKeyPoint();

        // Detect KeyPoints for second image
        detector.detect(img2, img2_keypoints_mat);
        descriptor.compute(img2, img2_keypoints_mat, img2_descriptors);

        // Match KeyPoints
        MatOfDMatch matOfDMatch = new MatOfDMatch();
        matcher.match(img1_descriptors, img2_descriptors, matOfDMatch);

        // Filtering the matches
        List<DMatch> dMatchList = matOfDMatch.toList();
        Double max_dist = 0.0;
        Double min_dist = 100.0;

        for(int i = 0; i < img1_descriptors.rows(); i++){
            Double dist = (double) dMatchList.get(i).distance;
            if(dist < min_dist) min_dist = dist;
            if(dist > max_dist) max_dist = dist;
        }
        LinkedList<DMatch> good_matches = new LinkedList<>();
        for(int i = 0; i < img1_descriptors.rows(); i++){
            if(dMatchList.get(i).distance < 3*min_dist){
                good_matches.addLast(dMatchList.get(i));
            }
        }

        // Converting to MatOfPoint2f format
        LinkedList<Point> img1_points_list = new LinkedList<>();
        LinkedList<Point> img2_points_list = new LinkedList<>();

        List<KeyPoint> img1_keyPoints_list = img1_keypoints_mat.toList();
        List<KeyPoint> img2_keyPoints_list = img2_keypoints_mat.toList();

        int limit = good_matches.size();
        for(int i = 0; i < limit; i++){
            img1_points_list.addLast(img1_keyPoints_list.get(good_matches.get(i).queryIdx).pt);
            img2_points_list.addLast(img2_keyPoints_list.get(good_matches.get(i).trainIdx).pt);
        }

        MatOfPoint2f img1_point2f_mat = new MatOfPoint2f();
        img1_point2f_mat.fromList(img1_points_list);

        MatOfPoint2f img2_point2f_mat = new MatOfPoint2f();
        img2_point2f_mat.fromList(img2_points_list);

        // Computing the affine transform matrix
        Mat result = Video.estimateRigidTransform(img1_point2f_mat, img2_point2f_mat, true);
        printMat(result); // Printing the optimal affine transformation 2x3 array

        // The following variables correspond to the estimateRigidTransform result as shown here: https://stackoverflow.com/a/29511091/5165833
        double a = result.get(0,0)[0];
        double b = result.get(0,1)[0];
        double d = result.get(1,1)[0];
        double c = result.get(1,0)[0];
        double tx = result.get(0,2)[0];
        double ty = result.get(1,2)[0];

        // Solving for scale,translation and rotation as shown in the link above
        double scale_x = Math.signum(a) * Math.sqrt( (a*a) + (b*b) ); // Axis x scale difference
        double scale_y = Math.signum(d) * Math.sqrt( (c*c) + (d*d) ); // Axis y scale difference
        double translation = ty; // The translation difference
        double rotation_angle = Math.atan2(c,d); // Rotation difference

        // Printing results
        println("Scale_x diff: " + scale_x);
        println("Scale_y diff: " + scale_y);
        println("Translation diff: " + translation);
        println("Rotation diff: " + rotation_angle);
    }

    static void printMat(Mat m)
    {
        for (int x=0; x < m.height(); x++) {
            for (int y=0; y < m.width(); y++) {
                System.out.printf("%f",m.get(x,y)[0]);
                System.out.printf("%s"," ");
            }
            System.out.println();
        }
    }

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

imageprocessing

OCR

比较旋转图像的相关文章

如何在 Python 中使用 PIL 将一张图像合成到另一张图像上？

我需要拍摄一张图像并将其放置到新生成的白色背景上以便将其转换为可下载的桌面壁纸所以这个过程是这样的生成尺寸为 1440x900 的新的全白图像将现有图像放在顶部居中另存为单张图像在 PIL 中我看到ImageDraw对象但没
如何检测图像中对象的实例？

我有一张包含几个特定对象的图像我想检测这些物体在该图像中的位置为此我有一些模型图像其中包含我想要检测的对象这些图像在我想要检测的对象实例周围得到了很好的裁剪这是一个例子在这张大图里我想检测此模型图像中表示的对象自从你最初发
如何提取图像中的表格

我想从图像中提取表格这个 python 模块https pypi org project ExtractTable https pypi org project ExtractTable 与他们的网站https www extractta
如何删除“绿屏”肖像背景

我正在寻找一种方法来自动从大量图片中删除透明绿屏肖像背景到目前为止我自己的尝试呃不太成功我正在四处寻找any有关该主题的提示解决方案或论文商业解决方案也很好在您评论并说不可能自动执行此操作之前不事实并非如此实际上
将四边形（四边形）拟合到斑点

应用不同的过滤和分割技术后我最终得到如下图像我可以访问一些轮廓检测函数这些函数返回该对象边缘上的点列表或者返回一个拟合的多边形尽管有很多边远多于 4 个我想要一种将四边形适合该形状的方法因为我知道它是应该是四边形的鞋盒的正面
屏幕截图中低分辨率文本的 OCR

我正在编写一个 OCR 应用程序来从屏幕截图图像中读取字符目前我只关注数字我的方法部分基于这篇博文 http blog damiles com 2008 11 basic ocr in opencv http blog damiles
图像处理编程

我想知道是否有任何方法可以使用某种编程语言检测图像中对象的位置例如如果我有一个球的图像每 100 毫秒更新一次是否可以通过某些程序使用某些东西来获取球的坐标看一下OpenCV http opencv willowgarage co
使用相位相关和对数极坐标变换获得旋转位移

我一直在编写一个脚本它使用 cv2 计算两个图像之间的旋转位移phaseCorrelate method 我有两张图像第二张是第一张图像的 90 度旋转版本加载图像后我将它们转换为对数极坐标然后将它们传递到phaseCorrela
收据褪色部分可以恢复吗？

我有一些包含一些扫描收据的文件我需要使用 OCR 从中提取文本由于收据上打印的文字在一段时间后会褪色导致收据上的某些文字不清晰影响OCR结果褪色单词的一些示例有什么方法可以恢复褪色的部分以便提高 OCR 结果吗我在OpenC
如何将 Tesseract 导入 Angular2 (TypeScript)

我正在尝试将 Tesseract 导入 Angular2 TypeScript 我可以看到它保存到 node modules 文件夹中但是在使用时 import Tesseract from types tesseract js it s
在 google Vision OCR 中被识别为单个单词的特殊字符？

我试图让谷歌视觉 OCR 正则表达式可搜索我已经完成了它并且当文档仅包含英文字符时效果很好但当有其他语言的文本时它就会失败发生这种情况是因为我在谷歌视觉单词组件中只有英文字符如下所示 VISION API WORD COUNTE
OpenCV 仅围绕大轮廓绘制矩形？

第一次发帖希望我以正确的方式放置代码我正在尝试检测和计算视频中的车辆因此如果您查看下面的代码我会在阈值处理和膨胀后找到图像的轮廓然后我使用 drawContours 和矩形在检测到的轮廓周围绘制一个框我试图在 drawCont
在我们的 Rails3/Heroku 应用程序中设置 Paperclip + AWS S3 用于图像存储时遇到问题

我们已经构建了一个 Rails 应用程序它有多个用户和每个用户的图像在我们的本地主机上完成所有开发工作我们为用户和照片提供了工作种子但现在我们尝试使用 S3 进行图像存储我们在总是在种子期间遇到错误执行此操作时迁移的步骤耙
如何使用 PySpark 预处理图像？

我有一个项目需要为 1 设置大数据架构 AWS S3 SageMaker 的概念验证使用 PySpark 预处理图像 2 执行 PCA and 3 训练一些机器或深度学习模型我的问题是了解如何使用 PySpark 操作图像数据但无法在
识别相似图像的库

我想确定 2 张图像的相似程度图像可能已被缩放裁剪等因此简单的像素比较将不起作用我环顾四周有很多关于这个主题的学术论文但他们没有发布他们的代码那么您知道有一个可以比较图像的已发布库适用于 Linux 和 Windows 吗
直方图均衡结果

I am trying to code histogram equalization by my self but the results are different from the built in function in matlab
OpenCV 2.4.3 中的阴影去除

我正在使用 OpenCV 2 4 3 最新版本使用内置的视频流检测前景GMG http docs opencv org modules gpu doc video html highlight gmg gpu 3a 3aGMG GPU算法
将姓名拆分为名字和姓氏 Java（Android OCR）[关闭]

Closed 这个问题需要细节或清晰度 help closed questions 目前不接受答案我使用本机 Android JAVA 创建了一个 OCR 光学字符识别应用程序我可以将图像转换为文本视图但是我如何使用这些词分别识别名
如何使用 Python 裁剪图像中的矩形

谁能给我关于如何裁剪两个矩形框并保存它的建议我已经尝试过这段代码但效果不佳 import cv2 import numpy as np Run the code with the image name keep pressing spa
从包含带边框的表格的图像中提取表格结构

我正在尝试提取下表中的单元格位置应用自适应阈值处理后我能够获得细胞位置周围的轮廓并且 HoughLines 获得垂直和水平结构元素这是我的代码 img cv2 imread os path join img path file im

随机推荐

在 Java 中如何更改或设置默认打印机

我知道如何获取可用打印机的列表我希望用户能够从列表中进行选择并将其设置为会话的默认打印机使用Windows 7 我知道这很容易完成我只想创建一个简单的java程序 a 增长知识 b 这里的老师非常不喜欢玩印刷属性感谢您提前的帮助您知
调试 Terraform AWS 应用程序负载均衡器验证错误的最佳方法是什么？

我尝试使用 Terraform 在 AWS 上配置演示 Web 服务但遇到以下错误 Error Error applying plan 2 error s occurred module prod module web module we
C#：如何在此 keydown 事件中显示修饰键名称 + 非修饰键名称？

我使用此代码来检测文本框的 KeyDown 事件中是否按住了修饰键 private void txtShortcut KeyDown object sender KeyEventArgs e if e Shift e Control e A
使用Matlab的ocr进行文本识别

我正在尝试对这张图片进行 OCR 这就是我正在做的使用ocr of MATLAB I imread N jpg r ocr I TextLayout Word 但不是得到N as Text这就是我得到的 r ocrText with pro
Android 11 - Kiosk 模式锁屏 NFC 问题

我有一个使用 Android Management API 作为信息亭运行的应用程序我的一些客户更喜欢使用 MDM 平台例如 Intune 和 Airwatch 我们将 Samsung XCover 系列用于我们的专用设备 Androi
作为 C++ 模板参数的类似函数签名的表达式

我在看唐克拉格斯顿的快速委托迷你库并注意到一个奇怪的语法技巧其结构如下 TemplateClass lt void int int gt Object 看起来好像函数签名被用作模板实例声明的参数这项技术其在 FastDelegate
NServiceBus.Host - 如何将端点实例添加到我的 IoC 容器

我正在尝试将解决方案从 NServiceBus 5 升级到 6 目前我们正在将 IBus 注入到服务类中以便服务可以根据需要向总线发送消息现在 IBus 在 6 中不再可用当使用 NServiceBus Host 创建端点时如何注
为什么我在使用 Perl 的 XML::Simple 时会收到“内存不足”错误？ [关闭]

很难说出这里问的是什么这个问题模棱两可含糊不清不完整过于宽泛或言辞激烈无法以目前的形式合理回答如需帮助澄清此问题以便重新打开访问帮助中心 Edited Hi All 我有一个像这样的 XML 文件
adb remount 权限被拒绝，但能够在 shell 中访问超级用户 -- android

所以我试图将一些文件推送到 Android 设备 zte 上的 system 我已经扎根并与 ADB 连接 adb remount gt 我的权限被拒绝 adb shell su gt 我能够访问 shell 并创建文件夹等并编辑文件系统
如何避免在默认 Android 浏览器的新选项卡中加载本地页面

我想做与此相反的事情 Android 浏览器打开多个 URL 每个 URL 都在新窗口选项卡上以编程方式在那里答案是使用 b putBoolean new window true 但是相同选项卡或相同窗口的等效项是什么由于某种原
Wildfly 8.2/undertow 读取超时

我最近使用java1 8将我的项目从jboss4迁移到wildfly 8 2 我有一个使用 SAAJ 的 Web 服务调用它在命令行中运行良好但是当它从 Wildfly8 2 内部运行时它会在 60 秒后超时我从 jboss 论坛上
为什么在 Opera 12 中，background-repeat: no-repeat 不适用于 .svg 图像？

我在 Opera 12 中遇到了一个奇怪的问题我有一个 svg我的 css 代码中链接的图像当我调整大小以缩小显示图像的页面时 Opera重复图像就好像我没有在背景重复中使用不重复值一样我缺少什么这是我的CSS代码 svgIm
经过多年的完美运行，AesManaged 开始产生空字符串加密结果

几年前我写了一个简单的包装器MSDN Aes 托管类代码以隐藏注册表中保存的值只是为了防止手动篡改这些值仅此而已 public static string Encrypt string s byte key byte iv byte
Android room 持久库 - TypeConverter 错误错误：无法弄清楚如何将字段保存到数据库”

由于错误我无法在房间中创建 typeConverter 我似乎正在遵循文档中的所有内容我想将列表转换为 json 字符串让我们看看我的实体 Entity tableName TABLE NAME public class Countr
即使用户已登录，Firebase javascript auth 用户也显示 null

我遵循 Firebase 文档进行 Web 开发并使用了user updateProfile方法将显示名称添加到用户的个人资料中登录后我使用了console log user 它起作用了但是当我打电话时updateProfile 的
如何在大熊猫数据框中显示所有列的名称？

我有一个由数百列组成的数据框我需要查看所有列名称我做了什么 In 37 data all2 columns 输出是 Out 37 Index customer id incoming outgoing awan bank family
在 MAC OSX 和 Ubuntu 上的 F# 中，我在 4.0 中运行 FSI 时出错

我需要 F 中的 System Numerics EDIT我认为问题是 fsi 可以与 4 0 运行时一起运行吗如果可以我该如何配置它我在 Fsharp 4 0 目录中运行 mono bin Fsi 在 OSX 10 6 4 和 Ub
将键盘表情符号转换为自定义 png，反之亦然

这是一个直接而简单的问题我怎样才能实现这两件事 FIRST 输入嘿我在微笑输出 hey I m smiling span class smile span 反之亦然 SECOND 输入嘿我在微笑 smile 输出嘿我在微笑现在我
无法在无服务器和 DynamoDB/Cognito/API 网关的 lambda 策略中使用 ${cognito-identity.amazonaws.com:sub}

客观的使用 Cognito 进行身份验证使用下面的 serverless yml 配置点击经过身份验证的端点 GET users 以触发 lambda 作业基于IAM策略限制基于cognito用户查询的DynamoDB表的访问co
比较旋转图像

我正在寻找一种方法来比较几乎相同相似度超过 95 但可以绕中心轴旋转的图像我对整个计算机图形视觉领域很陌生不太确定是否有现成的工具或系统或者即使这是否是正确的堆栈交换目前我正在研究使用 C 生成位图直方图然后通过 Panda

比较旋转图像

比较旋转图像 的相关文章

随机推荐

热门标签

比较旋转图像的相关文章