如何在频域中旋转图像？

2023-11-23

我听说应该可以对 jpeg 图像进行无损旋转。这意味着您可以在频域中进行旋转，而无需 IDCT。我尝试用谷歌搜索但没有找到任何东西。有人可以对此带来一些启发吗？

我所说的无损是指我不会在旋转中丢失任何附加信息。当然，这可能只有在旋转 90 度的倍数时才有可能。

You do not需要对图像进行 IDCT 才能无损旋转它（请注意，光栅图像的无损旋转仅适用于 90 度倍数的角度）。

以下步骤在 DCT 域中实现图像的转置：

转置每个 DCT 块的元素
转置每个 DCT 块的位置

我假设您已经可以执行以下操作：

从 JPEG 图像中获取原始 DCT 系数（如果没有，请参见here)
将系数写回文件（如果要保存旋转图像）

我无法向您展示完整的代码，因为它非常复杂，但这是我对图像进行 IDCT 的部分（注意 IDCT 用于仅用于显示目的):

Size s = coeff.size();
Mat result = cv::Mat::zeros(s.height, s.width, CV_8UC1);

for (int i = 0; i < s.height - DCTSIZE + 1; i += DCTSIZE)
for (int j = 0; j < s.width  - DCTSIZE + 1; j += DCTSIZE)
{
    Rect rect = Rect(j, i, DCTSIZE, DCTSIZE);
    Mat dct_block = cv::Mat::Mat(coeff, rect);
    idct_step(dct_block, i/DCTSIZE, j/DCTSIZE, result);
}

这是显示的图像：

Lenna

这里没有发生任何奇特的事情——这只是原始图像。

现在，这是实现的代码both我上面提到的转置步骤：

Size s = coeff.size();
Mat result = cv::Mat::zeros(s.height, s.width, CV_8UC1);

for (int i = 0; i < s.height - DCTSIZE + 1; i += DCTSIZE)
for (int j = 0; j < s.width  - DCTSIZE + 1; j += DCTSIZE)
{
    Rect rect = Rect(j, i, DCTSIZE, DCTSIZE);
    Mat dct_block = cv::Mat::Mat(coeff, rect);
    Mat dct_bt(cv::Size(DCTSIZE, DCTSIZE), coeff.type());
    cv::transpose(dct_block, dct_bt);                // First transposition
    idct_step(dct_bt, j/DCTSIZE, i/DCTSIZE, result); // Second transposition, swap i and j
}

这是生成的图像：

transposed

您可以看到图像现在已转置。为了实现正确的旋转，您需要结合反射与转置。

EDIT

抱歉，我忘记了反射也不是微不足道的。它也包含两个步骤：

显然，反映了每个DCT块在所需轴上的位置
不太明显的是，反转（乘以-1）每个奇数行OR列于eachDCT 块。如果垂直翻转，则反转奇数rows。如果水平翻转，则反转奇数columns.

下面的代码在转置后执行垂直反射。

for (int i = 0; i < s.height - DCTSIZE + 1; i += DCTSIZE)
for (int j = 0; j < s.width  - DCTSIZE + 1; j += DCTSIZE)
{
    Rect rect = Rect(j, i, DCTSIZE, DCTSIZE);
    Mat dct_block = cv::Mat::Mat(coeff, rect);

    Mat dct_bt(cv::Size(DCTSIZE, DCTSIZE), coeff.type());
    cv::transpose(dct_block, dct_bt);

    // This is the less obvious part of the reflection.
    Mat dct_flip = dct_bt.clone();
    for (int k = 1; k < DCTSIZE; k += 2)
    for (int l = 0; l < DCTSIZE; ++l)
        dct_flip.at<double>(k, l) *= -1;

    // This is the more obvious part of the reflection.
    idct_step(dct_flip, (s.width - j - DCTSIZE)/DCTSIZE, i/DCTSIZE, result);
}

这是您得到的图像：

final

您会注意到，这相当于逆时针旋转 90 度。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

imageprocessing

imagemanipulation

jpeg

imagerotation

如何在频域中旋转图像？的相关文章

预测测试图像时出现错误 - 无法重塑大小数组

我正在尝试使用 TensorFlow 和 Keras 在 Python 中进行图像识别并且我已经关注了下面的博客 https stackabuse com image recognition in python with tensorfl
如何使用 C# 以低分辨率形式提供高分辨率图像

尝试使用 300dpi tif 图像在网络上显示目前当用户上传图像时我正在动态创建缩略图如果创建的页面引用宽度为 500x500px 的高分辨率图像我可以使用相同的功能即时转换为 gif jpg 吗将创建的 jpg 的即将分辨率
如何去除给定图像中的噪声，使 ocr 输出完美？

我已经对这个孟加拉文本图像进行了大津阈值处理并使用 tesseract 进行 OCR 但输出非常糟糕我应该应用什么预处理来消除噪音我也想校正图像因为它有轻微的倾斜我的代码如下 import tesserocr from PIL i
如何在 C++ BOOST 中像图形一样加载 TIFF 图像

我想要加载一个 tiff 图像带有带有浮点值的像素的 GEOTIFF 例如 boost C 中的图形我是 C 的新手我的目标是使用从源 A 到目标 B 的双向 Dijkstra 来获得更高的性能 Boost GIL load tiif
照片马赛克算法。如何在给定基本图像和瓷砖列表的情况下创建马赛克照片？

Hy 我要做的是创建一个程序使用 C 或 C 它将 24 位像素位图和图像集合作为输入我必须创建一个马赛克图像类似于使用库的输入图像给定的图像创建与输入类似的马赛克照片到目前为止我可以访问输入的图像像素及其颜色但我有点卡住了
JPEG 中的颜色配置文件检测

我希望能够检测 JPEG 中是否存在颜色配置文件需要明确的是我对实际进行颜色校正或用它们做任何其他事情不感兴趣我做了一些调查但找不到任何明确的信息来源到目前为止我所知道的是里面有一个颜色配置信息XMP块 XMP 块位于0xFFE
如何选择面积最大的对象？

我用过bwconvhull检测图像的某个部分正如您在图像中看到的那样有许多具有特定质心的对象我想做的是检测面积最大的物体左起第一个大物体并忽略其他物体我应该遵循哪种方法我将非常感谢您的帮助以下是代码由于我仍在努力所以写得
如何使用网格分割图像并保留透明度边界框

我有一些 png 图像我想将其分成几个部分例如按网格或大小但每个部分应具有与原始图像相同的边界框透明度 Example 将图像分成两部分原来的 200 89 Output 部分 1 png 200 89 第2部分 png 200
在 Matlab 中保存 Kinect 深度图像？

通过使用 Kinect 我可以获得深度图像其中每个深度图像像素存储相机和物体之间的距离以毫米为单位现在我想保存它们以便以后使用最好的推荐是什么我正在考虑将深度图像保存为图像 jpg png等然而该值通常是从50毫米到10000
安卓的限制

我需要构建一个应用程序该应用程序拍摄相机图像并将其上传到网络在网络上进行一些处理并返回真假我在这方面遇到了一些问题希望得到澄清 1 我的应用程序有什么方法可以知道 Android 相机捕获的图像吗我从这里明白了什么 Androi
探索java图像处理的好资源[关闭]

Closed 这个问题不符合堆栈溢出指南 help closed questions 目前不接受答案我是图像处理领域的新手请推荐一些好的资源书籍和网络链接来学习 Java 中的图像处理最适合隐写术分析适合初学者和高级水平我看过
从扫描文档中提取行表 opencv python

我想从扫描的表中提取信息并将其存储为 csv 现在我的表提取算法执行以下步骤应用倾斜校正应用高斯滤波器进行去噪使用 Otsu 阈值进行二值化进行形态学开局 Canny 边缘检测进行霍夫变换以获得表格行去除重复行 10像素范围内相
pytesseract 无法从图像中识别复杂的数学公式

我在用pytesseractpython 中的模块 pytesseract从图像中识别文本但它不适用于包含复杂数学公式例如根推导积分数学问题或方程的图像代码2 py Import modules from PIL import
如何使用 javascript/ASP.NET/CSS 旋转和淡入淡出背景图像

我需要随机淡入淡出背景图像这将是一个定时函数例如每 5 秒一次我需要使用 ASP NET Javascript CSS 或全部三者来完成此操作请大家帮帮我谢谢 Cycle 一个 jQuery 插件是一个非常灵活的图像旋转解决方案
PHP - 调整 PNG 图像大小时出现内存错误

我有一个脚本可以根据上传的图像创建缩略图它对 jpg 工作正常但给我一个错误致命错误允许的内存大小 67108864 字节已耗尽尝试分配 26250000 字节当我上传 png 图像时脚本是 create thumbnail
如何用 JavaScript 修复图像透视变形和旋转？

我有一些用手机拍摄的图像有没有可以拉直纸张照片并将其压平的 JavaScript 库例如我想创建一个矩形图像该图像没有任何失真换句话说我想知道如何用 JavaScript 修复透视变形和旋转例如我发现下面的示例图像来自this
Python绕相机轴旋转图像

假设我有一个图像是在对某些原始图像应用单应性变换 H 后获得的未显示原始图像将单应性 H 应用于原始图像的结果是该图像我想围绕合适的轴可能是相机所在的位置如果有的话将此图像旋转 30 度以获得此图像如果我不知道相机参数如何
Pytorch TypeError：eq() 收到无效的参数组合

num samples 10 def predict x sampled models guide None None for in range num samples yhats model x data for model in sam
如何从一个清晰的例子计算二维图像中的吉布斯能量

我有一个关于矩阵的有趣问题在吉布斯分布中吉布斯能量U x 可以计算为这是所有可能的派系 C 上的派系势 Vc x 的总和右图团 c 被定义为 S 中站点的子集 x 蓝色像素的邻域是左图中黄色像素的邻居其中每对不同的站点都是邻居
如何将 Emgu.Cv.Image 转换为 System.Image

我是 Emgu Cv 的新手我想知道是否有人可以让我知道如何将 Emgu Cv Image 更改为 System Image 如果需要进一步解释请告诉我我会这样做我的语言我使用的是C 你可以只使用ToImage 方法得到一个Syst

随机推荐

有人知道如何在记事本++中使用正则表达式查找阿拉伯字符吗？

我正在尝试使用 Notepad CTRL F 和正则表达式来检测网页 HTML 中的阿拉伯字符我输入以下内容作为我的搜索词它返回所有字符 u0600 u06FF 我正在使用的随机文本示例块 awr4tgagas qa4tq4tw q4t
如何在 JBoss AS 7 中部署 war 文件？

我下载了 JBoss Application Server 5 并成功部署了一个 war 文件我将具有简单 index jsp 文件的 Hello war 复制粘贴到 jboss 5 1 0 GA jdk6 jboss 5 1 0 GA
React Native Module AppRegistry 不是已注册的可调用模块

我在处理我们团队正在开发的共享 github 项目时遇到问题我已经为这个问题苦苦挣扎了大约一周但没有任何运气问题是在我团队的计算机上运行的全新克隆无法在我的计算机上正常运行它抛出错误 Module AppRegistry 不是可调用
滑动手势在全屏模式下的 YouTubePlayerView 中不起作用

我正在使用YouTube API 我想应用Swipe左右手势开启YouTubePlayerView在全屏模式下 The Swipe手势不起作用Android4 0 版本时YouTubePlayerView处于全屏模式请在这件事上给予我帮助
处理 UNPIVOT 中的 NULL 值

我可以对表进行逆透视但结果中不包含空值 create table pivot task age int null a numeric 8 2 b numeric 8 2 c numeric 8 2 d numeric 8 2 e nume
如何让鼠标冻结c#

我希望鼠标按下时冻结无法移动谢谢我使用了一个tableLayoutPanel供您参考只需记住将代码实现到前面的Control即可选项1 重置鼠标位置定义两个全局变量 bool mousemove true Point curre
如何使用可变模板来展平类型树？

我有一个这样的构造 template
XSD 代码生成器的比较 [关闭]

Closed 此问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南目前不接受答案我正在对从 xsd 架构文件生成代码进行一些研究我的要求必须生成 C 2 0 代码或更高版本并在需要时使用泛型集合必须从 xsd 注释生成
如何在 matplotlib 中为不等间距的 bin 绘制具有相同 bin 宽度的直方图

我正在尝试在 matplotlib 中绘制包含多个数据系列的直方图我的垃圾箱间距不等但我希望每个垃圾箱的宽度相同所以我使用了属性width这样 aa 0 1 1 2 3 3 4 4 4 4 5 6 7 9 plt hist aa aa
python中的列表递归

我刚开始学习python 有一些递归问题我似乎无法弄清楚最烦人的是这个我需要构建一个函数ind e L where e是一个整数并且L是一个列表通过输入e如果它在列表中则输出需要是它的索引例如 ind 42 0 14 52 42
Perl 中美元符号后跟问号是什么意思？

Perl 脚本中的以下内容 a apple b orange if 0 do something 什么是意思是这里这是上次系统操作管道或反引号操作返回的状态参见参考资料perlvar
Android Studio 模拟器中出现“EGL_BAD_MATCH”错误

我有一个问题那是什么 E EGL emulation tid 3912 eglSurfaceAttrib 1146 error 0x3009 EGL BAD MATCH 我应该怎么做才能解决该错误 public class Main ex
rust-chrono 中的 ParseError(NotEnough) 是什么意思？

我在用着rust chrono我正在尝试解析这样的日期 extern crate chrono use chrono fn main let date str 2013 02 14 15 41 07 let date DateTime pa
如何在 Flutter 上播放 Android 和 iOS 的 M3U8 格式

我在 iOS 上找不到 M3U8 Url 播放器的任何解决方案我尝试过这些插件 video player 无法播放 flutter simple video player 仅支持Android chewielib将用于播放m3u8文件添
为什么我能够使用我的值构造函数，即使我不导出它？

作为实践我在名为 Queue 的模块中实现了队列数据类型我的数据类型也称为 Queue 这是它唯一的值构造函数 module Queue Queue enq emptyQueue where data Queue a Queue inb
错误：“(vlog-2110) 非法引用网络”

我在 SystemVerilog 中有一个简单的 FIFO 代码我得到几个vlog 2110 illegal reference to net错误消息我的错误消息后面是我的代码错误信息 vlog work 工作 sv stats no
如何使用 Java 8 流制作笛卡尔积？

我有以下集合类型 Map
从 ViewModel 获取 [key] 属性

我有一个 ViewModel 其中有一个 key 属性我想从该视图模型的实例中获取它我的代码看起来像这样虚构模型 class AddressViewModel Key ScaffoldColumn false public int U
“无法调用 DateTime 上的方法”以及其他限制

有谁知道编译时未捕获的 LINQ to SQL 查询限制的明确列表以及如果可能这些限制的解决方法到目前为止我们的清单是 Calling methods such as Date on DateTime 没有找到解决方法 string
如何在频域中旋转图像？

我听说应该可以对 jpeg 图像进行无损旋转这意味着您可以在频域中进行旋转而无需 IDCT 我尝试用谷歌搜索但没有找到任何东西有人可以对此带来一些启发吗我所说的无损是指我不会在旋转中丢失任何附加信息当然这可能只有在旋转 90 度

如何在频域中旋转图像？

如何在频域中旋转图像？ 的相关文章

随机推荐

热门标签

如何在频域中旋转图像？的相关文章