CUDA小白 - NPP(6) 图像处理 Geometry Transforms (2)

2023-10-26

cuda小白
原始API链接 NPP

GPU架构近些年也有不少的变化，具体的可以参考别的博主的介绍，都比较详细。还有一些cuda中的专有名词的含义，可以参考《详解CUDA的Context、Stream、Warp、SM、SP、Kernel、Block、Grid》

常见的NppStatus，可以看这里。

Affine Transform

仿射变换
在这里插入图片描述

// 仿射变换
NppStatus nppiWarpAffine_8u_C3R(const Npp8u *pSrc,
								NppiSize oSrcSize,
								int nSrcStep,
								NppiRect oSrcROI,
								Npp8u *pDst,
								int nDstStep,
								NppiRect oDstROI,
								const double aCoeffs[2][3],
								int eInterpolation);
// 同样的2x3的矩阵的逆仿射变换
NppStatus nppiWarpAffineBack_8u_C3R(const Npp8u *pSrc,
									NppiSize oSrcSize,
									int nSrcStep,
									NppiRect oSrcROI,
									Npp8u *pDst,
									int nDstStep,
									NppiRect oDstROI,
									const double aCoeffs[2][3],
									int eInterpolation);
// 源图像的四边形 仿射变换到 目标的四边形，平时使用较少，后续不进行测试
NppStatus nppiWarpAffineQuad_8u_C3R(const Npp8u *pSrc,
									NppiSize oSrcSize,
									int nSrcStep,
									NppiRect oSrcROI,
									const double aSrcQuad[4][2],
									Npp8u *pDst,
									int nDstStep,
									NppiRect oDstROI,
									const double aDstQuad[4][2],
									int eInterpolation);

code

#include <iostream>
#include <cuda_runtime.h>
#include <npp.h>
#include <opencv2/opencv.hpp>

#define CUDA_FREE(ptr) { if (ptr != nullptr) { cudaFree(ptr); ptr = nullptr; } }

int main() {
  std::string directory = "../";
  cv::Mat image_dog = cv::imread(directory + "dog.png");
  int image_width = image_dog.cols;
  int image_height = image_dog.rows;
  int image_size = image_width * image_height;

  // =============== device memory ===============
  // input
  uint8_t *in_image;
  cudaMalloc((void**)&in_image, image_size * 3 * sizeof(uint8_t));
  cudaMemcpy(in_image, image_dog.data, image_size * 3 * sizeof(uint8_t), cudaMemcpyHostToDevice);

  // output
  uint8_t *out_ptr1, *out_ptr2;
  cudaMalloc((void**)&out_ptr1, image_size * 3 * sizeof(uint8_t));  // 三通道
  cudaMalloc((void**)&out_ptr2, image_size * 3 * sizeof(uint8_t));  // 三通道

  double angle = 30.0;
  double scale = 0.6;
  cv::Point center = cv::Point(image_width / 2, image_height / 2);
  cv::Mat rot_mat = cv::getRotationMatrix2D(center, angle, scale);
  double coeffs[2][3] = { rot_mat.at<double>(0, 0),
                          rot_mat.at<double>(0, 1),
                          rot_mat.at<double>(0, 2),
                          rot_mat.at<double>(1, 0),
                          rot_mat.at<double>(1, 1),
                          rot_mat.at<double>(1, 2)};

  NppiSize in_size;
  in_size.width = image_width;
  in_size.height = image_height;
  NppiRect rc;
  rc.x = 0;
  rc.y = 0;
  rc.width = image_width;
  rc.height = image_height;

  cv::Mat out_image = cv::Mat::zeros(image_height, image_width, CV_8UC3);
  NppStatus status;
  // =============== nppiWarpAffine_8u_C3R ===============
  status = nppiWarpAffine_8u_C3R(in_image, in_size, image_width * 3, rc, out_ptr1, image_width * 3, 
                                 rc, coeffs, NPPI_INTER_LINEAR);
  if (status != NPP_SUCCESS) {
    std::cout << "[GPU] ERROR nppiWarpAffine_8u_C3R failed, status = " << status << std::endl;
    return false;
  }
  cudaMemcpy(out_image.data, out_ptr1, image_size * 3, cudaMemcpyDeviceToHost);
  cv::imwrite(directory + "affine.jpg", out_image);

   // =============== nppiWarpAffineBack_8u_C3R ===============
  status = nppiWarpAffineBack_8u_C3R(out_ptr1, in_size, image_width * 3, rc, out_ptr2, image_width * 3, 
                                     rc, coeffs, NPPI_INTER_LINEAR);
  if (status != NPP_SUCCESS) {
    std::cout << "[GPU] ERROR nppiWarpAffineBack_8u_C3R failed, status = " << status << std::endl;
    return false;
  }
  cudaMemcpy(out_image.data, out_ptr2, image_size * 3, cudaMemcpyDeviceToHost);
  cv::imwrite(directory + "affine_back.jpg", out_image);

  // free
  CUDA_FREE(in_image)
  CUDA_FREE(out_ptr1)
  CUDA_FREE(out_ptr2)
}

make

cmake_minimum_required(VERSION 3.20)
project(test)

find_package(OpenCV REQUIRED)
include_directories(${OpenCV_INCLUDE_DIRS})

find_package(CUDA REQUIRED)
include_directories(${CUDA_INCLUDE_DIRS})
file(GLOB CUDA_LIBS "/usr/local/cuda/lib64/*.so")

add_executable(test test.cpp)
target_link_libraries(test
                      ${OpenCV_LIBS}
                      ${CUDA_LIBS}
)

result

请添加图片描述

Perspective Transform

透视变换

NppStatus nppiWarpPerspective_8u_C3R(const Npp8u *pSrc,
									 NppiSize oSrcSize,
									 int nSrcStep,
									 NppiRect oSrcROI,
									 Npp8u *pDst,
									 int nDstStep,
									 NppiRect oDstROI,
									 const double aCoeffs[3][3],
									 int eInterpolation);

NppStatus nppiWarpPerspectiveBack_8u_C3R(const Npp8u *pSrc,
									     NppiSize oSrcSize,
								         int nSrcStep,
										 NppiRect oSrcROI,
										 Npp8u *pDst,
										 int nDstStep,
										 NppiRect oDstROI,
										 const double aCoeffs[3][3],
										 int eInterpolation);

code

#include <iostream>
#include <cuda_runtime.h>
#include <npp.h>
#include <opencv2/opencv.hpp>

#define CUDA_FREE(ptr) { if (ptr != nullptr) { cudaFree(ptr); ptr = nullptr; } }

int main() {
  std::string directory = "../";
  cv::Mat image_dog = cv::imread(directory + "dog.png");
  int image_width = image_dog.cols;
  int image_height = image_dog.rows;
  int image_size = image_width * image_height;

  // =============== device memory ===============
  // input
  uint8_t *in_image;
  cudaMalloc((void**)&in_image, image_size * 3 * sizeof(uint8_t));
  cudaMemcpy(in_image, image_dog.data, image_size * 3 * sizeof(uint8_t), cudaMemcpyHostToDevice);

  // output
  uint8_t *out_ptr1, *out_ptr2;
  cudaMalloc((void**)&out_ptr1, image_size * 3 * sizeof(uint8_t));  // 三通道
  cudaMalloc((void**)&out_ptr2, image_size * 3 * sizeof(uint8_t));  // 三通道

  cv::Point2f src_pts[4], dst_pts[4];
  src_pts[0].x = 0.0;
  src_pts[0].y = 0.0;
  src_pts[1].x = image_width - 1.0;
  src_pts[1].y = 0.0;
  src_pts[2].x = 0.0;
  src_pts[2].y = image_height - 1.0;
  src_pts[3].x = image_width - 1.0;
  src_pts[3].y = image_height - 1.0;

  dst_pts[0].x = image_width * 0.05;
  dst_pts[0].y = image_height * 0.05;
  dst_pts[1].x = image_width * 0.9;
  dst_pts[1].y = image_height * 0.1;
  dst_pts[2].x = image_width * 0.2;
  dst_pts[2].y = image_height * 0.8;
  dst_pts[3].x = image_width * 0.85;
  dst_pts[3].y = image_height * 0.85;

  cv::Mat warp_mat = cv::getPerspectiveTransform(src_pts, dst_pts);
  double coeffs[3][3] = { warp_mat.at<double>(0, 0),
                          warp_mat.at<double>(0, 1),
                          warp_mat.at<double>(0, 2),
                          warp_mat.at<double>(1, 0),
                          warp_mat.at<double>(1, 1),
                          warp_mat.at<double>(1, 2),
                          warp_mat.at<double>(2, 0),
                          warp_mat.at<double>(2, 1),
                          warp_mat.at<double>(2, 2) };
  
  NppiSize in_size;
  in_size.width = image_width;
  in_size.height = image_height;
  NppiRect rc;
  rc.x = 0;
  rc.y = 0;
  rc.width = image_width;
  rc.height = image_height;

  cv::Mat out_image = cv::Mat::zeros(image_height, image_width, CV_8UC3);
  NppStatus status;
  // =============== nppiWarpPerspective_8u_C3R ===============
  status = nppiWarpPerspective_8u_C3R(in_image, in_size, image_width * 3, rc, out_ptr1, image_width * 3, 
                                      rc, coeffs, NPPI_INTER_LINEAR);
  if (status != NPP_SUCCESS) {
    std::cout << "[GPU] ERROR nppiWarpPerspective_8u_C3R failed, status = " << status << std::endl;
    return false;
  }
  cudaMemcpy(out_image.data, out_ptr1, image_size * 3, cudaMemcpyDeviceToHost);
  cv::imwrite(directory + "perspective.jpg", out_image);

  // =============== nppiWarpPerspectiveBack_8u_C3R ===============
  status = nppiWarpPerspectiveBack_8u_C3R(out_ptr1, in_size, image_width * 3, rc, out_ptr2, image_width * 3, 
                                          rc, coeffs, NPPI_INTER_LINEAR);
  if (status != NPP_SUCCESS) {
    std::cout << "[GPU] ERROR nppiWarpPerspectiveBack_8u_C3R failed, status = " << status << std::endl;
    return false;
  }
  cudaMemcpy(out_image.data, out_ptr2, image_size * 3, cudaMemcpyDeviceToHost);
  cv::imwrite(directory + "perspective_back.jpg", out_image);

  // free
  CUDA_FREE(in_image)
  CUDA_FREE(out_ptr1)
  CUDA_FREE(out_ptr2)
}

make

cmake_minimum_required(VERSION 3.20)
project(test)

find_package(OpenCV REQUIRED)
include_directories(${OpenCV_INCLUDE_DIRS})

find_package(CUDA REQUIRED)
include_directories(${CUDA_INCLUDE_DIRS})
file(GLOB CUDA_LIBS "/usr/local/cuda/lib64/*.so")

add_executable(test test.cpp)
target_link_libraries(test
                      ${OpenCV_LIBS}
                      ${CUDA_LIBS}
)

result

请添加图片描述

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

c

CUDA

NPP

CUDA小白 - NPP(6) 图像处理 Geometry Transforms (2) 的相关文章

使用 Rijndael 加密/解密文件

我需要传输 xml 文件并且需要对它们进行加密我发现一些例子认为我已经接近了但是当我解密文件时我最终得到了尾随垃圾字符有一些关于此的帖子但我还没有看到任何能真正有帮助的帖子这是加密和解密代码 private void Encr
iTextSharp 居中对齐文档对象内的对象

是否有一种快速而简单的方法可以将文档对象中的对象居中对齐 Without执行任何计算逻辑即获取页面宽度获取内容宽度除以二等我在 Document 对象内的 Paragraph 对象中有一个 PdfPTable 对象我想将段落对象
如何在 Visual Studio 2017 项目（新的 .csproj 文件格式）中设置“OutputPath”，而不会使目标框架扰乱解析的路径？

Setting OutputPath在新的 Visual Studio 2017 项目格式中会自动在路径中添加目标框架例如如果我在项目文件中设置了这些
了解 C# 中的自签名证书

最近我遇到了这个c 代码 var dn new X500DistinguishedName CN appSettings CommonName OU appSettings OrganizationalUnit X500Distinguis
std::线程构造和执行

我在中找不到任何信息文档 http en cppreference com w cpp thread thread thread是否能保证线程对象构造完成后线程实际上正在运行换句话说是否可以保证线程构造函数完成后线程函数已经被执行一
如何在字符串中写入反斜杠 (\)？

我想写这样的东西C Users UserName Documents Tasks in a textbox txtPath Text Environment GetFolderPath Environment SpecialFolder M
Web API 获取多部分/表单数据响应的最简单方法

我有问题但我看不到我做错了什么我想用最简单的方法来让它工作稍后我会让它变得更复杂但目前只想命中 post 方法我什至不关心里面的代码当前是否正在工作我唯一关心的是它会发回 OK 200 回复目前我要么收到内部服务器错误 50
如何将 textblock.foreground 绑定到变量？ (WPF C#)

所以我希望改变我的程序以便我可以运行一个函数来检查前景色是否应该是黑色或银色我希望将不可访问的字段灰显 My form currently looks like 我希望将无需维护字段灰显但我在尝试在数据模板中定义字体前景的绑
没有 DbSet 的原始 SQL 查询 - Entity Framework Core

随着 Entity Framework Core 的删除dbData Database SqlQuery
是否有适用于 Amazon 产品 API 的最新 C# 示例？

我正在尝试创建一个与亚马逊的产品 API 交互的小型应用程序获取文章的价格等不幸的是到目前为止我发现的与 Amazon WCF 服务交互的所有 C 示例都已过时我知道 Amazon 决定每个服务调用都必须使用个人 accessKey
OpenSubKey 不适用于我需要的注册表值

我安装了 SQL Server In the registry the key MSSQLServer at HKEY LOCAL MACHINE SOFTWARE Microsoft looks like this 以下所有代码行都从注册
C++ GetDIBits 不工作

首先我加载图像 cool bmp 加载很好然后我调用函数 getPixArray 但它失败了 case WM CREATE runs once on creation of window hBitmap HBITMAP LoadImage
C# 中的时间跨度总和

我有一个包含 TimeSpan 变量的对象集合 MyObject TimeSpan TheDuration get set 我想使用 LINQ 来计算这些时间的总和当然从 MyCollection 中的 r 选择 r TheDurati
使用 Regex/C# 将转换为

奇怪的问题但我不会浪费时间解释为什么我需要这样做只是我需要这样做我有以下内容
C# - 将指向 sockaddr 结构的 IntPtr 转换为 IPAddress

从 P Invoked 本机函数中我得到一个IntPtr http msdn microsoft com en us library system intptr aspx它指向一个sockaddr http msdn microsoft
画笔到画笔动画

我设法找到了如何制作 WPF 动画两种颜色之间的过渡它被称为 ColorAnimation 并且效果很好 ColorAnimation animation new ColorAnimation From Colors DarkGreen
使用 std::istream_iterator 限制 std::copy 的范围

我构建了一个最小的工作示例来展示我在使用 STL 迭代器时遇到的问题我在用着istream iterator读书floatss 或其他类型来自 astd istream include
在 C 中实现逻辑右移

我正在致力于仅使用按位运算符在 C 中创建逻辑右移函数这是我所拥有的 int logical right shift int x int n int size sizeof int size of int arithmetic shift
VSTS 构建失败并显示 MSB4184 路径不是合法形式

我正在尝试使用 VSTS 中的构建系统来构建和部署 c net Web 应用程序我创建了一个新的单项目解决方案因为似乎没有任何方法可以指定在多项目解决方案中构建部署哪个项目并设置我的构建定义以指向这个新解决方案我已将其设置为使用
C++ 中的编译器指令重新排序优化（以及阻碍它们的因素）

我已将代码缩减为以下内容这在保留我感兴趣的编译器输出的同时尽可能简单 void foo const uint64 t used uint64 t ar 100 for int i 0 i lt 100 i ar i some globa

随机推荐

Linux简介

1 1操作系统是什么操作系统概述要讲明白 Linux 是什么首先得说说什么是操作系统计算机系统是指按用户的要求接收和存储信息自动进行数据处理并输出结果信息的系统它由硬件子系统计算机系统赖以工作的实体包括显示屏键盘鼠标
Xcode9 xcodebuild 命令行打包遇到的坑与解决方案

主要涉及的打包脚本命令 if xcodeversion lt 830 then Xcode 8 3 以下打包时使用该脚本 xcodebuild exportArchive exportFormat ipa archivePath schem
十一、文件的读写

一文件的读写模式 1 文件常用的打开模式 r 只能读 r 可读可写不会创建不存在的文件如果直接写文件则从顶部开始写覆盖之前此位置的内容如果先读后写则会在文件最后追加内容 w 可读可写如果文件存在则覆盖整个文件不存在则创建 w
数学建模 —— 降维算法

文章目录前言数据降维的作用一主成分分析 PCA 1 介绍 2 算法流程 3 主成分分析的说明二因子分析 FA 1 介绍 2 算法流程 3 因子分析和主成分分析的对比三典型相关性分析 CCA 1 介绍 2 算法思路 3 算法流
用位运算实现两个整数的加减乘除运算

位运算的思想可以应用到很多地方这里简单的总结一下用位运算来实现整数的四则运算 1 整数加法 int Add int a int b for int i 1 i i lt lt 1 if b i for int j i j j lt lt
网络七层及四层协议通俗详解

1 OSI开放式网络七层协议模型总体而言理解记忆我点击一个网络请求假如使用http协议这就是应用层用户选择具体的协议这个请求需要传输数据但是不同系统因为编码等方式不同无法识别彼此发送的消息这个时候表示层就需要把数据整理成
《剑指offer》读后感

帮研二的学姐准备网易暑期实习的机试时代码提交在一个OJ网站叫牛客网出于好奇就多点了一下这个网站看到剑指offer 的在线编程专栏就是把剑指offer中的题目都挂在了网上可以在线判断是否AC 以前也总是听到学长们推荐该书索性趁着
R语言实现样本量的估算（2）

本文默认 0 05 sig level 0 2 power 根据研究需要可调整导入包 library pwr 1 已知标准差和预期差异 1 单样本t检验某治疗措施预期提高某物质水平8mg L 标准差为10mg L 单样本t检验 pwr
QVector用法详细介绍

QVector类是动态数组的模板类顺序容器它将自己的每一个对象存储在连续的内存中可以使用索引号来快速访问它们使用前需要包含头文件 include
iOS(二)App第一次启动时出现的引导界面

我们每次打开一个刚刚从AppStore下载下来的软件时总会出来一个引导界面有的是宣传产品有的是介绍App的功能最后再出来一个按钮正式进入到App 从此以后这个引导界面就再也不会出现了除非你卸载重装在查阅相关资料后做了个简陋的引
逆向爬虫06 bs4，xpath，pyquery实战

逆向爬虫06 bs4 xpath pyquery实战原本想要详细的对比一下这三个模块的使用方法但是在实战的时候发现只要遵循一个套路抓取静态网页即网页信息直接放在html源代码中就比较容易了一些使用细节上的问题每个人遇到的都会
Unity Hub、unity、PlasticSCM安装

目录一 Unity Hub安装二 Unity安装三 PlasticSCM安装一 Unity Hub安装第一步进入官网下载地址地址第二步安装跟着提示走就行二 Unity安装第一步打开Unity Hub 激活许可证点
打印机服务器纸张属性不显示,为什么我的打印机能在打印机服务器属性里设置自定义纸张大小,却无法? 爱问知识人...

问题原因及解决方法在以往的Windows 98操作系统中打印机属性里的纸张大小中有自定义一项而Windows 2000和Windows XP中自定义的位置是不同于Windows 98的这里用一个示例来表述假定用户使用了一款
VMware中安装CentOS7

在VMware中安装CentOS7 01 目录 CentOS7的下载 CentOS7的配置 CentOS7的安装 CentOS7的网络配置自动获取IP 固定获取IP 02 安装前提准备工作提前下载和安装好VMware 下载centos
环境扫描/透射电子显微镜气体样品架的真空压力和微小流量控制解决方案

摘要针对环境扫描透射电子显微镜对样品杆中的真空压力气氛环境和流体流量精密控制控制要求本文提出了更简单高效和准确的国产化解决方案解决方案的关键是采用动态平衡法控制真空压力真空压力控制范围为1E 03Pa 0 7MPa 采用压差法控制
Using Java to create customized virtual machine clones on VMWare infrastructure

Hello Quite a while ago I was given a task to create a java module which would be able to create customized clones from
python制作词云图

准备基础模块 matplotlib 数据可视化模块 numpy 数值计算模块 jieba 分词模块 wordcloud 词云模块 Pillow PIL 图像处理模块同时准备遮罩图和文本信息实现代码导入matplotlib模块pyplo
数据挖掘学习之路二：数据预处理方法概述

主要是将数据中缺失的数据补充完整消除噪声数据识别和删除离群点并解决不一致性主要达到的目标是将数据格式标准化异常数据清除错误纠正重复数据清除 A 异常数据处理分析异常数据 1 使用统计值进行判断最大值最小值平均值等判断是
C++中的++i 与 i++详解

一区别 i 与 i 的主要区别有两个 1 i 返回原来的值 i 返回加1后的值 2 i 不能作为左值而 i 可以二原理毫无疑问大家都知道第一点我们重点说下第二点首先解释下什么是左值与右值通俗地说以赋值符号为界左边的就是
CUDA小白 - NPP(6) 图像处理 Geometry Transforms (2)

cuda小白原始API链接 NPP GPU架构近些年也有不少的变化具体的可以参考别的博主的介绍都比较详细还有一些cuda中的专有名词的含义可以参考详解CUDA的Context Stream Warp SM SP Kernel B

CUDA小白 - NPP(6) 图像处理 Geometry Transforms (2)

Affine Transform

code

make

result

Perspective Transform

code

make

result

CUDA小白 - NPP(6) 图像处理 Geometry Transforms (2) 的相关文章

随机推荐

热门标签