图像通用操作Python的实现

2023-11-10

平时经常会对一个目录下的图像做统一处理，如缩放、旋转等等，之前使用C++处理，有时不是很方便。发现使用Python比较简单，代码量又很少，在Anacanda下执行起来也比较方便。因此，打算在后面遇到图像的常规处理时都将其实现放入到同一个py文件中，用时可随时执行。

所有实现存放在OpenCV_Test/demo/Python的image_generic_operations.py文件中，目前实现的仅有：图像旋转(仅限90,180,270度)、图像缩放，后面会逐渐增加，实现代码如下：

import os
import sys
import cv2
from inspect import currentframe, getframeinfo
import argparse

def get_image_list(path, image_suffix):
    image_list = []
    for x in os.listdir(path):
        if x.endswith(image_suffix):
            image_list.append(path+"/"+x)

    return image_list

def get_image_name(image_name):
    pos = image_name.rfind("/")
    image_name = image_name[pos+1:]

    return image_name

def image_rotate_clockwise(image_list, degrees, result_path):
    print("image rotation ...")
    os.makedirs(result_path, exist_ok=True)

    if degrees == 90:
        rotate_code = cv2.ROTATE_90_CLOCKWISE
    elif degrees == 180:
        rotate_code = cv2.ROTATE_180
    elif degrees == 270:
        rotate_code = cv2.ROTATE_90_COUNTERCLOCKWISE
    else:
        raise Exception("Unsupported rotat degrees: {}, it only supports: clockwise 90, 180, 270; Error Line: {}".format(degrees, getframeinfo(currentframe()).lineno))

    for name in image_list:
        print(f"\t{name}")
        image_name = get_image_name(name)
        #print(f"image name:{image_name}"); sys.exit(1)

        mat = cv2.imread(name)
        mat = cv2.rotate(mat, rotateCode=rotate_code)
        cv2.imwrite(result_path+"/"+image_name, mat)

def image_resize(image_list, dst_width, dst_height, result_path):
    print("image resize ...")
    os.makedirs(result_path, exist_ok=True)

    mat = cv2.imread(image_list[0])
    h, w, _ = mat.shape
    if h > dst_width and w > dst_height:
        interpolation = cv2.INTER_AREA
    else:
        interpolation = cv2.INTER_CUBIC

    for name in image_list:
        print(f"\t{name}")
        image_name = get_image_name(name)
        #print(f"image name:{image_name}"); sys.exit(1)

        mat = cv2.imread(name)
        mat = cv2.resize(mat, (dst_width, dst_height), interpolation=interpolation)
        cv2.imwrite(result_path+"/"+image_name, mat)

def parse_args():
    parser = argparse.ArgumentParser(description="image generic operations", add_help=True)

    parser.add_argument("--image_src_path", required=True, type=str, help="the path of the image to be operated, for example: ../../test_images")
    parser.add_argument("--operation", required=True, type=str, choices=["rotate", "resize"], help="specifies the operation to take on the image")
    parser.add_argument("--image_dst_path", required=True, type=str, help="the path where the resulting image is saved, for example: ../../test_images/result")

    parser.add_argument("--degrees", default=90, type=int, choices=[90, 180, 270], help="the degrees by which the image is rotated clockwise")

    parser.add_argument("--width", default=256, type=int, help="the width of the image after scaling")
    parser.add_argument("--height", default=256, type=int, help="the height of the image after scaling")

    parser.add_argument("--image_suffix", default=".png", type=str, help="the suffix of the processed image")
    
    args = parser.parse_args()
    return args

if __name__ == "__main__":
    args = parse_args()

    image_list = get_image_list(args.image_src_path, args.image_suffix)

    if args.operation == "rotate":
        image_rotate_clockwise(image_list, args.degrees, args.image_dst_path)

    if args.operation == "resize":
        image_resize(image_list, args.width, args.height, args.image_dst_path)

    print("test finish")

使用如下所示：

GitHub：https://github.com/fengbingchun/OpenCV_Test

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Image processing

opencv

图像通用操作Python的实现的相关文章

当我将鼠标移到 Mat 关键字上时，Visual Studio 2017 冻结（OpenCv 3.4.1）

我想在 Visual Studio 2017 中开发 openCv 项目我下载了 opencv 预构建库并进行了必要的设置那是 1 我添加了系统路径 build x64 vc14 bin 2 在 Visual Studio 中的项目属性
使用 ffmpeg 或 OpenCV 处理原始图像

看完之后维基百科页面 http en wikipedia org wiki Raw image format原始图像格式是任何图像的数字负片为了查看或打印相机图像传感器的输出具有进行处理即转换为照片渲染场景然后以标准光栅图形格
ffmpeg AVFrame 到 opencv Mat 转换

我目前正在开发一个使用 ffmpeg 解码接收到的帧的项目解码后我想将 AVFrame 转换为 opencv Mat 帧以便我可以在 imShow 函数上播放它我拥有的是字节流我将其读入缓冲区解码为 AVFrame f fope
OpenCV 2.4.3 中的阴影去除

我正在使用 OpenCV 2 4 3 最新版本使用内置的视频流检测前景GMG http docs opencv org modules gpu doc video html highlight gmg gpu 3a 3aGMG GPU算法
如何去除给定图像中的噪声，使 ocr 输出完美？

我已经对这个孟加拉文本图像进行了大津阈值处理并使用 tesseract 进行 OCR 但输出非常糟糕我应该应用什么预处理来消除噪音我也想校正图像因为它有轻微的倾斜我的代码如下 import tesserocr from PIL i
如何绘制更大的边界框和仅裁剪边界框文本 Python Opencv

我正在使用 easyocr 来检测图像中的文本该方法给出输出边界框输入图像如下所示 Image 1 Image 2 使用下面的代码获得输出图像 But I want to draw a Single Bigger bounding bo
cv2.drawContours() - 取消填充字符内的圆圈（Python，OpenCV）

根据 Silencer的建议我使用了他发布的代码here https stackoverflow com questions 48244328 copy shape to blank canvas opencv python 482465
同时从多个流中捕获、最佳方法以及如何减少 CPU 使用率

我目前正在编写一个应用程序该应用程序将捕获大量 RTSP 流在我的例子中为 12 个并将其显示在 QT 小部件上当我超过大约 6 7 个流时问题就会出现 CPU 使用率激增并且出现明显的卡顿我认为它不是 QT 绘制函数的原因是因
Opencv Mat内存管理

内存管理对于图像类至关重要在opencv中图像类是cv Mat 它有一个微妙的内存管理方案假设我已经有了自己的图像类SelfImage class SelfImage public int width int height unsig
在 Visual Studio C++ 2008 中包含 dll

有没有办法将 dll 包含在项目中这样我就不必在编译后将这些 dll 与可执行文件放在同一文件夹中这样我就可以用它们编译我的项目这是否有可能如果是有人可以指导我我的项目是一个 opencv 项目有很多 dll 我必须包含在文件
OpenCV SIFT 描述符关键点半径

我正在深入研究OpenCV的SIFT描述符提取的实现 https github com Itseez opencv blob master modules nonfree src sift cpp 我发现了一些令人费解的代码来获取兴趣点邻域
OpenCV 2.2 和多 CPU - opencv_haartraining.exe 是多线程的吗？

我在 VS 2010 上构建了 OpenCV 2 2 启用了 TBB 3 支持我确保所有项目都有正确的 tbb lib 目录并将 tbb lib 列为依赖项通过隐藏 tbb dll 进行验证果然 haartraining exe 抱
如何将多行文本插入到框架/图像中

我使用 C 和 OpenCV 创建了一个框架并想在其中插入几行文本使用以下代码 putText frame My text here cvPoint 30 30 FONT HERSHEY COMPLEX SMALL 0 8 cvScal
从 NumPy 数组到 Mat 的 C++ 转换 (OpenCV)

我正在围绕 ArUco 增强现实库基于 OpenCV 编写一个薄包装器我试图构建的界面非常简单 Python 将图像传递给 C 代码 C 代码检测标记并将其位置和其他信息作为字典元组返回给 Python 但是我不知道如何在 Pytho
深度估计的准确性 - 立体视觉

我正在研究立体视觉我对这个问题的深度估计的准确性感兴趣这取决于几个因素例如适当的立体校准旋转平移和失真提取图像分辨率相机和镜头质量失真越小色彩捕捉正确两个图像之间的匹配特征假设我们没有低成本的相机和镜头没有廉价的网
如何使用 AdaBoost 进行特征选择？

我想使用 AdaBoost 从大量 100k 中选择一组好的特征 AdaBoost 的工作原理是迭代功能集并根据功能的执行情况添加功能它选择对现有特征集错误分类的样本表现良好的特征我目前正在 Open CV 中使用CvBoost 我得到
如何检测图像是否像素化

之前有人在 SO 上提出过这样的问题在Python中检测像素化图像 https stackoverflow com questions 12942365 detecting a pixelated image in python还有关于q
opencv中如何去除二值图像噪声？

将图像转换为二值图像黑白后如果有任何噪音怎么办我消除了那些不需要的噪音您可以看到下图的黑色区域内有一些白噪声我该如何去除噪声使用opencv http img857 imageshack us img857 999 blackn
选择合适的IDE

您会推荐使用以下哪种 IDE 语言来在 Windows 下开发涉及识别手势并与操作系统交互的项目我将使用 OpenCV 库来执行图像处理任务之后我将使用 win32 API 或 NET 框架与操作系统交互具体取决于您建议的工具性能
使用 OpenCV 进行图像模糊检测

我正在研究图像的模糊检测我已经用过拉普拉斯方法的方差在 OpenCV 中 img cv2 imread imgPath gray cv2 cvtColor img cv2 COLOR BGR2GRAY value cv2 Laplacia

随机推荐

git 打包两个版本差异

git archive o update zip 当前版本号 git diff name only 上一版本号
QMainWindow和QWidget

一 QMainWindow QmainWindow主窗口为用户提供一个应用程序框架它有自己的布局可以在布局中添加控件在主窗口中可以添加控件比如将工具栏菜单栏状态栏等添加到布局管理器中窗口类型介绍 QMainWindow QWi
人工智能技术发展历史

人工智能 Artificial Intelligence 简称 AI 的历史可以追溯到上世纪50年代以下是其中的关键点 1956年达特茅斯会议 1956年美国达特茅斯学院举办了一次会议邀请了一些研究者共同探讨人工智能的概念目标和方
【NLP入门教程】三、词性标注

词性标注 Part of Speech Tagging POS Tagging 是自然语言处理中的另一个基本任务它涉及将文本中的每个词元 Token 标注为其对应的词性如名词动词形容词等词性标注有助于我们理解文本的语法结构进而支
win10 家庭版系统安装docker desktop遇到那些坑

最近开发中需要用到docker来打包镜像由于我的电脑系统是win10 家庭版而docker desktop针对win10系统只支持64 位的 Windows 10 专业版企业版和教育版我又不想重装系统因为要重装一堆工具太麻烦了
FILCO Majestouch Convertible 2 键盘连接电脑说明

键盘连接新电脑频次比较低每次都忘记了怎么操作要去翻说明书上网找方法在此记录下圣手2代键盘连接新电脑或者切换电脑的连接方式
Python数据可视化matplotlib.pyplot的使用

1 生成数据安装matplotlib windows cmd中 pip install matplotlib 在Python环境下使用import matplotlib检测是否安装成功不报错就是安装成功重启写py的工具就可以进行使用
2020东京奥运会奖牌排行--数据可视化

爬取数据1 1 数据来源 https 2020 cctv com medal list index shtml 数据为下面图片的表格数据 2 具体代码 2 1需要提前下载好的pip install 库名 from selenium impo
Windows 下 VSCode 使用 SSH 连接报 Bad owner or permissions on C:\\Users\\Administrator/.ssh/config 错误问题解决

Windows 下 VSCode 使用 SSH 连接报 Bad owner or permissions on C Users Administrator ssh config 错误问题解决 vscode ssh 链接报错情况解决方法 v
JAVA环境变量配置方法(Windows）

编写一个JAVA程序后如果想让自己编写的代码可以正常运行我们便需要对它进行编译和运行而Java环境变量的配置就显得尤为重要本篇文章我们来谈一谈关于Java环境变量配置的一些方法目录方法一方法二方法三方法一 1 右击我的
ARP协议

什么是ARP 地址解析协议即ARP Address Resolution Protocol 是根据IP地址获取物理地址的一个TCP IP协议主机发送信息时将包含目标IP地址的ARP请求广播到局域网络上的所有主机并接收返回消息以此确定
vue 字符串、数组之间的相互转换

1 字符串转数组 str split 以分号拆分字符串 2 数组转字符串 arr join 把数组项拼接成字符串并以分号隔开默认情况下是以逗号隔开
Linux系统迁移（同一台电脑），重建UEFI启动文件

电脑型号 hp 暗影精灵5 Air 显卡 RTX 2060 CPU i7 9750H 硬盘 500G固态 1T固态启动方式 UEFI 操作系统 Ubuntu16 04 之前安装Ubuntu的时候给Ubuntu系统分配的空间太小了安装新硬
函数调用时的堆栈变化（实例）

函数调用时的堆栈变化关于函数调用是的堆栈变化在网上找到的资料大都是一些配图文字等理解起来尚有些困难不过建议大家还是先了解一下基本的原理下面我主要通过一个调用函数的实例来讲解一下函数调用时的堆栈变化 Ps 图片有点糊大家最好自己跟
一、时间序列分析---滞后算子（lag operator）

1 基本概念时间序列是以观测值发生的时期作为标记的数据集合一般情况下我们是从某个特定的时间开始采集数据直到另一个固定的时间为止我们可以将获得的数据表示为 y 1 y
【hadoop——HDFS操作常用的Shell命令】

1 Hadoop分布式文件系统 Hadoop Distributed File System HDFS 是Hadoop核心组件之一我们已经安装好了Hadoop 2 7 1 其中已经包含了HDFS组件不需要另外安装最基本的shell命令
最新阿里云ECS服务器挂载数据盘亲测好用挂载成功分享一下

最近网站打不开了发现服务器系统盘不够用了查看磁盘占用情况系统盘已经快满了不能考虑到后期的需求不能每次都去清理不得不增加数据盘这里记录下数据盘的挂载过程也是找了好多参考方法亲测成功分享出来希望可以帮助有需要朋友总结方法如下
【无标题】BTY-DNS推广机制及首次空投规则

BTY DNS 致力于创建Web3领域中的去中心化身份 DID BTY DNS的 yuan域名自开放上线以来获得广大用户的喜爱与勇跃注册目前 yuan的域名注册量已近千个 BTY DNS具有推广奖励机制同时对于持有DNS的用户将进行第
软件人员kpi制定模板_软件项目团队绩效考核设计与薪酬激励设计

关注本头条号更多关于制度流程体系岗位模板方案工具案例故事图书文案报告技能职场等内容弗布克15年积累免费与您分享阅读导航 01 软件项目团队绩效考核设计 02 软件项目团队薪酬激励设计研发部软件项目团队绩
图像通用操作Python的实现

平时经常会对一个目录下的图像做统一处理如缩放旋转等等之前使用C 处理有时不是很方便发现使用Python比较简单代码量又很少在Anacanda下执行起来也比较方便因此打算在后面遇到图像的常规处理时都将其实现放入到同一个py文

图像通用操作Python的实现

图像通用操作Python的实现 的相关文章

随机推荐

热门标签

图像通用操作Python的实现的相关文章