【python】《多媒体技术与应用》实验报告「数字图像压缩」「傅里叶变换」

2023-10-29

《多媒体技术与应用》实验报告

实验名称

实验二 数字图像压缩

实验时间

2022/4/11

姓名

班级

计非201

学号

成绩

  • 实验目的
  1. 理解图像压缩的主要原则和目的,理解有损和无损压缩的概念;
  2. 了解几种常用的图像压缩编码方法;
  3. 利用 Python 进行图像压缩算法验证。

二.实验原理

用 DCT 压缩图像的过程为: (1)首先将输入图像分解为 8×8 或 16×16 的块,然后对每个子块进行二维 DCT 变换。 (2)将变换后得到的量化的 DCT 系数进行编码和传送,形成压缩后的图像格式。 用 DCT 解压的过程为: (1)对每个 8×8 或 16×16 块进行二维 DCT 反变换。 (2)将反变换的矩阵的块合成一个单一的图像。

余弦变换具有把高度相关数据能量集中的趋势,DCT 变换后矩阵的能量集中在矩阵的 左上角,右下的大多数的 DCT 系数值非常接近于 0。对于通常的图像来说,舍弃这些接近 于 0 的 DCT 的系数值,并不会对重构图像的画面质量带来显著的下降。所以,利用 DCT 变换进行图像压缩可以节约大量的存储空间。压缩应该在最合理地近似原图像的情况下使用 最少的系数。使用系数的多少也决定了压缩比的大小。 在压缩过程的第 2 步中,可以合理地舍弃一些系数,从而得到压缩的目的。在压缩过程的第 2 步,还可以采用 RLE 和 Huffman来进一步压缩.

三.实验内容与关键步骤

求 RGB 彩色空间各个通道:

彩色空间转换(RGB-HSI):

信号的傅里叶变换

图像的傅里叶变换

基于频域滤波的图像压缩

JPEG 压缩算法中的 DCT 部分

四.代码

1. 求 RGB 彩色空间各个通道

from skimage import data
from matplotlib import pyplot as plt
import numpy as np

image = data.logo()  # 载入测试图像
fig = plt.figure()
plt.rcParams['font.sans-serif'] = ['SimHei']
plt.rcParams['axes.unicode_minus'] = False
# 两行两列的第一个子图
axis = fig.add_subplot(221)
plt.axis('off')  # 不显示坐标轴
plt.imshow(image)  # 显示RGB彩色图像
plt.title('RGB图像')
# 第二个子图
axis = fig.add_subplot(222)
imageR = image[:, :, 0]
plt.axis('off')
plt.imshow(imageR, cmap='gray')  # 显示R通道图像
plt.title('R通道图像')
# 第三个子图
axis = fig.add_subplot(223)
imageG = image[:, :, 1]
plt.axis('off')
plt.imshow(imageG, cmap='gray')  # 显示G通道图像
plt.title('G通道图像')
# 第四个子图
axis = fig.add_subplot(224)
imageB = image[:, :, 2]
plt.axis('off')
plt.imshow(imageB, cmap='gray')  # 显示B通道图像
plt.title('B通道图像')
plt.show()
# plt.savefig('RGB通道图像.tif')   #也可以把结果保存为图像文件

2. 彩色空间转换(RGB-HSI)

import skimage
from matplotlib import pyplot as plt
import math
import numpy as np
import sys
from skimage import io


# 定义RGB转HSI
def rgb2hsi(r, g, b):
    r = r / 255
    g = g / 255
    b = b / 255
    h = 0
    num = 0.5 * ((r - g) + (r - b))
    den = ((r - g) * (r - g) + (r - b) * (g - b)) ** 0.5

    if b <= g:
        if den == 0:
            den = sys.float_info.min
        h = math.acos(num / den)
    elif b > g:
        if den == 0:
            den = sys.float_info.min
        h = (2 * math.pi) - math.acos(num / den)

    s = 1 - (3 * min(r, g, b) / (r + g + b))
    i = (r + g + b) / 3

    return int(h), int(s * 100), int(i * 255)


# 注意skimage中的图片读取方式
image = io.imread('lenacolor.png')
hsi_image = np.zeros(image.shape, dtype='uint8')
for ii in range(image.shape[0]):
    for jj in range(image.shape[1]):
        r, g, b = image[ii, jj, :]
        h, s, i = rgb2hsi(r, g, b)
        hsi_image[ii, jj, :] = (h, s, i)

plt.rcParams['font.sans-serif'] = ['SimHei']
plt.rcParams['axes.unicode_minus'] = False
plt.subplot(2, 3, 1)
plt.axis('off')
plt.imshow(image)
plt.title('RGB原图像')
plt.subplot(2, 3, 2)
plt.axis('off')
plt.imshow(image[:, :, 0], cmap='gray')
plt.title('R分量')
plt.subplot(2, 3, 3)
plt.axis('off')
plt.imshow(hsi_image)
plt.title('HSI图像')
plt.subplot(2, 3, 4)
plt.axis('off')
plt.imshow(hsi_image[:, :, 0], cmap='gray')
plt.title('H分量')
plt.subplot(2, 3, 5)
plt.axis('off')
plt.imshow(hsi_image[:, :, 1], cmap='gray')
plt.title('S分量')
plt.subplot(2, 3, 6)
plt.axis('off')
plt.imshow(hsi_image[:, :, 2], cmap='gray')
plt.title('I分量')
plt.savefig('HSIimage2.tif')

3. 信号的傅里叶变换

import matplotlib.pyplot as plt
import numpy as np

"""
中文显示工具函数
"""


def set_ch():
    from pylab import mpl
    mpl.rcParams['font.sans-serif'] = ['FangSong']
    mpl.rcParams['axes.unicode_minus'] = False


set_ch()


def show(ori_func, ft, sampling_period=5):
    n = len(ori_func)
    interval = sampling_period / n
    # 绘制原始函数
    plt.subplot(2, 1, 1)
    plt.plot(np.arange(0, sampling_period, interval), ori_func, 'black')
    plt.xlabel('时间'), plt.ylabel('振幅')
    plt.title('原始信号')
    # 绘制变换后的函数
    plt.subplot(2, 1, 2)
    frequency = np.arange(n / 2) / (n * interval)
    nfft = abs(ft[range(int(n / 2))] / n)
    plt.plot(frequency, nfft, 'red')
    plt.xlabel('频率 (Hz)'), plt.ylabel('频率谱')
    plt.title('傅里叶变换结果')
    plt.subplots_adjust(left=None, bottom=None, right=None, top=None, wspace=None, hspace=0.9)  # 调整子图间距
    plt.show()


# 生成频率为 1(角速度为 2 * pi)的正弦波
time = np.arange(0, 5, .005)
x = np.sin(5 * np.pi * 3 * time)
y = np.fft.fft(x)
show(x, y)

4. 图像的傅里叶变换

from skimage import data
import numpy as np
from matplotlib import pyplot as plt

"""
中文显示工具函数
"""


def set_ch():
    from pylab import mpl
    mpl.rcParams['font.sans-serif'] = ['FangSong']
    mpl.rcParams['axes.unicode_minus'] = False


set_ch()

img = data.coins()
f = np.fft.fft2(img)  # 快速傅里叶变换算法得到频率分布
fshift = np.fft.fftshift(f)  # 默认结果中心点位置是在左上角,转移到中间位置

fimg = np.log(np.abs(fshift))  # fft 结果是复数,求绝对值结果才是振幅

# 展示结果
plt.subplot(121), plt.imshow(img, 'gray'), plt.title('原始图像')
plt.subplot(122), plt.imshow(fimg, 'gray'), plt.title('傅里叶频谱')
plt.show()

5. 基于频域滤波的图像压缩

# 导入相关库
from skimage import data, color
import numpy as np
import matplotlib.pyplot as plt

"""
中文显示工具函数
"""


def set_ch():
    from pylab import mpl
    mpl.rcParams['font.sans-serif'] = ['FangSong']
    mpl.rcParams['axes.unicode_minus'] = False


set_ch()

D = 10
# 读入图片
new_img = data.astronaut()
new_img = color.rgb2gray(new_img)

# numpy中的傅里叶变化
f1 = np.fft.fft2(new_img)
f1_shift = np.fft.fftshift(f1)
# np.fft.fftshift()函数来实现平移,让直流分量在输出图像的重心

# 实现理想低通滤波器
rows, cols = new_img.shape
crow, ccol = int(rows / 2), int(cols / 2)  # 计算频谱中心
mask = np.zeros((rows, cols), np.uint8)  # 生成rows行cols的矩阵,数据格式为uint8
for i in range(rows):
    for j in range(cols):
        if np.sqrt(i * i + j * j) <= D:
            # 将距离频谱中心小于D的部分低通信息 设置为1,属于低通滤波
            mask[crow - D:crow + D, ccol - D:ccol + D] = 1
f1_shift = f1_shift * mask

# 傅里叶逆变换
f_ishift = np.fft.ifftshift(f1_shift)
img_back = np.fft.ifft2(f_ishift)
img_back = np.abs(img_back)
img_back = (img_back - np.amin(img_back)) / (np.amax(img_back) - np.amin(img_back))

# plt.figure(figsize=(15,8))
plt.figure()
plt.subplot(121), plt.imshow(new_img, cmap='gray'), plt.title('原始图像')
plt.subplot(122), plt.imshow(img_back, cmap='gray'), plt.title('滤波后图像')
plt.show()

6. JPEG 压缩算法中的 DCT 部分

# 基于离散余弦变换DCT的图像压缩
import cv2
import numpy as np
import matplotlib.pyplot as plt

img = cv2.imread('coffee.png', 0)  # 读取图片

img1 = img.astype('float')  # 将uint8转化为float类型

img_dct = cv2.dct(img1)  # 进行离散余弦变换

img_dct_log = np.log(abs(img_dct))  # 进行log处理

img_recor = cv2.idct(img_dct)  # 进行离散余弦反变换

# 图片压缩,只保留100*100的数据
recor_temp = img_dct[0:10, 0:10]
recor_temp2 = np.zeros(img.shape)
recor_temp2[0:10, 0:10] = recor_temp
# 压缩图片恢复
img_recor1 = cv2.idct(recor_temp2)
# 显示
plt.subplot(221)
plt.imshow(img)
plt.title('original')

plt.subplot(222)
plt.imshow(img_dct_log)
plt.title('dct transformed')

plt.subplot(223)
plt.imshow(img_recor)
plt.title('idct transformed')

plt.subplot(224)
plt.imshow(img_recor1)
plt.title('idct transformed2')
plt.subplots_adjust(left=None, bottom=None, right=None, top=None, wspace=None, hspace=0.9)  # 调整子图间距
plt.show()

五.实验结果与分析

求 RGB 彩色空间各个通道

Coffee

Retina

Logo

结果

彩色空间转换(RGB-HSI)

chelsea

Flower

lenacolor

结果

信号的傅里叶变换

频率为 1(角速度为 2 * pi)的正弦波

频率为 1(角速度为 3 * pi)的正弦波

频率为 5(角速度为 3 * pi)的正弦波

结果

图像的傅里叶变换

Camera

Brick

Coins

结果

基于频域滤波的图像压缩

Coffee

chelsea

astronaut

结果

 

JPEG 压缩算法中的 DCT 部分

保留100*100

保留10*10

结果

最后一个实验如果提示cv2第三方库找不到,可以试试安装opencv-contrib-python这个,安装完就可以了

六.实验心得体会

通过本次实验,我明白了怎么进行彩色空间转化,如何对图像进行压缩以及如何进行图像和信号的傅里叶变换的操作.对图像压缩的原理有有了新的体会.

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

【python】《多媒体技术与应用》实验报告「数字图像压缩」「傅里叶变换」 的相关文章

随机推荐

  • 【机器学习】用可视化的方式直观理解Bayesian models

    如果你感觉Bayesian models反直觉 不好理解 本期分享两个工具 利用可视化的直观方式探索贝叶斯模型 1 Python ArviZ 主要包含以下4方面功能 后验分析 posterior analysis 数据存储 data sto
  • 几款免费PDF合并成一个PDF的软件推荐,快收藏起来吧

    工作中 我们经常需要接收文件 而由于PDF文件具有较高的稳定性 所以它也成为人们发送文件的热门选择 而当需要发的PDF文件比较多时 一个个发送对方接收起来不方便也容易混乱 这时 我们将多个PDF文件合并成一个PDF文件就高效很多了 那么 P
  • umi Mock数据

    1 在mock文件夹下创建文件 export default GET api users users 1 2 api users 1 id 1 GET可忽略 POST api users create req res gt 和express
  • 如何确保网站的安全性

    大部分企业通过网站平台来进行信息发布 交流及宣传 推广企业业务 用户可以通过网站对企业进行初步的了解 并进一步获取咨询服务 企业网站不光是一个展示企业形象的平台 更是一种有效的营销方式 当然其安全性也是至关重要 随着网站的普遍应用 企业网站
  • 基于 STM32CubeMX 添加 RT-Thread 操作系统组件(四)- 多线程SRAM动态内存

    概述 本篇主要介绍这么使用STM32CubeMx工具添加RT Thread操作系统组件 码代码的IDE是keil 介绍单线程SRAM静态内存使用 如果还不知道 这么使用STM32CubeMx工具添加RT Thread操作系统组件 请移步到
  • PageRank算法 -- 从原理到实现

    本文整理自博文PageRank算法 从原理到实现 1 算法来源 这个要从搜索引擎的发展讲起 最早的搜索引擎采用的是 分类目录1的方法 即通过人工进行网页分类并整理出高质量的网站 那时 Yahoo 和国内的 hao123 就是使用的这种方法
  • Android学习笔记(五)--(可调节)模糊效果

    很多时候点开一个button的时候或者弹出某个提示的时候 背景都会变成模糊的或者说是虚化的 而今天 我们就来实现一下动态模糊效果 可以通过控制条或者手势来操控模糊程度 之前自己也做了一个 但是发现会有卡顿 在论坛逛了一会儿就发现果然有一个巧
  • 我的2020工作与学习总结

    我的2020总结 今天是2020年12月30日 马上就要开始新的一年了 在出差途中简单做个总结 总结我2020这平凡而又充实的一年 学习和生活方面 回忆起我去年做的总结我的2019 这两年都是收获满满 我19年大学毕业 其实目前我已经工作两
  • app客户端与服务器数据交互时—数据加密

    总结 1 对称加密加密与解密使用的是同样的密钥 所以速度快 但由于需要将密钥在网络传输 所以安全性不高 2 非对称加密使用了一对密钥 公钥与私钥 所以安全性高 但加密与解密速度慢 3 解决的办法是将对称加密的密钥使用非对称加密的公钥进行加密
  • vue json对象转数组_vue-vue-router 快速了解,多看看能扎实基础

    看着这么多房子头都晕了 不知道从哪里回家 概述 vue router是Vue js官方的路由插件 它和vue js是深度集成的 适合用于构建单页面应用 vue的单页面应用是基于路由和组件的 路由用于设定访问路径 并将路径和组件映射起来 传统
  • 03模板学习之函数模板案例-写一个int,char通用的冒泡

    03模板学习之函数模板案例 写一个int char通用的冒泡 1 直接看代码 模板测试 cpp 此文件包含 main 函数 程序执行将在此处开始并结束 include
  • windows terminal使用git bash

    1 在微软应用商店下载 windows terminal 1 打开 Windows Terminnal 的设置界面 点击添加新配置文件添加配置如下 即在json配置文件中添加 commandline D Git bin bash exe l
  • ChatGPT的前世今生

    作者 符尧等 编辑 夕小瑶的卖萌屋 点击下方卡片 关注 自动驾驶之心 公众号 ADAS巨卷干货 即可获取 点击进入 自动驾驶之心 全栈算法 技术交流群 正文 最近 OpenAI的预训练模型ChatGPT给人工智能领域的研究人员留下了深刻的印
  • java中需要注意的一些代码编写规范

    一 编程规约 1 命名风格 常量命名全部大写 单词间用下划线隔开 力求语义表达完整清楚 不要嫌名字长 POJO 类中的任何布尔类型的变量 都不要加 is 前缀 否则部分框架解析会引起序列化错误 杜绝完全不规范的缩写 避免望文不知义 在常量与
  • 13.按平均成绩从高到低显示所有学生的所有课程的成绩以及平均成绩

    题目的数据来源于50道SQL练习题及参考答案 原创 Hill GM的博客 CSDN博客 sql编程题目 建表和链接里面的是一样的 解决的思路 首先将每个学生的各科成绩放在同一行显示 select st sc1 score 语文 sc2 sc
  • vue3中使用echarts的子组件接收父级传来参数,并重新渲染 +++watch监听的用法

    1 父组件页面
  • java小说摸鱼

    import org jsoup Jsoup import org jsoup nodes Document import org jsoup nodes Element import java net HttpURLConnection
  • vs编译linux内核,VSCode远程开发Linux内核驱动

    受够了Vim的换台电脑就要倒腾N天配置的折磨 受够了Windows下Source Insight眼花的界面 这些软件虽然很多人在用 但是缺点也不少 然而Linux内核代码非常庞大 编译内核又需要在Linux下进行 有没有一种能在Window
  • TCL字符串操作

    format命令 因为 TCL 把所有的输入都当作字符串看待 所以 TCL 提供了较强的字符串操作功能 TCL 中与 字符串操作有关的命令有 string format regexp regsub scan 等 语法 format form
  • 【python】《多媒体技术与应用》实验报告「数字图像压缩」「傅里叶变换」

    多媒体技术与应用 实验报告 实验名称 实验二 数字图像压缩 实验时间 2022 4 11 姓名 班级 计非201 学号 成绩 实验目的 理解图像压缩的主要原则和目的 理解有损和无损压缩的概念 了解几种常用的图像压缩编码方法 利用 Pytho