Pytorch学习笔记——风格迁移

2023-10-27

import torch
import torch.nn as nn
from torch.autograd import Variable
import torchvision
from torchvision import transforms, models
from PIL import Image
import argparse
import numpy as np
import os

use_gpu = torch.cuda.is_available()# 是否能够使用GPU

dtype = torch.cuda.FloatTensor if use_gpu else torch.FloatTensor  #判断数据允许GPU 否则CPU tensor
#导入数据
def load_image(image_path, transforms=None, max_size=None, shape=None):
    image = Image.open(image_path)#打开图片  image_path 为图片路径
    image_size = image.size #图片大小

    if max_size is not None:
        #获取图像size，为sequence
        image_size = image.size
        #转化为float的array
        size = np.array(image_size).astype(float)
        size = max_size / size * size;
        image = image.resize(size.astype(int), Image.ANTIALIAS)

#Image.ANTIALIAS在当前的PIL版本中，这个滤波器只用于改变尺寸和缩略图方法。

if shape is not None: image = image.resize(shape, Image.LANCZOS)#Image.LANCZOS 缩小图片比例
#必须提供transform.ToTensor，转化为4D Tensor .unsqueeze(0)表示增维 .squeeze(0)为降维
if transforms is not None: image = transforms(image).unsqueeze(0) #是否拷贝到GPU return image.type(dtype)class VGGNet(nn.Module): def __init__(self): super(VGGNet, self).__init__() self.select = ['0', '5', '10', '19', '28']#设置需要提取的 self.vgg19 = models.vgg19(pretrained = True).features def forward(self, x): features = [] #name类型为str，x为Variable for name, layer in self.vgg19._modules.items(): x = layer(x) if name in self.select: features.append(x) return featuresdef main(config): #定义图像变换操作，必须定义.ToTensor()。 transform = transforms.Compose( [transforms.ToTensor(), transforms.Normalize((0.485, 0.456, 0.406), (0.229, 0.224, 0.225)) ]) #加速content和style图像，style图像resize成同样大小 content.size(0-3)：0表示batch 1表示通道，2，3表示图片大小 content = load_image(config.content, transform, max_size = config.max_size) style = load_image(config.style, transform, shape = [content.size(2), content.size(3)]) #.clone()将concent复制一份作为target，并需要计算梯度，作为最终的输出
target = Variable(content.clone(), requires_grad = True) optimizer = torch.optim.Adam([target], lr = config.lr, betas=[0.5, 0.999]) vgg = VGGNet() if use_gpu: vgg = vgg.cuda() for step in range(config.total_step): #分别计算5个特征图 target_features = vgg(target) content_features = vgg(Variable(content)) style_features = vgg(Variable(style)) content_loss = 0.0 style_loss = 0.0 for f1, f2, f3 in zip(target_features, content_features, style_features): #计算content_loss content_loss += torch.mean((f1 - f2)**2) # **表示上标 **2 表示平方 n, c, h, w = f1.size() #将特征reshape成二维矩阵相乘，求gram矩阵 f1 = f1.view(c, h * w) f3 = f3.view(c, h * w) f1 = torch.mm(f1, f1.t())#f1.t() 表示f1的转置，但不改变f1
f3 = torch.mm(f3, f3.t()) #计算style_loss style_loss += torch.mean((f1 - f3)**2) / (c * h * w) #计算总的loss loss = content_loss + style_loss * config.style_weight #反向求导与优化 optimizer.zero_grad() loss.backward() optimizer.step() if (step+1) % config.log_step == 0: print ('Step [%d/%d], Content Loss: %.4f, Style Loss: %.4f' %(step+1, config.total_step, content_loss.data[0], style_loss.data[0])) if (step+1) % config.sample_step == 0: # Save the generated image denorm = transforms.Normalize((-2.12, -2.04, -1.80), (4.37, 4.46, 4.44)) img = target.clone().cpu().squeeze() img = denorm(img.data).clamp_(0, 1) torchvision.utils.save_image(img, 'output-%d.png' %(step+1))if __name__ == "__main__": parser = argparse.ArgumentParser() parser.add_argument('--content', type=str, default='content.jpg') parser.add_argument('--style', type=str, default='style.jpg') parser.add_argument('--max_size', type=int, default=400) parser.add_argument('--total_step', type=int, default=5000) parser.add_argument('--log_step', type=int, default=10) parser.add_argument('--sample_step', type=int, default=1000) parser.add_argument('--style_weight', type=float, default=100) parser.add_argument('--lr', type=float, default=0.003) config = parser.parse_args() print(config) main(config)

下图为Pytorch 自带VGG19的网络结构，程序所取卷积层为1，3，5，9，12。

左侧图片是content，右侧图片是style

下面是左上到右下分别是迭代1000，2000，3000，4000的风格迁移后的图片

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

神经网络

Pytorch

Pytorch学习笔记——风格迁移的相关文章

用我自己的值初始化pytorch卷积层

我想知道是否有办法用我自己的值初始化 pytorch 卷积过滤器例如我有一个元组 0 8423 0 3778 3 1070 2 6518 我想用这些值初始化 2X2 过滤器我该怎么做我查找了一些答案但他们大多使用火炬正态分布和其他
pytorch - “conv1d”在哪里实现？

我想看看 conv1d 模块是如何实现的https pytorch org docs stable modules torch nn modules conv html Conv1d https pytorch org docs stabl
Pytorch 数据加载器：错误的文件描述符和 EOF > 0

问题描述在使用由自定义数据集制作的 Pytorch 数据加载器进行神经网络训练期间我遇到了奇怪的行为数据加载器设置为workers 4 pin memory False 大多数时候训练都顺利完成有时训练会随机停止并出现以下错误
Pytorch 分析器显示两个不同网络的卷积平均执行时间不同

我有两个网络我正在对它们进行分析以查看哪些操作占用了大部分时间我注意到CUDA time avg为了aten conv2d不同网络的操作有所不同这也增加了一个数量级在我的第一个网络中它是22us 而对于第二个网络则是3ms 我的第
如何使用 torch.stack？

我该如何使用torch stack将两个张量与形状堆叠a shape 2 3 4 and b shape 2 3 没有就地操作堆叠需要相同数量的维度一种方法是松开并堆叠例如 a size 2 3 4 b size 2 3 b torc
pytorch通过易失性变量反向传播错误

我试图通过多次向后传递迭代来运行它并在每个步骤更新输入从而最小化相对于某个目标的一些输入第一遍运行成功但在第二遍时出现以下错误 RuntimeError element 0 of variables tuple is volatile
通过 Conda 安装 PyTorch

目标使用 pytorch 和 torchvision 创建 conda 环境 Anaconda 导航器 1 8 3 python 3 6 MacOS 10 13 4 我尝试过的在Navigator中创建了一个新环境尝试安装 pyto
RuntimeError：维度指定为 0 但张量没有维度

我试图使用 MNIST 数据集实现简单的 NN 但我不断收到此错误将 matplotlib pyplot 导入为 plt import torch from torchvision import models from torchvisi
预训练 Transformer 模型的配置更改

我正在尝试为重整变压器实现一个分类头分类头工作正常但是当我尝试更改配置参数之一 config axis pos shape 即模型的序列长度参数时它会抛出错误 Reformer embeddings position embeddin
在 C++ API 中将一个张量的一大块复制到另一个张量中

我需要复制一行一个张量在c API 转换为另一个张量的某些部分其中开始和结束索引可用在 C 中我们可以使用类似的东西 int myints 10 20 30 40 50 60 70 std vector
为什么测试时一定要用DataParallel？

在GPU上训练 num gpus设置为1 device ids list range num gpus model NestedUNet opt num channel 2 to device model nn DataParallel m
运行时错误：CUDA 错误：设备端断言已触发 - 训练 LayoutLMV3 时

我正在训练最新版本的layoutLMv3模型但在开始训练时trainer train 出现以下错误请帮我解决它我使用的是 v100 4 GPU RuntimeError Traceback most recent call last
将 CNN Pytorch 中的预训练权重传递到 Tensorflow 中的 CNN

我在 Pytorch 中针对 224x224 大小的图像和 4 个类别训练了这个网络 class CustomConvNet nn Module def init self num classes super CustomConvNet s
如何避免 PyTorch 中的“CUDA 内存不足”

我认为对于 GPU 内存较低的 PyTorch 用户来说这是一个非常常见的消息 RuntimeError CUDA out of memory Tried to allocate X MiB GPU X X GiB total capac
torchvision.transforms.Normalize 是如何操作的？

我不明白如何标准化Pytorch works 我想将平均值设置为0和标准差1跨越张量中的所有列x形状的 2 2 3 一个简单的例子 gt gt gt x torch tensor 1 2 3 4 5 6 7 8 9 10 11 12 gt
PyTorch：如何检查训练期间某些权重是否没有改变？

如何检查 PyTorch 训练期间某些权重是否未更改据我了解一种选择可以是在某些时期转储模型权重并检查它们是否通过迭代权重进行更改但也许有一些更简单的方法有两种方法可以解决这个问题 First for name param in
从打包序列中获取每个序列的最后一项

我试图通过 GRU 放置打包和填充的序列并检索每个序列最后一项的输出当然我的意思不是 1项目但实际上是最后一个未填充的项目我们预先知道序列的长度因此应该很容易为每个序列提取length 1 item 我尝试了以下方法 impor
如何在 PyTorch 中对子集使用不同的数据增强

如何针对不同的情况使用不同的数据增强转换 Subset在 PyTorch 中吗例如 train test torch utils data random split dataset 80000 2000 train and test将具
ValueError：使用火炬张量时需要解压的值太多

对于神经网络项目我使用 Pytorch 并使用 EMNIST 数据集已经给出的代码加载到数据集中 train dataset dsets MNIST root data train True transform transforms T
PyTorch：如何批量进行推理（并行推理）

如何在PyTorch中批量进行推理如何并行进行推理以加快这部分代码的速度我从进行推理的标准方法开始 with torch no grad for inputs labels in dataloader predict inputs in

随机推荐

java实现远程桌面_?启迪云技术栈

Openstack面板或命令行提供两种方式来对客户虚拟机进行远程桌面访问 VNC控制台和SPICE HTML5 VNC控制台 Openstack提供一个组件nova novncproxy 它允许用户通过浏览器或vnc客户端来访问虚拟机通常
react函数式组件之兄弟组件中的方法互相调用

最新更新时间 2022年01月15日14 40 31 猛戳查看我的博客地图总有你意想不到的惊喜本文内容一个父组件和两个子组件三个组件都是函数式组件子组件1需要调用子组件2的方法同时子组件2需要调用子组件1的方法技术方案分析
openssl从内存中读取RSA公钥

背景近期需要在项目中进行RSA签名验证厂商会给出pem格式的RSA公钥在以往项目中使用openssl读取RSA公钥时基本都是从pem文件中读取基本没什么问题可最近由于项目需要需要从数据库中读取RSA公钥经查资料发现openssl
amos看拟合度在哪里看_AMOS分析技术：模型整体拟合度指标

基础准备上篇文章草堂君介绍了如何检验结构方程模型的拟合效果包括整体模型拟合度指标测量模型质量指标和结构模型质量指标其中分析测量模型和结构模型质量的方法是我们前面介绍过的因子分析和路径分析大家可以点击下方文章链接回顾草堂君今天将
矩阵计算误差分析(条件数和范数)

矩阵计算误差分析条件数和范数引言误差问题是不可避免的在大量的数据样本中如果能去掉部分可能造成误差很大的样本那么对于应用矩阵得到的结果的可靠性则大大加强例如有999个员工的月收入为 1 0 4 10 4 104元马云的月收入为
golang xml 递归嵌套解析
简单的跑马灯程序+中断处理

l 利用 P3 2 的外部中断触发功能通过按键产生外部中断 0 l 主程序是一个普通跑马灯程序 l 主程序执行时按 P3 2 键产生外部中断 0 进入中断处理程序 l 要求记忆按键次数并在指示灯上进行显示当第 N 次按键时显示灯
error: L6047U: The size of this image (32868 bytes) exceeds the maximum allowed for this version of

keil编译stm32出现 OBJ Template axf error L6047U The size of this image 32868 bytes exceeds the maximum allowed for this vers
VC录音机程序开发过程

1 常见的数据类型与数据结构 HWAVEIN m hwavin 输入设备句柄在录音时要用 HWAVEOUT m hwavout 输出设备句柄在回放时要用 WAVEFORMATEX m waveform 设置采集的声音格式 WAVEHDR
html5测试苹果8p多少分,苹果8p处理器是a几？苹果8p处理器相当于骁龙多少

苹果8p处理器是a11 它有两个高性能核心四个节能核心共同组成速度要比苹果7快四分之一采用的是台积电的10纳米技术生产的跑分的结果是单核4260分多核10221分苹果8p的处理器相当于骁龙的855 并且性能要更强虽然是2017
c4d问题一：如何将坐标轴对齐到模型的地面中间处，也就是归零到世界坐标轴中心原点处，问题二：如何把模型刚好对齐到地面上

问题一如何将坐标轴对齐到模型的地面中间处也就是归零到世界坐标轴中心原点处一定要归零如上图所示的世界坐标轴才可以不能调整右边那个坐标问题二如何把模型刚好对齐到地面上使用地面对齐插件即可一键对齐到地面了
路由协议的优先级，以及管理距离AD和metric的区别

路由协议的优先级 Preference 即管理距离Administrative Distance 一般为一个0到255之间的数字数字越大则优先级越低表一是通常情况下各路由协议的优先级规定表一一般路由协议优先级路由协议优先级 DI
Spring实现控制反转（IOC）的三种方式（三）——自动装配

续 Spring实现控制反转 IOC 的三种方式零理解IOC Spring实现控制反转 IOC 的三种方式一属性注入 Spring实现控制反转 IOC 的三种方式二构造器注入前面简单的说了Spring IOC注入实例的两种方式
element中this.$confirm的用法，element-ui MessageBox 弹框怎么隐藏右上角的关闭按钮呢？element-ui MessageBox 弹框怎么设置点击空白处不关闭？

项目场景 element ui MessageBox 弹框怎么隐藏右上角的关闭按钮呢 element ui MessageBox 弹框怎么设置点击空白处不关闭如何隐藏this c o n f i r m
R语言抽样技术

前言 R语言数据挖掘一工作路径的获取和相关包载入 getwd library MASS library sampling 二抽样技术 1 简单抽样有放回简单抽样代码如下示例 set seed 2 从iris数据集中有放回的随机抽
pyqt5 QFrame 设置背景图片

QFrame设置背景与QLabel设置背景API不一样 bg1 frozen dir resource path r resource background1 png bg2 frozen dir resource path r reso
排序算法集合 -3

7 插入排序 Insertion Sort 插入排序最好的运行时间是O n 已经排序好了情况下平均情况最情况都是O n2 所以处理随机的未排序数据时并不是好的算法通过将每个新元素与已经排序好的元素做比较并将其插入到正确的位置来建立一个
[机缘参悟-73]：深度思考：心智提升的七个阶段

目录一何谓心智二人的心智发展阶段第一阶段无自我觉察无知情绪化第二阶段自我反思觉知自省第三阶段掌控情绪理性思考第四阶段知行合一闭环复盘持续改进第五阶段专注忘我长期舍得专注第六阶段无我利他
MK趋势检验+Kendalls taub等级相关+稳健回归(Sens slope estimator等)

python中的Mann Kendall单调趋势检验及原理说明 liucheng zimozigreat的博客 CSDN博客 mann kendall python 前提假设当没有趋势时随时间获得的数据是独立同分布的独立的假设是说数
Pytorch学习笔记——风格迁移

import torch import torch nn as nn from torch autograd import Variable import torchvision from torchvision import transf

Pytorch学习笔记——风格迁移

Pytorch学习笔记——风格迁移 的相关文章

随机推荐

热门标签

Pytorch学习笔记——风格迁移的相关文章