FCN模型训练中遇到的困难

2023-11-18

FCN模型训练中遇到的困难

标签：深度学习 FCN 神经网络 caffe

2017-02-24 10:54 2675人阅读评论(6) 收藏举报

分类：

深度学习（18）

前前后后大概忙了3个月了中间穿插了导师给的项目和论文的任务总算把fcn给run起来了

之前也有参考一些博客作为指导不过博客有的是有误导性的导致我的loss居高不下根本不收敛

还有一些奇奇怪怪的问题我在下面逐一列举

个人有一篇从零开始运行FCN的博客如果需要的话可以去看下：http://blog.csdn.net/wangkun1340378/article/details/70238290

问题1.使用infer.py时候遇到no display name and no $DISPLAY environment variable

出现这个问题是由于在远程服务器上运行并且服务器上没有显卡直接导致plt无法运行所以报错

2个解决方法：

方法一：

在infer.py中加入

import cv2

print type(out)
print out, out.shape
cv2.imwrite("output.png", out)

用cv2来保存图片，并且注释掉plt

不过这样虽然能保存图片但是图片效果不行具体表现为颜色不对结果可以看下图

正确的结果如下所示大家可以对比一下

如果觉得方法一不行就采用方法2

方法2：采用python notebook

用本机访问自己在远程服务器上的账号在本机上执行代码

问题2：lisi out of range

这个是由于solve.py中

caffe.set_device(int(sys.argv[1]))
caffe.set_mode_gpu()

可以把这两行代码注释掉或者利用nvidia-smi看看存在那个gpu就选那个gpu

问题3：no module named caffe

方法在py文件import caffe前加上

import sys
sys.path.append('/home/my/caffe-master/caffe-master/python')

具体路径根据自己实际情况而定

问题4:no module named XXX

解决方法把fcn.berkeleyvision.org-master目录下所有的py文件统统复制到你的solve.py所在的文件夹

例如 surgery 等等等等

问题5,：利用得到的model怎么测试图片

方法：运行fcn.berkeleyvision.org-master目录下的infer.py文件，注意修改model路径和deploy文件路径，还有测试图片路径

[html] view plain copy

import numpy as np
from PIL import Image
import matplotlib.pyplot as plt
import sys
sys.path.append('/home/my/caffe-master/caffe-master/python')
import caffe
import cv2
# load image, switch to BGR, subtract mean, and make dims C x H x W for Caffe
im = Image.open('test_3.jpg')
in_ = np.array(im, dtype=np.float32)
in_ = in_[:,:,::-1]
#in_ -= np.array((104.00698793,116.66876762,122.67891434))
#in_ -= np.array((111.67446899,109.91841125,105.24302673))
in_ -= np.array((105.24302673,109.91841125,111.67446899))
in_ = in_.transpose((2,0,1))
# load net
#net = caffe.Net('deploy.prototxt', 'siftflow-fcn32s-heavy.caffemodel', caffe.TEST)
net = caffe.Net('deploy.prototxt', 'siftflow-fcn32s/train_iter_100000.caffemodel', caffe.TEST)
#net = caffe.Net('deploy.prototxt', 'train_iter_96000.caffemodel', caffe.TEST)
# shape for input (data blob is N x C x H x W), set data
net.blobs['data'].reshape(1, *in_.shape)
net.blobs['data'].data[...] = in_
# run net and take argmax for prediction
net.forward()
out = net.blobs['score_sem'].data[0].argmax(axis=0)
#out = net.blobs['score_geo'].data[0].argmax(axis=0)
#print type(out)
#print out, out.shape
#cv2.imwrite("output.png", out)
plt.imshow(out,cmap='gray');
plt.imshow(out);
plt.axis('off')
plt.savefig('test_3_out.png')
plt.show()

如上面代码所示

[html] view plain copy

net = caffe.Net('deploy.prototxt', 'siftflow-fcn32s/train_iter_100000.caffemodel', caffe.TEST)

其中

[html] view plain copy

siftflow-fcn32s/train_iter_100000.caffemodel

为模型所在路径，deploy文件如果没有可以参照一下方法

首先，根据你利用的模型，例如模型是siftflow32s的，那么你就去siftflow32s的文件夹，

里面有train.prototxt文件，将文件打开，全选，复制，新建一个名为deploy.prototxt文件，粘贴进去，

然后ctrl+F 寻找所有名为loss的layer 只要有loss 无论是loss还是geo_loss 将这个layer统统删除

然后在文件顶部加上

layer {
name: "input"
type: "Input"
top: "data"
input_param {
# These dimensions are purely for sake of example;
# see infer.py for how to reshape the net to the given input size.
shape { dim: 1 dim: 3 dim: 256 dim: 256 }
}
}

其中shape{dim:1 dim:3 dim:256 dim:256}这两个256，是由于我的测试图片是256X256 如果你的是500X500 那你就将最后两个dim改为500 500

需要注意的是如果你执行的是siftflow32s，你没有deploy，你需要加入inputdata layer，你如果执行sififlow16s的model 那么是不需要加inputdata layer的

因为他们的train.prototxt文件里已经有了inputdata layer

问题6：

利用得到的模型测试单张图片结果全黑

这个问题可能有多个原因

原因1：在于loss太高模型未收敛或者 deploy文件的参数设置有误。

原因2：如果针对sififlow数据集那么请保证deploy文件的准确性

原因3：infer.py的有误没有将

out = net.blobs['score'].data[0].argmax(axis=0)

改成

out = net.blobs['score_sem'].data[0].argmax(axis=0)

问题7：

在训练过程中，loss高居不下，模型不收敛

原因：

这个问题的原因有很多，我只能说出个人的经历，我开始训练时候，模型也是不收敛，在这里我详细说明一下这个问题的处理方式

首先，我在根据siftflow数据集训练fcn32s的模型时候遇到了这种情况，模型的loss高居不下，训练10w次，loss依然高于2w

这是由于我参照的博客的说明有误

在这里郑重声明一下：如果训练fcn32s的网络模型，

一定不要将fc6，fc7重新命名，

并且一定要修改solve.py

利用transplant的方式获取vgg16的网络权重；

具体操作为

[html] view plain copy

import sys
sys.path.append('/home/my/caffe-master/caffe-master/python')
import caffe
import surgery, score
import numpy as np
import os
import sys
try:
import setproctitle
setproctitle.setproctitle(os.path.basename(os.getcwd()))
except:
pass
vgg_weights = '../ilsvrc-nets/vgg16-fcn.caffemodel'
vgg_proto = '../ilsvrc-nets/VGG_ILSVRC_16_layers_deploy.prototxt'
weights = '../ilsvrc-nets/vgg16-fcn.caffemodel'
# init
caffe.set_mode_gpu()
# caffe.set_device(int(sys.argv[0]))
caffe.set_device(7)
#solver = caffe.SGDSolver('solver.prototxt')
#solver.net.copy_from(weights)
solver = caffe.SGDSolver('solver.prototxt')
vgg_net=caffe.Net(vgg_proto,vgg_weights,caffe.TRAIN)
surgery.transplant(solver.net,vgg_net)
del vgg_net
# surgeries
interp_layers = [k for k in solver.net.params.keys() if 'up' in k]
surgery.interp(solver.net, interp_layers)
# scoring
test = np.loadtxt('../data/sift-flow/test.txt', dtype=str)
for _ in range(50):
solver.step(2000)
# N.B. metrics on the semantic labels are off b.c. of missing classes;
# score manually from the histogram instead for proper evaluation
score.seg_tests(solver, False, test, layer='score_sem', gt='sem')
score.seg_tests(solver, False, test, layer='score_geo', gt='geo')

可以看到我注释了

[html] view plain copy

#solver = caffe.SGDSolver('solver.prototxt')
#solver.net.copy_from(weights)

[html] view plain copy

添加了

[html] view plain copy

solver = caffe.SGDSolver('solver.prototxt')
vgg_net=caffe.Net(vgg_proto,vgg_weights,caffe.TRAIN)
surgery.transplant(solver.net,vgg_net)
del vgg_net

并且在import后添加了

[html] view plain copy

vgg_weights = '../ilsvrc-nets/vgg16-fcn.caffemodel'
vgg_proto = '../ilsvrc-nets/VGG_ILSVRC_16_layers_deploy.prototxt'
weights = '../ilsvrc-nets/vgg16-fcn.caffemodel'

关于

[html] view plain copy

VGG_ILSVRC_16_layers_deploy.prototxt

我附上我的百度网盘的链接如果大家找不到可以在这里下载

http://pan.baidu.com/s/1geLL6Sz

如果训练fcn16s，则可以直接copy自己的fcn32s的model的权重，不需要transplant，也就是不需要修改solve.py

如果训练fcn8s，则可以直接copy自己的fcn16s的model的权重，不需要transplant,也就是不需要修改solve.py

总的来说，算是在自己的fcn道路上成功踏出了第一步，上面的问题有的是请教自己的学长，有的是百度或者google，有的是和网友交流得来的心得

下面附上几个之前参考的博客

[html] view plain copy

http://www.cnblogs.com/xuanxufeng/p/6240659.html

[html] view plain copy

http://www.cnblogs.com/xuanxufeng/p/6243342.html

顺便感谢踏雪霏鸿，一生不可自决，与人不争，大喷菇等人的帮助以上！

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

语义分割

FCN模型训练中遇到的困难的相关文章

UNet+ResNet50

欢迎加群 1012878218 一起学习交流强化学习里面会有关于深度学习机器学习强化学习的各种资料我们对UNet进行了改进使用ResNet 50的卷积神经网络进行下采样这样带来的好处有以下几点 1 加深网络层数提高了网络的分
【语义分割】4、DFANet: Deep Feature Aggregation for Real-Time Semantic Segmentation

文章目录摘要 1 引言 2 相关工作 3 深层特征聚合网络 3 1 Observations 3 2 深层特征聚合 3 3 网络结构 4 实验 4 1 DFA 结构的分析 4 1 1 轻量级 backbone 网络 4 1 2 特征聚合
超详细！手把手带你轻松用 MMSegmentation 跑语义分割数据集

在带你轻松掌握 MMSegmentation 整体构建流程一文中我们带大家认识了 MMSegmentation 的整体框架分享了 MMSegmentation 中已经复现的主流语义分割模型 OpenMMLab 超详细带你轻松掌握 MM
语义分割研究现状

以语义分割热门的数据集Cityscapes的精度作为参考比较当前语义分割网络效果可以通过ICNet中的这张图来说明目前大多数方法的精度以及速度目前MIOU超过80的有PSPNet ResNet38 PSPNet DUC 以及DANet
Panoptic SegFormer：全景分割第一名！南大&港大&英伟达提出新算法，霸榜全景分割

轻量级全景分割模型50多m 有预测代码没有训练 GitHub midasklr PPLiteSeg pytorch pytorch of the SOTA real time segmentation network ppliteseg
yolov7 mask 使用学习笔记

目录 yolov7 mask trt安装笔记安装detectron方法1 OK 安装detectron方法2 pip install regex 4 1 无法找到头文件 math h fatal error C1083 安装cocoapi
基于深度学习的图像分割总结

一图像分割类别随着深度学习的发展在分割任务中出现了许多优秀的网络根据实际分割应用任务的不同可以大致将分割分为三个研究方向语义分割实例分割全景分割这三种分割在某种意义上是具有一定的联系的语义分割像素级别的语义分割对图像
【论文翻译-2】BiO-Net: Learning Recurrent Bi-directional Connections for Encoder-Decoder Architecture

BiO Net Learning Recurrent Bi directional Connections for Encoder Decoder Architecture 源自 MICCAI2020 Medical Image Compu
利用MMSegmentation微调Mask2Former模型

前言本文介绍了专用于语义分隔模型的python库mmsegmentation github项目地址运行环境为Kaggle notebook GPU为P100 针对环境配置预训练模型推理在西瓜数据集上微调新sota模型mask2for
ENet分割笔记

https github com cswhshi segmentation blob master ENet py 权重1 21m 但是内存占用较大 2080ti上batch size为8 coding utf 8 import torch
CVPR2023 语义分割论文合集

国际计算机视觉与模式识别会议 CVPR 是计算机科学领域中的顶级会议之一也是图像处理机器学习人工智能等多个领域的交叉学科会议每年的CVPR会议都会有大量的论文投稿和学术交流活动其中涵盖了包括图像处理计算机视觉模式识别机器学习
【语义分割】8、Self-Regulation for Semantic Segmentation

文章目录一背景二动机三方法 SR F Loss Shallow to Deep SR L Loss Deep to Shallow 四效果论文地址 https arxiv org pdf 2108 09702 pdf 代码地
语义分割系列26-VIT+SETR——Transformer结构如何在语义分割中大放异彩

SETR Rethinking Semantic Segmentation from a Sequence to Sequence Perspectivewith Transformers 重新思考语义分割范式使用Transformer实
憨批的语义分割重制版4——TF2 搭建自己的PSPNet语义分割平台

憨批的语义分割重制版4 TF2 搭建自己的PSPNet语义分割平台学习前言什么是PSPNet模型代码下载 PSPNet实现思路一预测部分 1 主干网络介绍 2 加强特征提取结构 3 利用特征获得预测结果二训练部分 1 训练文件
深度学习模型试跑(七):SETR(Swin-Transformer-Semantic-Segmentation版)

文章目录一前言二环境搭建 1 安装cuda和对应的cudnn 2 安装vs2019 3 安装pytorch 4 安装mmcv 和 mmsegmentation 5 拷贝MMSegmentation 三测试四训练一前言源码
语义分割总结（未完待续）

一综述由于工作中很长一段时间都是在做语义分割系列的工作所以这篇文章主要对自己用到的一些方法做个简单的总结包括其优缺点等以便日后能够及时复习查看目前语义分割的方法主要集中在两个大的结构上 1 encode decode的结构图像
【语义分割】12、Fully Attentional Network for Semantic Segmentation

文章目录一背景和动机二方法三效果出处 AAAI2022 一背景和动机语义分割中 non local NL 的方法起到了很好了捕捉 long range 信息的作用大致可分为 Channel non local 和 Spa
论文阅读-多任务(2020)-KL4MTL：用于多任务学习的知识蒸馏方法

KL4MTL 论文 Knowledge Distillation for Multi task Learning 地址 https paperswithcode com paper knowledge distillation for mu
跑通SOLOV1-V2实例分割代码，并训练自己的数据集。

系统平台 Ubuntu18 04 硬件平台 RTX2080 super cuda和cudnn版本 cuda10 0 cudnn 7 5 6 pytorch版本 pytorch1 2 0 环境安装创建solo虚拟环境 conda creat
2017 ICCV之语义分割：Cascaded Feature Network for Semantic Segmentation of RGB-D Images

Cascaded Feature Network for Semantic Segmentation of RGB D Images 目前的问题 1 为了计算对象场景关系的表示最近大量的分割网络使用一组感受野来丰富卷积特征的文本信息这

随机推荐

Your account has been blocked问题解决

更新代码时报错如下 branches to build service 1 get branch service to dir service only update code Your account has been blocked
2020规划调整,以自研引擎和osg/osgearth源码分析为主

随着公司转入webgl 我要求调整到osg osgearth工具因为是c 方面的特别是osg osgearth源码可以深入下以前光把视频教程看过说白了就是简单二次应用并没有深入下去所以趁此机会多读读osg osgearth源码
计算机系统（一）——冯诺依曼体系

现代计算机的基本结构是由冯诺依曼提出的冯诺依曼的体系结构体系如下图所示计算机由运算器控制器存储器也就是内存输入设备输出设备五大部件组成其中运算器和控制器组成cpu 在冯诺依曼体系中数据先从输入设备输入到内存中运算时数据从
解决使用SpringBoot上传文件大小受限问题

今天在做项目学习的过程中需要用到文件上传启动项目正常访问上传post请求突然报出了一个异常特此记录一下 1 控制台异常 org springframework web multipart MaxUploadSizeExceededE
一起赚美元①

译者一只椰子知识星球链接 https t zsxq com iAiIyfm 本文的主人公叫迈克他在采访里面提到自动化工具这一法宝已经轻松帮他实现每个月 12 5万美元的利润对他而言年入100万美元根本不是梦 1 主人公简介我
看完这篇，成为Grafana高手！

背景 QQ直播前端团队接入腾讯云前端性能监控 RUM 后对目前的监控能力以及上报数据进行了梳理并着手进行了前端性能监控的专项建设其中监控数据大盘建设是不可或缺的一环可视化的监控大盘可以清晰明了的观察到各项目运行情况宏观上能快速进行
【ESP32S2】使用ESP32S2开发板制作U盘，支持无线访问

文章目录前言一开发环境二硬件介绍三下载esp idf 四下载esp iot solution 五配置idf 1 执行下载脚本 2 设置环境变量 3 声明外部组件六构建例程七烧写Flash 八使用方法九感谢前
深度学习之Python，OpenCV中的卷积

这篇博客将介绍图像内核和卷积如果将图像视为一个大矩阵那么图像内核只是一个位于图像顶部的微小矩阵从左到右和从上到下滑动内核计算输入图像和内核之间的元素乘法总和称这个值为内核输出内核输出存储在与输入图像相同 x y 坐标的输出图像中
3D游戏第九次作业

3D游戏第九次作业 1 血条 Health Bar 的预制设计具体要求如下分别使用 IMGUI 和 UGUI 实现使用 UGUI 血条是游戏对象的一个子元素任何时候需要面对主摄像机分析两种实现的优缺点给出预制的使用方法 IMGU
2、为什么选择URP

为什么选择URP 现在所在项目为SLG类项目有同屏200 英雄的需求 Unity传统渲染管线的动态批处理有个限制是Skined Mesh Renderer不能进行动态批处理英雄如果不采用Skined Mesh Renderer又不能满足
C++实现简单的固定大小内存分配器

背景介绍最近在了解性能优化相关的知识了解到内存分配是一个可优化性能的方向在相关书籍中看到一个固定大小的内存分配器实现觉得挺有意思的这里跟大家分享据说比通用的内存分配malloc 性能有不少提升源码实现这里的代码是根据 c性能
Java会话技术

会话技术会话指的是客户端浏览器和服务端之间的度偶次请求和响应当打开浏览器访问网站地址后会话开始当关闭浏览器或者到了过期时间会话结束就像打电话只要不挂电话就是一次会话会话过程中产生的数据可以通过会话技术Cookie Sess
抖音Scheme全网最全,startActivity地址

例子部分参数可省略跳转主页并关注 snssdk1128 user profile 72673737181 refer web gd label click wap profile bottom type need follow need
oracle值相等时排序规则,Oracle中排序列中值相同引发的问题

有个表表名是Policy 有三个字段 a b c 这个表有两行 c列中的数据始终为0 我运行一下的sql语句这个问题在Oracle的新闻中心被提出了一段时间有个表表名是Policy 有三个字段 a b c 这个表有两行 c列中的数据
vue element ui table 过滤功能实现

Element UI代码
python中的list如何深度拷贝

在 Python 中可以使用 copy 模块中的 deepcopy 函数来进行深度拷贝示例 import copy original list 1 2 3 4 5 6 7 8 9 copied list copy deepcopy or
c++全局变量的使用方式

c 全局变量的使用方式在cpp文件中定义在头文件中定义在cpp文件中定义主函数中的使用 extern int aa extern int bb 在头文件中定义在主函数中在 h文件中声明需要加extern关键字在 cpp文件中
Linux环境下gcc编译链接库-lz -lrt -lm -lc都是什么库？

编译链接库 lz lrt lm lc都是什么库 lz 压缩库 Z lrt 实时库 real time shm open系列 lm 数学库 math lc 标准C库 C lib dl 是显式加载动态库的动态函数库
Linux下ImageNet2012数据集下载及其配置

简明扼要一训练集下载 137G http www image net org challenges LSVRC 2012 nnoupb ILSVRC2012 img train tar 验证集下载 http www image net
FCN模型训练中遇到的困难

FCN模型训练中遇到的困难标签深度学习FCN神经网络caffe 2017 02 24 10 54 2675人阅读评论 6 收藏举报分类深度学习 18 版权声明本文为博主原创文章未经博主允许不得转载前前后后大概忙了3个月了

FCN模型训练中遇到的困难

FCN模型训练中遇到的困难 的相关文章

随机推荐

热门标签

FCN模型训练中遇到的困难的相关文章