Tensorflow学习总结（1）：CNN

2023-11-05

简介：

CNN(卷积神经网络）是一种特殊的对图像识别的方式，属于非常有效的带有前向反馈的网络。CNN主要用于对二维图像的识别，它的网络结构对平移、比例放缩、倾斜或其他的变形具有高度不变性。因为，每层关注的特征不一样，贴近原图的，关注像素级别的，而经过多次特征提取后，关联型、序列型或结构化等类型的特征（如拓扑结构）被提取出来，其一致性与事物本身的一致性就比较接近了。现在，卷积网络主要用于图像识别领域，也可以用于人脸识别、文字识别等方向。

1、tf.reshape([-1,28,28,1])

由图中可以看出-1为缺省值。

2、tf.nn.conv2d(x_image,weight,stride,padding)

strdie: stride=[1,x_movement,y_movement,1], stride[0],stride[3] must be 1

padding: 有两个值'SAME' 和'VALID' 。'SAME' ：表示用0填充，为了使输入输出是同一大小。

https://segmentfault.com/a/1190000007846181

3、长度为M和N的两个序列卷积后得到序列长度为M+N-1。

4、池化：池化的作用等价于采样，为了后面的全连接的时候减少连接数。

池化分为两种，一种是最大池化（max_pool），在选中区域中找最大的值作为最后的值。另一种是平均池化，把选中区域中的值作为抽样后的值。池化原因是，为了后面的全连接的时候减少连接数。

    
    
# create pooling ,in order to reduce the loss of info when cutting the image
def max_pool_2x2(x):
    return tf.nn.max_pool(x, ksize=[1, 2, 2, 1], strides=[1, 2, 2, 1], padding='SAME')

tf.nn.max_pool(value, ksize, strides, padding, name=None)

参数是四个，和卷积很类似：

第一个参数value：需要池化的输入，一般池化层接在卷积层后面，所以输入通常是feature map，依然是[batch, height, width, channels]这样的shape

第二个参数ksize：池化窗口的大小，取一个四维向量，一般是[1, height, width, 1]，因为我们不想在batch和channels上做池化，所以这两个维度设为了1

第三个参数strides：和卷积类似，窗口在每一个维度上滑动的步长，一般也是[1, stride,stride, 1]

第四个参数padding：和卷积类似，可以取'VALID' 或者'SAME'

返回一个Tensor，类型不变，shape仍然是[batch, height, width, channels]这种形式

5、tf.nn.relu()激活函数：目的是使数据非线性

6、tf.nn.dropout(input, keep_prob)

目的是防止过拟合，在输出层之前应用dropout技术（即丢弃某些神经元的输出结果）。Dropout在训练过程中使用，而在测试中不使用。

7、reduce_mean()函数

求最大值 tf.reduce_max(input_tensor, reduction_indices=None, keep_dims=False, name=None)

求平均值tf.reduce_mean(input_tensor, reduction_indices=None, keep_dims=False, name=None)

参数（1）input_tensor:待求值的tensor。

参数（2）reduction_indices:在哪一维上求解。

参数（3）（4）可忽略

举例说明：

# 'x' is [[1., 2.]
#         [3., 4.]]

x是一个2维数组，分别调用reduce_*函数如下：

首先求平均值，

tf.reduce_mean(x) ==> 2.5 #如果不指定第二个参数，那么就在所有的元素中取平均值
tf.reduce_mean(x, 0) ==> [2.,  3.] #指定第二个参数为0，则第一维的元素取平均值，即每一列求平均值
tf.reduce_mean(x, 1) ==> [1.5,  3.5] #指定第二个参数为1，则第二维的元素取平均值，即每一行求平均值

同理，还可用tf.reduce_max()求最大值。

附：代码和分析

    
    
import tensorflow as tf
from tensorflow.examples.tutorials.mnist import input_data

# 60000行的训练数据集（mnist.train）和10000行的测试数据集（mnist.test）
# (每一行包含28*28=784个像素点）


# Import data
mnist = input_data.read_data_sets("MNIST_data/", one_hot=True)


# init weight
def weight_variable(shape):
    initial = tf.truncated_normal(shape, stddev=0.01)
    return tf.Variable(initial)


# init bias
def bias_variable(shape):
    initial = tf.constant(0.1, shape=shape)
    return tf.Variable(initial)


# create CNN layer
def conv2d(x, W):
    # stride [1,x_movement,y_movement,1],stride[0] and stride[3] must be 1
    return tf.nn.conv2d(x, W, strides=[1, 1, 1, 1], padding='SAME')                ### ???


# create pooling ,in order to reduce the loss of info when cutting the image
def max_pool_2x2(x):
    return tf.nn.max_pool(x, ksize=[1, 2, 2, 1], strides=[1, 2, 2, 1], padding='SAME')


# def compute_accuracy
def comput_accuracy(v_xs, v_ys):
    global prediction
    y_pre = sess.run(prediction, feed_dict={xs: v_xs, keep_prob: 1})
    correct_pre = tf.equal(tf.argmax(y_pre, 1), tf.argmax(v_ys, 1))
    accuracy = tf.reduce_mean(tf.cast(correct_pre, tf.float32))
    result = sess.run(accuracy, feed_dict={xs: v_xs, ys: v_ys, keep_prob: 1})
    return result


# define placeholder for inputs to network
xs = tf.placeholder(tf.float32, [None, 784])            # 28x28
ys = tf.placeholder(tf.float32, [None, 10])
keep_prob = tf.placeholder(tf.float32)
x_image = tf.reshape(xs, [-1, 28, 28, 1])
# print(x_image.shape)   #[n_sample.28,28,1]

# conv1 layer
W_conv1 = weight_variable([5, 5, 1, 32])        # patch 5x5,in size 1,out size 32
b_conv1 = bias_variable([32])
hide_conv1 = tf.nn.relu(conv2d(x_image, W_conv1) + b_conv1)
# relu: let data nonlinear , output size 28x28x32
hide_pool1 = max_pool_2x2(hide_conv1)                                   # output size 14x14x32

# conv2 layer
W_conv2 = weight_variable([5, 5, 32, 64])        # patch 5x5,in size 32,out size 64
b_conv2 = bias_variable([64])
hide_conv2 = tf.nn.relu(conv2d(hide_pool1, W_conv2) + b_conv2)            # relu: let data nonlinear , output size 14x14x64
hide_pool2 = max_pool_2x2(hide_conv2)                                   # output size 7x7x64

# func1 layer
W_fc1 = weight_variable([7*7*64, 1024])                   # 全连接
b_fc1 = bias_variable([1024])
# [n_samples,7,7,64] ->> [n_samples,7*7*64]
h_pool2_flat = tf.reshape(hide_pool2, [-1, 7*7*64])            # 转化为1维
h_fc1 = tf.nn.relu(tf.matmul(h_pool2_flat, W_fc1) + b_fc1)       # 点积
h_fc1_drop = tf.nn.dropout(h_fc1, keep_prob)

# func2 layer
W_fc2 = weight_variable([1024, 10])
b_fc2 = bias_variable([10])
prediction = tf.nn.softmax(tf.matmul(h_fc1_drop, W_fc2) + b_fc2)

# the error between the prediction and real data
cross_entropy = tf.reduce_mean(-tf.reduce_sum(ys*tf.log(prediction), reduction_indices=[1]))
train_step = tf.train.AdamOptimizer(1e-4).minimize(cross_entropy)

# create session
with tf.Session() as sess:
    sess.run(tf.global_variables_initializer())
    for i in range(1000):
        batch_xs, batch_ys = mnist.train.next_batch(100)
        sess.run(train_step, feed_dict={xs: batch_xs, ys: batch_ys, keep_prob: 0.5})
        if i % 40 == 0:
            print(comput_accuracy(mnist.test.images, mnist.test.labels))

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Tensorflow学习总结（1）：CNN 的相关文章

在c++中的嵌入式python中导入tensorflow时出错

我的问题是关于在 C 程序中嵌入 Python 3 5 解释器以从 C 接收图像并将其用作我训练的张量流模型的输入当我在 python 代码中导入tensorflow库时出现错误其他库工作正常简化后的代码如下 include
在 Tensorflow 中使用迁移学习是否需要预定义图像大小？

我打算使用预先训练的模型例如fast rcnn resnet101 pets用于 Tensorflow 环境中的对象检测如所述here https tensorflow object detection api tutorial rea
Tensorflow：导入错误：libcudnn.so.7：无法打开共享对象文件：没有这样的文件或目录

我最近使用 pip 安装了tensorflow gpu 但是当我导入它时出现以下错误 ImportError libcudnn so 7 cannot open shared object file No such file or dir
TensorFlow：使用不同的输入张量重新运行网络？

假设我在 TensorFlow 中有一个典型的 CNN 模型 def inference images images 4D tensor of batch size IMAGE SIZE IMAGE SIZE 3 size conv 1 c
窗口多维 Tensorflow 数据集

我有形状的二维数据m by n我想要的窗口大小w沿着第一个轴进入数据集m w许多二维数组每个数组的大小w by n 例如如果数据是 0 1 2 3 4 5 6 7 8 9 10 11 然后我想将其窗口化 0 1 2 3 4 5 6 7 8
增加 sigmoid 预测输出值？

我创建了一个用于文本分类的 Conv1D 模型当在最后一个密集处使用 softmax sigmoid 时它产生的结果为 softmax gt 0 98502016 0 0149798 sigmoid gt 0 03902826 0 00
Tensorflow 数据集的数据预处理是针对整个数据集还是针对每次调用 iterator.next() 进行一次？

您好我现在正在研究tensorflow中的数据集API 我有一个关于执行数据预处理的dataset map 函数的问题 file name image1 jpg image2 jpg im dataset tf data Dataset
张量流中检查点之间的间隔

如何指定张量流中两个连续检查点之间的间隔里面没有选项tf train Saver来指定这一点每次我使用不同数量的全局步骤运行模型时我都会得到检查点之间的新间隔 The tf train Saver https www tensorf
Tensorflow 训练期间 GPU 使用率非常低

我正在尝试为 10 类图像分类任务训练一个简单的多层感知器这是 Udacity 深度学习课程作业的一部分更准确地说任务是对各种字体呈现的字母进行分类数据集称为 notMNIST 我最终得到的代码看起来相当简单但无论如何我在训练期间
TensorFlow：Dst 张量未初始化

The MNIST For ML Beginners当我运行时教程给我一个错误print sess run accuracy feed dict x mnist test images y mnist test labels 其他一切都运行
Keras - Nan 总结直方图 LSTM

我使用 Keras 编写了一个 LSTM 模型并使用 LeakyReLU 高级激活 ADAM Optimizer with learning rate decay opt optimizers Adam lr 0 0001 beta 1
使用 Keras 和 fit_generator 绘制 TensorBoard 分布和直方图

我正在使用 Keras 使用 fit generator 函数训练 CNN 这似乎是一个已知问题 https github com fchollet keras issues 3358TensorBoard 在此设置中不显示直方图和分布有
复制张量流图

复制 TensorFlow 图并保持更新的最佳方法是什么理想情况下我想将重复的图放在另一个设备上例如从 GPU 到 CPU 然后不时更新副本简短回答你可能想要检查点文件 https www tensorflow org progr
L-BFGS 是否有 tf.keras.optimizers 实现？

有人有 L BFGS 算法的 Tensorflow 2 tf keras 子类吗如果想使用 L BFGS 目前有两个官方选项 TF概率 SciPy 优化这两个选项使用起来相当麻烦尤其是在使用自定义模型时因此我计划实现 tf k
使用 tfprof 分析 TensorFlow

我正在尝试分析 TensorFlow 的计算内存使用情况发现tfprof https github com tensorflow tensorflow tree master tensorflow tools tfprof是实现我的目的
Tensorflow 初始化给出所有 1

张量流1 12 0 在下面的代码片段中 wrapped rv val和seq rv val似乎应该是等效的但事实并非如此相反 seq rv val 被正确初始化为随机生成的 init val 数组但wrapped rv val 设置为
导入一个简单的 Tensorflow freeze_model.pb 文件并用 C++ 进行预测

我正在尝试将从 Tensorflow Python 导出的图形导入到 Tensorflow C 中我已经成功地将图表重新导入到 Python 中我现在唯一想要的就是用 C 编写相同的代码但我不确定 C api 函数和用法因为 Ten
Keras 显示 GPU 训练速度没有任何改进（部分 GPU 使用？！）

我正在尝试在我的 Jupyter Notebook 的 AWS p2 xlarge 实例上的 GPU 而不是 CPU 上训练我的模型我正在使用tensorflow gpu后端仅tensorflow gpu已安装并在中提到requirem
TensorFlow.js 调整 3D 张量大小

我有一个具有以下尺寸的 3D 张量宽度 x 高度 x 深度我需要将可变大小的体积调整为特定形状例如 256 x 256 x 256 不幸的是在 TensorFlow js 中他们有一组用于调整大小的方法例如tf image re
打印出网络架构中每一层的形状

在 Keras 中我们可以如下定义网络有什么办法可以输出每层之后的形状例如我想打印出以下形状inputs在定义行之后inputs 然后打印出形状conv1在定义行之后conv1 etc inputs Input 1 img rows

随机推荐

开开心心带你学习MySQL数据库之第六篇下

插入查询结果把查询和新增联合起来把查询结果作为新增的数据例子把student1表的查询结果作为新增数据插入到student2表中 create table student1 id int name varchar 20 create
英伟达闲着没事，做了一个超级逼真的人脸生成AI系统！

Nvidia 英伟达的人脸面部表情方法真的是GAN 风格一种新的生成性对抗网络方法让技术观察者摸不着头脑图像如何虚假而又看起来如此真实研究人员在一段视频中说我们想出了一种新的发生器可以自动学习分离图像的不同方面而无需任何人为监督
3阶Hermitian正定矩阵Cholesky分解通用表达式

pdf文件算法原理将一个 n n n阶Hermitian正定矩阵 A A A分解为一个下三角矩阵 L L
java拦截通过url访问页面，必须通过登录页面访问目标页面

在web xml中配置过滤
ROS AGV 笔记

Ubuntu18 04 install of ROS Melodic 1 Installation 1 1 Configure your Ubuntu repositories 1 2 Setup your sources list sud
STM32_USART

1 时钟使能 RCC APB2PeriphClockCmd RCC APB2Periph USART1 RCC APB2Periph GPIOA ENABLE USART1 GPIOA 2 引脚配置 GPIO InitTypeDef GPI
二叉树的层序遍历(广度优先遍历)

二叉树的层序遍历 Name 二叉树的层序遍历 Copyright Author lkm Date 01 04 22 21 47 include
Web开发权威指南笔记（三）

书 Web开发权威指南美 Chris Aquino Todd Gandee著为3rd实战项目Chattrbox练习以及代码整理全为个人借鉴本书产出若需要转载请联系通知我请尊重原创谢谢整理了大概8天了内容比较多很多重点都整理
Eigen: C++开源矩阵计算工具——Eigen的简单用法

Eigen非常方便矩阵操作当然它的功能不止如此由于本人只用到了它的矩阵相关操作所以这里只给出了它的一些矩阵相关的简单用法以方便快速入门矩阵操作在算法研究过程中非常重要例如在图像处理中二维高斯拟合求取光斑中心时使用Eigen提供
Android优秀开源项目汇总

UI相关图片 Android Universal Image Loader com nostra13 universalimageloader 异步加载缓存显示图片 ImageLoader com novoda imageloader
multipartFile.getOriginalFilename();不能获取原文件名称，也就是含有路径名

一直在debug 发现只能获取文件名进去看源代码翻译过来就是返回客户端文件系统中的原始文件名 p 这可能包含路径信息取决于所使用的浏览器但它通常不会与opera浏览器有关只是可能包含路径名所以我试了360浏览器谷歌火狐都只
进程和线程的区别和联系

一简介进程进程是操作系统资源分配的基本单位进程是指正在运行的程序实例每个进程都有自己的内存空间代码数据和资源操作系统通过管理进程来控制计算机的资源分配每个进程都有一个唯一的标识符称为进程 ID 以便操作系统可以识别和管理
Adapter 适配器基础讲解

Adapter 适配器基础讲解 1 MVC模式的简单理解在开始学习 Adapter 之前我们要来了解下这个 MVC 模式概念举个例子大型的商业程序通常由多人一同开发完成比如有人负责操作接口的规划与设计有人负责程序代码的编写如果要
表情包(图片)自生产——Python爬虫xpath实现

文章目录严正声明爬虫应严格遵守国家的相关法律法规坚决做一只文明爬虫前言一知识准备二功能解析与实现 1 引入库 2 请求准备 3 发起请求 4 数据解析 5 数据保存 6 成果展示三普通代码展示四封装代码展示总结严
核心基础知识1

图片相关安卓选择ETC2 8bit 苹果选择ETC PVRTC 4 bit RGBA32 32代表RGBA4个通道总共32位每一个通道是8位通常图片的格式有jpg和png jpg代表的是有损压缩无透明 png无损压缩有透明显示同一张
埋点--Vue前端通过自定义指令实现埋点功能

需求项目新版本新功能需要再新页面添加埋点功能记录用户的使用情况和使用习惯因为前端项目使用的是Vue 所以选择使用Vue的自定义指令来实现埋点功能埋点主要记录谁什么时候做了什么事情直接上代码 1 自定义指令 import
HTML响应式Web设计

目录什么是响应式 Web 设计创建自己的响应式设计使用 Bootstrap 什么是响应式 Web 设计 RWD 指的是响应式 Web 设计 Responsive Web Design RWD 能够以可变尺寸传递网页 RWD 对于平板和
ARTS挑战打卡第十七周

Algorithm 一周至少一道算法题 Review 阅读并点评至少一篇英文技术文章 Tip 学习至少一个技术技巧总结和归纳在日常工作中所遇到的知识点 Share 分享一篇有观点和思考的技术文章 01 Algorthm https lee
xp系统开启iis服务器,WindowsXPHome版本安装IIS服务器方法

首先在开始菜单的运行中输入 c Windows inf sysoc inf 系统会自动使用记事本打开sysoc inf这个文件在sysoc inf中找到 Components 这一段因为是XP简化版所以里面东西很少在里面加上
Tensorflow学习总结（1）：CNN

简介 CNN 卷积神经网络是一种特殊的对图像识别的方式属于非常有效的带有前向反馈的网络 CNN主要用于对二维图像的识别它的网络结构对平移比例放缩倾斜或其他的变形具有高度不变性因为每层关注的特征不一样贴近原图的关注像素级别的

Tensorflow学习总结（1）：CNN

tf.nn.max_pool(value, ksize, strides, padding, name=None)

Tensorflow学习总结（1）：CNN 的相关文章

随机推荐

热门标签