TensorFlow搭建VGG-Siamese网络

2023-05-16

TensorFlow搭建VGG-Siamese网络

Siamese原理

Siamese网络，中文称为孪生网络。大致结构如下图所示：

Siamese网络有两个输入，一个输出。其中，两个输入经过相同的网络层知道成为一个n维向量，再对这个n维向量进行求距离，对此距离应用softmax函数，得到输出的结果。

例如，使用Siamese做一个人脸识别，那么输入就是两个人脸图像，若是同一个人输出1，若是不同的人则输出0。

首先，我们制作一个输入为(h, w, c)，输出为(1, 128)的VGG模型，这里不使用完整的模型，我称为VGG-lite版。

import tensorflow as tf
from tensorflow import keras
from keras import backend as K
from tensorflow.keras import layers, Sequential
from tensorflow.keras.layers import Conv2D, ZeroPadding2D, Activation, MaxPooling2D, Dropout, Flatten, Dense, Lambda, Input
from tensorflow.keras.models import Model

# 这里实现一个VGG网络，返回的是一个128维向量，用于siamese的输入
def VGG(X_input):
    X = X_input
    X = Conv2D(64, (3,3), padding = 'same',activation='relu')(X)
    X = Conv2D(64, (3,3), padding = 'same',activation='relu')(X)
    X = MaxPooling2D(pool_size=(2,2), strides=2)(X)
    X = Conv2D(128, (3,3), padding = 'same',activation='relu')(X)
    X = Conv2D(128, (3,3), padding = 'same',activation='relu')(X)
    X = Dropout(0.4)(X)
    X = MaxPooling2D(pool_size=(2,2), strides=2)(X)
    X = Conv2D(256, (3,3), padding = 'same',activation='relu')(X)
    # X = MaxPooling2D(pool_size=(2,2), strides=2)(X)
    X = Conv2D(256, (3,3), padding = 'same',activation='relu')(X)
    X = Conv2D(256, (3,3), padding = 'same',activation='relu')(X)
    X = Dropout(0.4)(X)
    X = MaxPooling2D(pool_size=(2,2), strides=2)(X)
    X = Conv2D(512, (3,3), padding = 'same',activation='relu')(X)
    X = MaxPooling2D(pool_size=(2,2), strides=2)(X)
    X = Conv2D(512, (3,3), padding = 'same',activation='relu')(X)
    X = Conv2D(512, (3,3), padding = 'same',activation='relu')(X)
    X = Dropout(0.4)(X)
    X = MaxPooling2D(pool_size=(2,2), strides=2)(X)
    X = Flatten()(X)
    X = Dense(1024, activation="relu")(X)
    X = Dense(128, activation="relu")(X)
    
    X = Lambda(lambda  x: K.l2_normalize(x,axis=1))(X)
    return X

这里对模型不再详细解释，只解释下对X的最后一步操作：通过keras.layers中的Lambda将128维的X进行L2正则化再输出。

对于模型构建其他部分的疑问，可以参考我的前两份文章。

接下来，我们要制作一个可以接受两个输入的模型。在TensorFlow中，只需要在定义模型的函数中，使用多次Input()即可获得多个输入。

def VGG_Siamese(input_shape):
	# 接收两个输入，X1_input和X2_input.
	X1_input = Input(input_shape)
	X2_input = Input(input_shape)

	X1 = ZeroPadding2D((3, 3), name='layer1')(X1_input)
	X2 = ZeroPadding2D((3, 3), name='layer2')(X2_input)

	X1 = VGG(X1)
	X2 = VGG(X2)
	print(X1)
	print(X2)

	l1_distance_layer = Lambda(
		lambda tensors: K.abs(tensors[0] - tensors[1]))
	l1_distance = l1_distance_layer([X1, X2])    

	X = Dense(512, activation='relu')(l1_distance)
	X = Dense(2, activation='softmax')(X)

	model = Model(inputs = [X1_input, X2_input], outputs = X)

	return model

在使用Input()获得两个输入后，将两个输入一同经过了VGG()函数，这说明两个输入会经历相同的卷积网络成为两个128维向量。而

	l1_distance_layer = Lambda(
		lambda tensors: K.abs(tensors[0] - tensors[1]))
	l1_distance = l1_distance_layer([X1, X2])

这两句是将得到的两个128维向量进行距离求和，使用差值绝对值求得，得到的结果也是一个128维向量。

再之后，将得到的128维向量经过全连接层与512维、2维（即classes维）连接，得到一个二维向量，这个二维向量使用"softmax"激活函数，得到预测结果。

通过上面的两个函数，我们已经完成了模型的构建，接下来，我们从处理数据集开始，讲解如何对此模型进行训练。

笔者选用的数据集是LFW数据集，各位可以自行选择数据集，下面介绍一种简单的数据集处理方法（LFW数据集有pairs.txt文件，处理方式与下面介绍的不一致，这并不影响，因为得到的数据集形式是相同的）：

因为不同数据集可能有不同的初步获取方式，因此这里假设我们获得了dataset_x(图像)、dataset_y(标签).

对于数据处理的思想是：首先取数据集中的任一图片，然后再随机取另一张图片（不要与第一张图片相同），将第一张图片加入X_L(这是一个list)，将第二张图片加入X_R，如果两张图片是同一个人，将1加入labels(这是标签集)，如果两张图片不是同一个人，将0加入labels。具体操作如下：

X_L = []
X_R = []
labels = []
for i in range(dataset_x.shape[0]):
    for j in range(4):  # 每个数据与四个其他数据对比
        a = random.randint(0,dataset_x.shape[0]-1)
        while a == i:
            a = random.randint(0,dataset_x.shape[0]-1)
        X_L.append(dataset_x[i])
        X_R.append(dataset_x[a])
        if dataset_y[i] == dataset_y[a]:
            labels.append(1)
        else:
            labels.append(0)

这样，我们得到了一个具有两个图片并且已经标志其是否为同一人的数据集。但是我们对于数据集的处理还没有完成，如果使用以上的数据集去进行训练，会有多个错误产生。

TensorFlow的模型训练应接收带有shape方法的数据集，而我们上面的数据集是list类型，不具有shape方法，要使其得到此方法，可按如下处理：

import numpy as np
X_L = np.array(X_L)
X_R = np.array(X_R)
labels = np.array(labels)

numpy.array()方法将list转化为array，具有shape方法。到这里，数据处理仍没有结束。还记得我们模型最后的输出吗？应该是(?, 2)维的向量，而我们的labels是(?, 1)维向量，这是怎么回事？
这里我们的labels向量使用0和1代表两种结果，因此对于每对图片都只有一个标签。要处理这个问题，有两种解决方案。

第一种解决方案是，将模型最后的输出激活函数换为’sigmoid’并改为1维。这样便与标签集维数相同。
第二种解决方案是，将标签转为2维，并且要与softmax输出匹配，即转化为独热编码。(0->(1,0), 1->(0,1)).

这里我们采用第二种解决方案

labels = to_categorical(labels, num_classes=2)

现在，我们可以获取我们的模型了：

model = VGG_Siamese(input_shape=x_train[0].shape)

设置模型参数：

model.compile(optimizer='adam', loss="categorical_crossentropy", metrics=['accuracy'])
# 如果刚才采用第一种解决方案，将loss改为'binary_crossentropy'

参数设置完毕后，可以开始训练模型了：

model.fit([X_L, X_R], labels, validation_split=0.2, batch_size=32, epochs=30, verbose=1)

这里只为了演示如何构建Siamese模型，因此选用的模型较简单，训练效果并不优秀，但是便于理解Siamese的工作原理和创建方式，为了优化训练效果，可以自己动手尝试更换模型进行训练。

训练完成后，可以将模型保存：

save_path = "./weights/my_weight" # 填文件地址和名称
model.save_weights(save_path) # 保存权重
model.save(save_path+'h5') # 保存模型和权重

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

tensorflow

VGG

Siamese

TensorFlow搭建VGG-Siamese网络的相关文章

Tensorflow：docker 镜像和 -gpu 后缀

在具有 GPU 支持的 Tensorflow 的 Docker 映像中例如 tensorflow tensorflow 2 2 0 gpu 安装的python包是tensorflow gpu 如图所示pip freeze 安装任何依赖于的
Keras 中的 Tensorflow 自定义损失函数 - 张量循环

我正在尝试在 Keras 中编写自定义损失函数如下所示 Keras 中的自定义损失函数 https stackoverflow com questions 43818584 custom loss function in keras 我的
应定义密集层输入的最后一个维度。没有找到。收到完整的输入形状：<未知>

我在将模型从一些本地虚拟数据切换到使用 TF 数据集时遇到问题抱歉模型代码太长我已尝试尽可能缩短它以下工作正常 import tensorflow as tf import tensorflow recommenders as tfr
在 Chaquopy 中转换数组和张量

我该怎么做呢我看到你的帖子说你可以将 java 对象传递给 Python 方法但这不适用于 numpy 数组和 TensorFlow 张量以下以及其各种变体是我尝试过的但没有成功 double anchors new double
Tensorflow：获取为零的数组行索引

对于张量 1 2 3 1 0 0 0 0 1 3 5 7 0 0 0 0 3 5 7 8 如何获取 0 行的索引 IE 列表 1 3 在 Tensorflow 中据我所知您无法像使用 NumPy 等更高级的库那样在一个命令中真正做到这一
如何在Pycharm中运行Tensorflow GPU？

我想在 Linux Mint 上的 Pycharm 中运行 Tensorflow GPU 我尝试了一些像这样的指南 https medium com p venkata kishore install anaconda tenserflow
这可能是因为 cuDNN 初始化失败，因此请尝试查看上面是否打印了警告日志消息。 [操作：Conv2D]

我在 anaconda 中安装了 TensorFlow GPU 2 0 当我安装它并导入包然后运行我的 CNN 模型时它工作正常但当我尝试运行训练模型时出现错误这是我的错误报告 Epoch 1 50 UnknownError Tr
张量流急切模块错误

我的操作系统是 Ubuntu 16 04 Python版本是3 5 张量流版本是14 0 当我尝试为 TF Eager 模块编写简单代码时 import tensorflow as tf import tensorflow contrib
使用批量乘法的tensorflow的tensordot中的障碍

我正在张量流中实现 RBM 使用小批量实现参数更新存在障碍有2个张量第一个张量的形状是 100 3 1 第二个张量的形状是 100 1 4 数字 100 是批次大小所以我想将这些张量相乘得到 100 3 4 张量但是当我实现这样的
ValueError：维度 (-1) 必须在 [0, 2) 范围内

我的python版本是3 5 2 我已经安装了keras和tensorflow 并尝试了官方的一些示例示例链接示例标题用于多类 softmax 分类的多层感知器 MLP https keras io getting started s
TensorFlow：在输入处获取梯度时性能缓慢

我正在使用 TensorFlow 构建一个简单的多层感知器并且我还需要获取神经网络输入损失的梯度或误差信号这是我的代码它有效 cost tf reduce mean tf nn softmax cross entropy with
在不丢失基数信息的情况下对 TensorFlow 数据集进行窗口处理？

tf data Dataset window返回一个新的数据集其元素是数据集这些嵌套数据集的元素是所需大小的窗口如果您有一个数据集例如 Dataset range 10 并想要一个像这样的窗口数据集 0 1 2 1 2 3 7 8
如何在Google机器学习中将jpeg图像转换为json文件

我正在研究 Google Cloud ML 我想对 jpeg 图像进行预测为此我想使用 gcloud beta ml 预测 instances INSTANCES model MODEL version VERSION https cl
从tensorflow_cc和tensorflow_framework生成静态库

据我了解使用 bazel 我只能生产libtensorflow cc so and libtensorflow framework so 我需要生产静态库与位置无关 fPIC 因为稍后我会将它们链接到我自己的动态库 I found 这个答
预训练 inception v3 模型的层名称（tensorflow）[重复]

这个问题在这里已经有答案了任务是获取a的每层输出预训练的 cnn inceptionv3 https www tensorflow org versions master tutorials image recognition index
NotImplementedError：尚未为未构建的模型子类启用“fit_generator”

我正在使用以下代码 import tensorflow as tf traindata tf keras preprocessing image ImageDataGenerator rescale 1 255 shear range 0
scikit-learn 和tensorflow 有什么区别？可以一起使用它们吗？

对于这个问题我无法得到满意的答案据我了解 TensorFlow是一个数值计算库经常用于深度学习应用而Scikit learn是一个通用机器学习框架但它们之间的确切区别是什么 TensorFlow 的目的和功能是什么我可以一起使用它
对于只有 10000 个单词的字典来说，真正需要什么嵌入层 output_dim？

我正在训练一个 RNN 其单词特征集非常少大约 10 000 个我计划在添加 RNN 之前从嵌入层开始但我不清楚真正需要什么维度我知道我可以尝试不同的值 32 64 等但我宁愿先有一些直觉例如如果我使用 32 维嵌入向量则每
异常：加载数据时 URL 获取失败

我正在尝试设置我的机器来运行 Tensorflow 2 我从未使用过 Tensorflow 只是下载了 Python 3 7 我不确定这是否是我的机器的问题我按照上面列出的安装说明进行操作TensorFlow 的网站 https www
如何手动计算分类交叉熵？

当我手动计算二元交叉熵时我应用 sigmoid 来获取概率然后使用交叉熵公式并平均结果 logits tf constant 1 1 0 1 2 labels tf constant 0 0 1 1 1 probs tf nn sigm

随机推荐

Python发送邮件smtplib.SMTP各报错问题的解决方法

经测试可用的发送邮件代码 xff1a import smtplib from email mime text import MIMEText 第三方 SMTP 服务 mail host 61 34 smtp 163 com 34 SMTP服
linux flash读写程序,Arm9 linux系统 flash读写问题

Arm9 linux系统 flash读写问题当前板子环境 xff1a a 16MiB Nor FLASH 默认从Nor Flash启动 b 32MiB Nand FLASH c 环境参数 Please stand by while reb
C语言蓝牙协议栈讲解,通俗易懂讲解蓝牙协议栈软件框架

BLE 协议架构总体上分成3块 xff0c 从下到上分别是 xff1a 控制器 Controller xff0c 主机 Host 和应用端 Apps xff1b 3者可以在同一芯片类实现 xff0c 也可以分不同芯片内实现 xff0c 控制
python中类的属性和方法-Python中类的属性、方法及内置方法

1 类的属性成员变量对象的创建创建对象的过程称之为实例化 xff0c 当一个对象被创建后 xff0c 包含三个方面的特性对象聚丙属性和方法 xff0c 句柄用于区分不同的对象 xff0c 对象的属性和方法 xff0c 与类中的成员变量
linux查看新接入设备,【入门】查询Jetson设备与开发环境版本的基础信息

刚入门的朋友 xff0c 可能觉得Jetson用Ubuntu系统 xff0c 不像Windows那么亲民 xff0c 那么容易获得一些硬件的相关信息 xff0c 有点碍手碍脚的因此我们收集一些您可能需要用到的指令 xff0c 就不用上网到
python可以查ip地址吗_Python爬虫练手小项目(1)获取、查询ip地址

正所谓饭饱思淫欲 xff0c 吃饱没事干 xff0c 不如一起来写写python代码把滑稽起因是最近在学习一本叫 Python网络数据采集的书其中有一章讲到用网络爬虫来使用API 虽然书上举的栗子要么就是API地址被墙 xff0c 要
mysql创建表插入随机数_在MySQL中的表格中插入随机数？

要插入随机数 xff0c 请使用RAND MySQL中的function 让我们首先创建一个表 mysql gt create table DemoTable Value int 使用插入命令在表中插入一些记录 mysql gt inser
Linux下apt文件夹,Ubuntu软件包管理空间不足，在/var/cache/apt/archives/中

在Ubuntu中安装软件时 xff0c 提示 xff1a E You don 39 t have enough free space in var cache apt archives 在 var cache apt archives 中没
手持gps坐标设置_[SWF] Visual-Wheel-GPS Localization轮速、视觉、GPS融合定位

接上一篇MSCKF Based Visual Wheel Odometry VWO MSCKF xff0c 这篇文章接入了GPS信息 xff0c 来实现全局定位实现方法参考了Guoquan Huang老师组里的论文 xff1a W Lee
Mysql服务器主从同步搭建

本文讲解在Win系统下搭建Mysql主服务从服务 xff0c 使用的Mysql版本是 xff1a Mysql5 7 在主从服务器搭建过程中 xff0c 需要严格遵守以下的步骤 xff0c 不然环境搭建可能出错 1 Win系统中安装Mysq
findinset mysql 性能_FindInSet性能优化

背景 xff1a 最近在mysql性能优化中遇到一个findinset 函数的性能问题 xff1a 坦然说在数据量低的情况下 xff0c find in set的性能还是不错的 xff0c 但是在30w左右开始严重劣化 xff0c 到那时数
华为荣耀开机停留在android,华为荣耀8变砖无法开机怎么办华为荣耀8变砖无法开机解决方法...

很多朋友在使用华为荣耀8由于操作不当或者手机自身问题 xff0c 导致手机变砖开不了机 xff0c 这样怎么办 xff1f 今天小编就为大家带来了华为荣耀8变砖无法开机解决方法 xff0c 一起看看吧 xff01 华为荣耀8变砖无法开机解决
git clone github_提高github下载速度的方法100%有效可达到2MB/s

点击上方 Python全家桶 xff0c 星标或 34 置顶 34 关键时刻 xff0c 第一时间送达作者 kcx64 本文仅做分享 xff0c 若有侵权请联系小编第一时间删文阅读本文大概需要 2 8 分钟因为大家都知道的原因 x
显卡在电脑什么位置_电脑要配什么显卡/GPU才能硬解播放4K HDR电影/视频

windows电脑要什么配置的显卡 GPU才能硬解播放4K HDR电影视频我们知道一台windows电脑要能完美的播放4K电影 4K视频 xff0c 你电脑的显卡 CPU 内存和4K显示器缺一不可 xff01 那很多人就要问我的CPU很
英语练字字帖打印_10秒就能在Word中生成字帖，还不花一分钱！你不会还不知道吧？...

一制作字帖1 新建字帖当我们想要在Word中制作字帖的时候 xff0c 其实方法非常简单 xff0c 在Word中就带有很不错的书法字帖功能 xff0c 我们只需要打开一个Word文档 xff0c 然后点击文件新建 xff0c
可以ping通打不开网页_如何快速解决“网站打不开”的问题？

不管是我们普通用户 xff0c 还是网站管理员 xff0c 没有很强大的技术能力的话 xff0c 在遇到自己的网站打不开的情况可能会很着急 xff0c 为了让大家更高效快速的应对网站为啥打不开了这个问题 xff0c 今天我们就说一下网站
叉乘点乘混合运算公式_记忆口诀丨有顺口溜加成的数学公式瞬间好记一万倍！...

有理数的加法运算同号相加一边倒 xff1b 异号相加大减小 xff0c 符号跟着大的跑 xff1b 绝对值相等零正好注大减小是指绝对值的大小合并同类项合并同类项 xff0c 法则不能忘 xff0c 只求系数和 xf
python里的pi怎么用_Python numpy.pi() 使用实例

The following are code examples for showing how to use They are extracted from open source Python projects You can vote
14宽的键槽深度多少_平键和键槽的标准尺寸规格表

平键和键槽的标准尺寸规格表 2018 09 08 轴径键键槽 d b h 宽度深度半径 b 偏差轴毂较松一般较紧轴H9 毂D10 轴N8 毂JS9 轴毂P9 t 偏差 t1 偏差最大最小 6 8 2 2 2
TensorFlow搭建VGG-Siamese网络

TensorFlow搭建VGG Siamese网络 Siamese原理 Siamese网络 xff0c 中文称为孪生网络大致结构如下图所示 xff1a Siamese网络有两个输入 xff0c 一个输出其中 xff0c 两个输入经过相同

TensorFlow搭建VGG-Siamese网络

TensorFlow搭建VGG-Siamese网络

Siamese网络，中文称为孪生网络。大致结构如下图所示：

Siamese网络有两个输入，一个输出。其中，两个输入经过相同的网络层知道成为一个n维向量，再对这个n维向量进行求距离，对此距离应用softmax函数，得到输出的结果。

例如，使用Siamese做一个人脸识别，那么输入就是两个人脸图像，若是同一个人输出1，若是不同的人则输出0。

首先，我们制作一个输入为(h, w, c)，输出为(1, 128)的VGG模型，这里不使用完整的模型，我称为VGG-lite版。

这里对模型不再详细解释，只解释下对X的最后一步操作：通过keras.layers中的Lambda将128维的X进行L2正则化再输出。

接下来，我们要制作一个可以接受两个输入的模型。在TensorFlow中，只需要在定义模型的函数中，使用多次Input()即可获得多个输入。

在使用Input()获得两个输入后，将两个输入一同经过了VGG()函数，这说明两个输入会经历相同的卷积网络成为两个128维向量。而

这两句是将得到的两个128维向量进行距离求和，使用差值绝对值求得，得到的结果也是一个128维向量。

再之后，将得到的128维向量经过全连接层与512维、2维（即classes维）连接，得到一个二维向量，这个二维向量使用"softmax"激活函数，得到预测结果。

通过上面的两个函数，我们已经完成了模型的构建，接下来，我们从处理数据集开始，讲解如何对此模型进行训练。

笔者选用的数据集是LFW数据集，各位可以自行选择数据集，下面介绍一种简单的数据集处理方法（LFW数据集有pairs.txt文件，处理方式与下面介绍的不一致，这并不影响，因为得到的数据集形式是相同的）：

这样，我们得到了一个具有两个图片并且已经标志其是否为同一人的数据集。但是我们对于数据集的处理还没有完成，如果使用以上的数据集去进行训练，会有多个错误产生。

这里我们采用第二种解决方案

现在，我们可以获取我们的模型了：

设置模型参数：

参数设置完毕后，可以开始训练模型了：

这里只为了演示如何构建Siamese模型，因此选用的模型较简单，训练效果并不优秀，但是便于理解Siamese的工作原理和创建方式，为了优化训练效果，可以自己动手尝试更换模型进行训练。

TensorFlow搭建VGG-Siamese网络 的相关文章

随机推荐

热门标签

TensorFlow搭建VGG-Siamese网络的相关文章