Tensorflow2.x模型搭建的几种代码形式

2023-11-06

相信很多新手小白在才开始初学时就想要搭建自己的深度学习模型,但在看到每个风格不同的算法时,又会把前向传播,反向传播,和模型的搭建过程混淆,我总结了一下几种基于Tensorflow2.x搭建模型的代码。

1.学习过程中最常见的数据切片,载入并预处理,这一部分呢模型运用Sequential搭建,好处是方便简洁,但是前向传播的顺序是固定的,且在训练过程和优化过程中都调用了API。

import tensorflow as tf
from tensorflow import keras
from tensorflow.keras import datasets,layers,optimizers,Sequential,metrics,losses



def prrocess(x,y):
    x = tf.cast(x,dtype=tf.float32)/255
    y = tf.cast(y,dtype=tf.int32)

    return x,y


(x,y),(x_test,y_test) = datasets.fashion_mnist.load_data()
print(x.shape,y.shape)
batchsz = 128

db = tf.data.Dataset.from_tensor_slices((x,y))
db = db.map(prrocess).shuffle(10000).batch(batchsz)

db_test = tf.data.Dataset.from_tensor_slices((x_test,y_test))
db_test = db.map(prrocess).shuffle(10000).batch(batchsz)

db_iter = iter(db)
sample = next(db_iter)

model = Sequential([
    layers.Dense(256,activation=tf.nn.relu),
    layers.Dense(128,activation=tf.nn.relu),
    layers.Dense(64,activation=tf.nn.relu),
    layers.Dense(32,activation=tf.nn.relu),
    layers.Dense(10)
])
model.built(input_shape=[None,28*28])
model.summary()
optimizer = optimizers.Adam(lr=1e-3)

def main():
    for epoch in range(30):
        for step,(x,y) in enumerate(db):
            # x -> [b,784]
            x = tf.reshape(x,[-1,28*28])
            with tf.GradientTape() as tape:
                logits = model(x)
                y_onehot = tf.one_hot(y,depth=10)
                loss_mes = tf.reduce_mean(tf.losses.MSE(y_onehot,logits))
                loss_ce =tf.reduce_mean(tf.losses.categorical_crossentropy(y_onehot,logits,from_logits=True))

            grads = tape.gradient(loss_ce,model.trainable_variables)
            optimizer.apply_gradients(zip(grads,model.trainable_variables))# zip Lian jie

            if step % 100 ==0:
                print(epoch,step,'loss:',float(loss_ce),float(loss_mes)).

        total_correct=0
        total_num=0
        for x,y in db_test:
            x = tf.reshape(x,[-1,28*28])
            logits = model(x)
            prob = tf.nn.softmax(logits,axis=1)
            pred = tf.argmax(prob,axis=1)
            pred = tf.cast(pred,dtype=tf.int32)
            correct = tf.equal(pred,y)
            correct = tf.reduce_sum(tf.cast(correct,dtype=tf.int32))

            total_correct += int(correct)
            total_num += x.shape[0]


2.在这种代码类型中,没有调用API,而是从最底层的w1,w2...每个神经元的参数和计算方式着手,在梯度计算个更新中都能代入自己的损失函数和优化过程。

import tensorflow as tf
from tensorflow import keras
from tensorflow.keras import datasets,metrics
#[60k,28,28]
(x, y), (x_val, y_val)= datasets.mnist.load_data()

#
x = tf.convert_to_tensor(x,dtype=tf.float32)/255.
y = tf.convert_to_tensor(y,dtype=tf.int32)
x_val = tf.convert_to_tensor(x_val,dtype=tf.float32)/255
y_val = tf.convert_to_tensor(y_val,dtype=tf.int32)
print(x.shape,y.shape)

print(tf.reduce_max(x))

train_db = tf.data.Dataset.from_tensor_slices((x,y)).batch(128)
test_db = tf.data.Dataset.from_tensor_slices((x_val,y_val)).batch(128)
# train_iter = iter(train_db)
# sample = next(train_iter)
# print('batch=',sample[0].shape)


w1 =tf.Variable(tf.random.truncated_normal([784,256],stddev=0.1))  #均值为0 方差为0 不会梯度爆炸
b1 =tf.Variable (tf.zeros([256]))
w2 =tf.Variable( tf.random.truncated_normal([256,128],stddev=0.1))
b2 =tf.Variable(tf.zeros([128]))
w3 =tf.Variable( tf.random.truncated_normal([128,10],stddev=0.1))
b3 =tf.Variable (tf.zeros([10]))


lr = 1e-3
acc_meter = metrics.Accuracy()  # 新建accuracy测量器
for step,(x,y) in enumerate(train_db):
    with tf.GradientTape() as tape:
        x = tf.reshape(x, [-1, 28 * 28])
        h1 = x @ w1 + b1
        h1 = tf.nn.relu(h1)
        h2 = h1 @ w2 + b2
        h2 = tf.nn.relu(h2)
        h3 = h2 @ w3 + b3
        h3 = tf.nn.softmax(h3)

        y_onehot = tf.one_hot(y, depth=10)
        loss = tf.square(y_onehot - h3)
        loss = tf.reduce_mean(loss) / 128
    grads = tape.gradient(loss,[w1,b1,w2,b2,w3,b3])
    w1.assign_sub(lr * grads[0])
    b1.assign_sub(lr * grads[1])
    w2.assign_sub(lr * grads[2])
    b2.assign_sub(lr * grads[3])
    w3.assign_sub(lr * grads[4])
    b3.assign_sub(lr * grads[5])
    acc_meter.update_state(tf.argmax(h3, axis=1), y)


    if step % 100 ==0:
        print(step,'loss:',float(loss))
        acc_meter.reset_states()



#val
total_correct ,total_num = 0,0
for step, (x, y) in enumerate(test_db):

    x = tf.reshape(x,[-1,28 * 28])

    hi = tf.nn.relu(x@w1 + b1)
    h2 = tf.nn.relu(h1@w2 + b2)
    print(h2.shape)
    out = (h2 @ w3 + b3)
    print(out.shape)
    prob = tf.nn.softmax(out,axis=1)
    print(prob.shape)
    pred = tf.argmax(prob,axis=1)
    print(pred.dtype,y.dtype)
    pred = tf.cast(pred,dtype=tf.int32)
    print(pred.dtype, y.dtype,pred.shape,y.shape)
    correct = tf.cast(tf.equal(pred,y),dtype=tf.int32)
    correct = tf.reduce_sum(correct)

    total_correct +=int(correct)
    total_num += x.shape[0]
    acc = total_correct/total_num
    print('test acc ',acc)

 3.在搭建更深层的网路时,我们可以将多次重复使用的部分创建为一个class,调用tensorflow里的layers,在class的初始中写入网络的构建,在call中写入前向传播过程。是比较常用的类型。如下为GAN网络中判别器的代码。

class Discriminator(keras.Model):
    def __init__(self):
        super(Discriminator, self).__init__()

        self.conv1 = layers.Conv2D(64, 5, 3, 'valid')

        self.conv2 = layers.Conv2D(128, 5, 3, 'valid')

        self.bn2 = layers.BatchNormalization()

        self.conv3 = layers.Conv2D(256, 5, 3, 'valid')
        self.bn3 = layers.BatchNormalization()

        self.flatten = layers.Flatten()
        self.fc = layers.Dense(1)
        # [b, 64, 64, 3] => [b, 1]

    def call(self, inputs, training=None):
        x = self.conv1(inputs)
        x = tf.nn.leaky_relu(x)
        x = self.conv2(x)
        x = self.bn2(x, training=training)
        x = tf.nn.leaky_relu(x)
        x = self.conv3(x)
        x = self.bn3(x, training=training)
        x = tf.nn.leaky_relu(x)
        x = self.flatten(x)
        x = self.fc(x)
        return x

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

Tensorflow2.x模型搭建的几种代码形式 的相关文章

随机推荐

  • 6. JVM调优工具详解及调优实战

    JVM性能调优 1 前置启动程序 1 1 Jmap 1 1 1 Jmap查询内存信息 1 1 2 Jmap查询堆信息 1 1 3 jmap查询堆内存dump 1 2 Jstack 1 3 远程连接jvisualvm 1 4 jstack找出
  • Mongo 数据导出、导入

    1 下载 mongodb database tools windows 2 解压 打开window Powershell 或 doc命令窗口 使用命令进入解压后的文件夹 3 导出数据命令 mongodump exe h 127 0 0 1
  • 2021-06-23 各种经典卷积神经网络总结

    各种经典卷积神经网络总结 1 原始卷积 Vanilla Convolution 2 分组卷积 Group convolution 2 1 组卷积案例1 2 2 组卷积案例2 Resnext 2 3 ShuffleNet 3 转置卷积 Tra
  • 遥感变化检测综述 Change Detection Based on Artificial Intelligence:State-of-the-Art and Change

    遥感变化检测综述 Change Detection Based on Artificial Intelligence State of the Art and Change 现存的变化检测综述主要专注于在多时态高光谱图像 HSIs 和高空间
  • 终极秘密---------windows里藏着9.11的惊天大密码

    终极秘密 windows里藏着9 11的惊天大密码 神秘连锁 密码 泄漏恐怖分子袭美玄机 方法 用WORD 编辑文档输入Q33NY 必须大写 这是9 11撞击世界贸易中心的沙特勇士们乘坐的航班号 第三 将字体大小改到72 最后 将字体转成
  • JS实现简单的购物车

    以下是一个基本的 JS 购物车实现 由于是实现基本的功能 就不弄得多复杂了 代码可以直接Ctrl c v 大家可以试一试 HTML div h2 产品列表 h2 ul li h3 商品1 h3 p 价格 10元 p li ul div
  • SVN 报错:does not support the HTTP/DAV protocol

    原因 我是直接粘贴了上面的网址 而正确做法应该是 点击checkout 复制这个里面的url
  • 图像色彩编码YUV(YCbCr)的基本知识

    参考地址 https www cnblogs com lifan3a articles 4930182 html YUV与YCbCr的定义 YCbCr是DVD 摄像机 数字电视等消费类视频产品中 常用的色彩编码方案 YCbCr 有时会称为
  • No Such Property: Scope For Class: Com.android.build.gradle.internal.variant.ApplicationVariantData

    No Such Property Scope For Class Com android build gradle internal variant ApplicationVariantData 集成360开源的Replugin出现了这个问
  • 软件测试-测试用例的经典例子

    一 等价类划分问 某程序规定 输入三个整数 a b c分别作为三边的边长构成三角形 通过程序判定所构成的三角形的类型 当此三角形为一般三角形 等腰三角形及等边三角形时 分别作计算 用等价类划分方法为该程序进行测试用例设计 三角形问题的复杂之
  • python os模块示例讲解

    os模块包含普遍的操作系统功能 提供了丰富的方法用来处理文件和目录以及一些系统相关的信息的获取 利用这个模块可以写出与平台无关的程序 比如就是使用os sep可以取代操作系统特定的路径分割符 本模块提供一种可移植的方式来使用依赖于操作系统的
  • Ubuntu上安装Boost C++以及Boost.Python的过程和经验

    由于实验的需要 想运行一下这个项目 https github com luckiezhou DynamicTriad 和所有科研相关类的repo一样 要真正用起来还得填很多坑 不得不说 这个repo的作者已经足够认真负责 但是要跑起来还是不
  • C++——const、指针和引用,深度理解

    const修饰符 const修饰符可以定义常量 相比define const修饰的常量的类型更为确定 而不是文本替换 在 C 中 const 也可以修饰对象 且一旦将对象定义为常对象之后 就只能调用类的 const 成员 包括 const
  • 感谢有你

    践行开源共创的精神 FISCO BCOS开源社区致力打造开放多元的开源联盟链生态 目前 社区已汇聚了超70000名社区用户 大家聚集于此碰撞观点 交流技术 围绕FISCO BCOS开发各类实用的应用组件 持续优化项目 并自发输出技术解析 使
  • 网络教育进入新里程碑?斯坦福大学教授创立的免费在线课程教育项目Coursera

    原文地址 http www 36kr com p 201273 html 近两年来 网络教育在国外可谓是非常的热门 无论是课程质量还是其模式都在不断走向成熟 由斯坦福大学两位教授创立的免费在线课程项目Coursera今天宣称 旗下有 5 门
  • request.getScheme() 使用方法

    今天在看代码时 发现程序使用了 request getScheme 不明白是什么意思 查了一下 结果整理如下 1 request getScheme 返回当前链接使用的协议 一般应用返回http SSL返回https 2 在程序中的应用如下
  • 电脑文件误删除恢复的解决办法

    有时候我们常常会头脑发热 把电脑中的一些重要文件不小心删除了 比如一些重要的图片或者文档 甚至还把回收站给清空了 怎么才能将误删除的文件找回来呢 可能大家会马上百度 会看到乱七八糟的找回误删除文件的方法 这些方法无非几种情况 1 软件下载下
  • 电脑ftp服务器信息,电脑上的ftp信息服务器地址

    电脑上的ftp信息服务器地址 内容精选 换一换 通常园区视频功能主要集中在存储和查看 视频分析和态势感知能力较弱 通过使用智能边缘平台与视频分析服务 提升视频分析和感知能力 实现智慧园区人脸识别检测功能 本实践需要使用到视频分析服务的边缘人
  • EXCEL中TEXTJOIN 函数的使用*

    EXCEL中TEXTJOIN 函数的使用 函数说明 textjoin 文本合并函数 函数组成 textjoin 分隔符 忽略空白单元格 字符串1 字符串2 字符串253 示例 需要将需要将左边的表格样式转换成右边的样式 操作步骤 1 将A列
  • Tensorflow2.x模型搭建的几种代码形式

    相信很多新手小白在才开始初学时就想要搭建自己的深度学习模型 但在看到每个风格不同的算法时 又会把前向传播 反向传播 和模型的搭建过程混淆 我总结了一下几种基于Tensorflow2 x搭建模型的代码 1 学习过程中最常见的数据切片 载入并预