Tensorflow2.x模型搭建的几种代码形式

2023-11-06

相信很多新手小白在才开始初学时就想要搭建自己的深度学习模型，但在看到每个风格不同的算法时，又会把前向传播，反向传播，和模型的搭建过程混淆，我总结了一下几种基于Tensorflow2.x搭建模型的代码。

1.学习过程中最常见的数据切片，载入并预处理，这一部分呢模型运用Sequential搭建，好处是方便简洁，但是前向传播的顺序是固定的，且在训练过程和优化过程中都调用了API。

import tensorflow as tf
from tensorflow import keras
from tensorflow.keras import datasets,layers,optimizers,Sequential,metrics,losses



def prrocess(x,y):
    x = tf.cast(x,dtype=tf.float32)/255
    y = tf.cast(y,dtype=tf.int32)

    return x,y


(x,y),(x_test,y_test) = datasets.fashion_mnist.load_data()
print(x.shape,y.shape)
batchsz = 128

db = tf.data.Dataset.from_tensor_slices((x,y))
db = db.map(prrocess).shuffle(10000).batch(batchsz)

db_test = tf.data.Dataset.from_tensor_slices((x_test,y_test))
db_test = db.map(prrocess).shuffle(10000).batch(batchsz)

db_iter = iter(db)
sample = next(db_iter)

model = Sequential([
    layers.Dense(256,activation=tf.nn.relu),
    layers.Dense(128,activation=tf.nn.relu),
    layers.Dense(64,activation=tf.nn.relu),
    layers.Dense(32,activation=tf.nn.relu),
    layers.Dense(10)
])
model.built(input_shape=[None,28*28])
model.summary()
optimizer = optimizers.Adam(lr=1e-3)

def main():
    for epoch in range(30):
        for step,(x,y) in enumerate(db):
            # x -> [b,784]
            x = tf.reshape(x,[-1,28*28])
            with tf.GradientTape() as tape:
                logits = model(x)
                y_onehot = tf.one_hot(y,depth=10)
                loss_mes = tf.reduce_mean(tf.losses.MSE(y_onehot,logits))
                loss_ce =tf.reduce_mean(tf.losses.categorical_crossentropy(y_onehot,logits,from_logits=True))

            grads = tape.gradient(loss_ce,model.trainable_variables)
            optimizer.apply_gradients(zip(grads,model.trainable_variables))# zip Lian jie

            if step % 100 ==0:
                print(epoch,step,'loss:',float(loss_ce),float(loss_mes)).

        total_correct=0
        total_num=0
        for x,y in db_test:
            x = tf.reshape(x,[-1,28*28])
            logits = model(x)
            prob = tf.nn.softmax(logits,axis=1)
            pred = tf.argmax(prob,axis=1)
            pred = tf.cast(pred,dtype=tf.int32)
            correct = tf.equal(pred,y)
            correct = tf.reduce_sum(tf.cast(correct,dtype=tf.int32))

            total_correct += int(correct)
            total_num += x.shape[0]

2.在这种代码类型中，没有调用API，而是从最底层的w1，w2...每个神经元的参数和计算方式着手，在梯度计算个更新中都能代入自己的损失函数和优化过程。

import tensorflow as tf
from tensorflow import keras
from tensorflow.keras import datasets,metrics
#[60k,28,28]
(x, y), (x_val, y_val)= datasets.mnist.load_data()

#
x = tf.convert_to_tensor(x,dtype=tf.float32)/255.
y = tf.convert_to_tensor(y,dtype=tf.int32)
x_val = tf.convert_to_tensor(x_val,dtype=tf.float32)/255
y_val = tf.convert_to_tensor(y_val,dtype=tf.int32)
print(x.shape,y.shape)

print(tf.reduce_max(x))

train_db = tf.data.Dataset.from_tensor_slices((x,y)).batch(128)
test_db = tf.data.Dataset.from_tensor_slices((x_val,y_val)).batch(128)
# train_iter = iter(train_db)
# sample = next(train_iter)
# print('batch=',sample[0].shape)


w1 =tf.Variable(tf.random.truncated_normal([784,256],stddev=0.1))  #均值为0 方差为0 不会梯度爆炸
b1 =tf.Variable (tf.zeros([256]))
w2 =tf.Variable( tf.random.truncated_normal([256,128],stddev=0.1))
b2 =tf.Variable(tf.zeros([128]))
w3 =tf.Variable( tf.random.truncated_normal([128,10],stddev=0.1))
b3 =tf.Variable (tf.zeros([10]))


lr = 1e-3
acc_meter = metrics.Accuracy()  # 新建accuracy测量器
for step,(x,y) in enumerate(train_db):
    with tf.GradientTape() as tape:
        x = tf.reshape(x, [-1, 28 * 28])
        h1 = x @ w1 + b1
        h1 = tf.nn.relu(h1)
        h2 = h1 @ w2 + b2
        h2 = tf.nn.relu(h2)
        h3 = h2 @ w3 + b3
        h3 = tf.nn.softmax(h3)

        y_onehot = tf.one_hot(y, depth=10)
        loss = tf.square(y_onehot - h3)
        loss = tf.reduce_mean(loss) / 128
    grads = tape.gradient(loss,[w1,b1,w2,b2,w3,b3])
    w1.assign_sub(lr * grads[0])
    b1.assign_sub(lr * grads[1])
    w2.assign_sub(lr * grads[2])
    b2.assign_sub(lr * grads[3])
    w3.assign_sub(lr * grads[4])
    b3.assign_sub(lr * grads[5])
    acc_meter.update_state(tf.argmax(h3, axis=1), y)


    if step % 100 ==0:
        print(step,'loss:',float(loss))
        acc_meter.reset_states()



#val
total_correct ,total_num = 0,0
for step, (x, y) in enumerate(test_db):

    x = tf.reshape(x,[-1,28 * 28])

    hi = tf.nn.relu(x@w1 + b1)
    h2 = tf.nn.relu(h1@w2 + b2)
    print(h2.shape)
    out = (h2 @ w3 + b3)
    print(out.shape)
    prob = tf.nn.softmax(out,axis=1)
    print(prob.shape)
    pred = tf.argmax(prob,axis=1)
    print(pred.dtype,y.dtype)
    pred = tf.cast(pred,dtype=tf.int32)
    print(pred.dtype, y.dtype,pred.shape,y.shape)
    correct = tf.cast(tf.equal(pred,y),dtype=tf.int32)
    correct = tf.reduce_sum(correct)

    total_correct +=int(correct)
    total_num += x.shape[0]
    acc = total_correct/total_num
    print('test acc ',acc)

3.在搭建更深层的网路时，我们可以将多次重复使用的部分创建为一个class，调用tensorflow里的layers，在class的初始中写入网络的构建，在call中写入前向传播过程。是比较常用的类型。如下为GAN网络中判别器的代码。

class Discriminator(keras.Model):
    def __init__(self):
        super(Discriminator, self).__init__()

        self.conv1 = layers.Conv2D(64, 5, 3, 'valid')

        self.conv2 = layers.Conv2D(128, 5, 3, 'valid')

        self.bn2 = layers.BatchNormalization()

        self.conv3 = layers.Conv2D(256, 5, 3, 'valid')
        self.bn3 = layers.BatchNormalization()

        self.flatten = layers.Flatten()
        self.fc = layers.Dense(1)
        # [b, 64, 64, 3] => [b, 1]

    def call(self, inputs, training=None):
        x = self.conv1(inputs)
        x = tf.nn.leaky_relu(x)
        x = self.conv2(x)
        x = self.bn2(x, training=training)
        x = tf.nn.leaky_relu(x)
        x = self.conv3(x)
        x = self.bn3(x, training=training)
        x = tf.nn.leaky_relu(x)
        x = self.flatten(x)
        x = self.fc(x)
        return x

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Tensorflow2.x模型搭建的几种代码形式的相关文章

在 Pandas 中按日期获取有效合约

我在检测 pandas DataFrame 中的活动合约方面遇到了一些困难假设每一行都是一个协商对于每一行我有两列 initial date 和 end date 我想知道的是按日期划分的活跃合约数量到目前为止我做了一个非常低效的方
为什么 .setGeometry() 不改变 QWidget 实例的大小？

我想使用 QWidget 更改 QPushButton 的大小 setGeometry https doc qt io qtforpython 5 PySide2 QtWidgets QWidget html PySide2 QtWidge
一次将Python dict的内容分配给多个变量？

我想做这样的事情 def f return a 1 b 2 c 3 a b f or a b f IE 这样 a 被分配为 1 b 被分配为 2 并且 c 是未定义的这与此类似 def f return 1 2 a b f 依赖于变量名称
on_delete=models.PROTECT 和 on_delete=models.CASCADE 在 Django 模型上有什么作用？

我对 Django 很熟悉但最近注意到有一个on delete models CASCADE and on delete models PROTECT模型的选项 on delete models CASCADE and on delete
Tensorflow 可变图像输入大小（自动编码器、放大......）

Edit WARNING不建议使用不同图像大小的图像因为张量需要具有相同的大小才能实现并行化我一直在寻找解决方案了解如何使用不同大小的图像作为神经网络的输入 Numpy 第一个想法是使用numpy 然而由于每个图像的大小不同我无法
python 中分割字符串以获得一个值？

需要帮助假设我在名为 input 的变量中有一个字符串 Sam Person name kind input split 通过执行上述操作我得到两个具有不同字符串 Sam 和 Person 的变量有没有办法只获取第一个值 name S
Paramiko - 使用私钥连接 - 不是有效的 OPENSSH 私钥/公钥文件

我正在尝试找到解决方案但无法理解我做错了什么在我的 Linux 服务器上我运行了以下命令 ssh keygen t rsa 这产生了一个id rsa and id rsa pub file 然后我将它们复制到本地并尝试运行以下代码 s
Pandas重置索引未生效[重复]

这个问题在这里已经有答案了我不确定我在哪里误入歧途但我似乎无法重置数据帧上的索引当我跑步时test head 我得到以下输出正如您所看到的数据帧是一个切片因此索引超出范围我想做的是重置该数据帧的索引所以我跑test rese
如果字段值在外部列表中，Django 会注释布尔值

想象一下我有这个 Django 模型 class Letter models Model name models CharField max length 1 unique True 还有这个列表 vowels a e i o u 我想查询
matplotlib matshow 标签

我一个月前开始使用 matplotlib 所以我仍在学习我正在尝试用 matshow 制作热图我的代码如下 data numpy array a reshape 4 4 cax ax matshow data interpolation
select() 可以在 Windows 下使用 Python 中的文件吗？

我正在尝试在 Windows 下运行以下 python 服务器 An echo server that uses select to handle multiple clients at a time Entering any line o
在 MacO 和 Linux 上安装 win32com [重复]

这个问题在这里已经有答案了我的问题很简单我可以安装吗win32com蟒蛇API pywin32特别是在非 Windows 操作系统上我一直在Mac上尝试多个版本pip install pywin32 都失败了下面是一个例子如果你
Airflow Python 单元测试？

我想为我们的 DAG 添加一些单元测试但找不到任何单元测试有 DAG 单元测试框架吗有一个端到端的测试框架存在但我猜它已经死了 https issues apache org jira browse AIRFLOW 79 https
如何在与应用程序初始化文件不同的文件中迭代 api 路由

我有一个 apiroutes py 文件其中定义了许多路由例如 api route api read methods GET api route api write methods POST 其中 api 是导入 from import
Python 3.2 中 **kwargs 和 dict 有什么区别？

看起来Python的很多方面都只是功能的重复除了我在 Python 中的 kwargs 和 dict 中看到的冗余之外还有什么区别吗参数解包存在差异许多人使用kwargs 并通过dict作为论据之一使用参数解包 Prepare f
全局变量是 None 而不是实例 - Python

我正在处理Python 中的全局变量代码应该可以正常工作但是有一个问题我必须使用全局变量作为类的实例Back 当我运行应用程序时它说 back is None 这应该不是真的因为第二行setup 功能 back Back Back
如何将列表字典写入字符串而不是 CSV 文件？

This 堆栈溢出问题 https stackoverflow com questions 37997085 how to write a dictionary of lists to a csv file将列表字典写入 CSV 文件的答案
异步和协程与任务队列

我一直在阅读有关 python 3 中的 asyncio 模块的内容以及更广泛地了解 python 中的协程的内容但我不明白是什么让 asyncio 成为如此出色的工具我的感觉是你可以用协程做的所有事情通过使用基于多处理模块例如
使用 Python 生成类似于 Messenger 或 kik 代码的圆形二维码

我可以使用 Python 生成圆形 QR 码就像 Facebook Messenger 或 kik 使用的那样吗我访问了很多网站但找不到这种类型的二维码默认情况下 Python 生成方形 QR 码但在我的项目中我想要圆形 QR 码
Django South - 将 null=True 字段转换为 null=False 字段

我的问题是转变的最佳做法是什么null True场变成null False使用 Django South 的字段具体来说我正在与ForeignKey 你应该先写一个数据迁移 http south aeracode org docs t

随机推荐

6. JVM调优工具详解及调优实战

JVM性能调优 1 前置启动程序 1 1 Jmap 1 1 1 Jmap查询内存信息 1 1 2 Jmap查询堆信息 1 1 3 jmap查询堆内存dump 1 2 Jstack 1 3 远程连接jvisualvm 1 4 jstack找出
Mongo 数据导出、导入

1 下载 mongodb database tools windows 2 解压打开window Powershell 或 doc命令窗口使用命令进入解压后的文件夹 3 导出数据命令 mongodump exe h 127 0 0 1
2021-06-23 各种经典卷积神经网络总结

各种经典卷积神经网络总结 1 原始卷积 Vanilla Convolution 2 分组卷积 Group convolution 2 1 组卷积案例1 2 2 组卷积案例2 Resnext 2 3 ShuffleNet 3 转置卷积 Tra
遥感变化检测综述 Change Detection Based on Artificial Intelligence:State-of-the-Art and Change

遥感变化检测综述 Change Detection Based on Artificial Intelligence State of the Art and Change 现存的变化检测综述主要专注于在多时态高光谱图像 HSIs 和高空间
终极秘密---------windows里藏着9.11的惊天大密码

终极秘密 windows里藏着9 11的惊天大密码神秘连锁密码泄漏恐怖分子袭美玄机方法用WORD 编辑文档输入Q33NY 必须大写这是9 11撞击世界贸易中心的沙特勇士们乘坐的航班号第三将字体大小改到72 最后将字体转成
JS实现简单的购物车

以下是一个基本的 JS 购物车实现由于是实现基本的功能就不弄得多复杂了代码可以直接Ctrl c v 大家可以试一试 HTML div h2 产品列表 h2 ul li h3 商品1 h3 p 价格 10元 p li ul div
SVN 报错：does not support the HTTP/DAV protocol

原因我是直接粘贴了上面的网址而正确做法应该是点击checkout 复制这个里面的url
图像色彩编码YUV（YCbCr）的基本知识

参考地址 https www cnblogs com lifan3a articles 4930182 html YUV与YCbCr的定义 YCbCr是DVD 摄像机数字电视等消费类视频产品中常用的色彩编码方案 YCbCr 有时会称为
No Such Property: Scope For Class: Com.android.build.gradle.internal.variant.ApplicationVariantData

No Such Property Scope For Class Com android build gradle internal variant ApplicationVariantData 集成360开源的Replugin出现了这个问
软件测试－测试用例的经典例子

一等价类划分问某程序规定输入三个整数 a b c分别作为三边的边长构成三角形通过程序判定所构成的三角形的类型当此三角形为一般三角形等腰三角形及等边三角形时分别作计算用等价类划分方法为该程序进行测试用例设计三角形问题的复杂之
python os模块示例讲解

os模块包含普遍的操作系统功能提供了丰富的方法用来处理文件和目录以及一些系统相关的信息的获取利用这个模块可以写出与平台无关的程序比如就是使用os sep可以取代操作系统特定的路径分割符本模块提供一种可移植的方式来使用依赖于操作系统的
Ubuntu上安装Boost C++以及Boost.Python的过程和经验

由于实验的需要想运行一下这个项目 https github com luckiezhou DynamicTriad 和所有科研相关类的repo一样要真正用起来还得填很多坑不得不说这个repo的作者已经足够认真负责但是要跑起来还是不
C++——const、指针和引用，深度理解

const修饰符 const修饰符可以定义常量相比define const修饰的常量的类型更为确定而不是文本替换在 C 中 const 也可以修饰对象且一旦将对象定义为常对象之后就只能调用类的 const 成员包括 const
感谢有你

践行开源共创的精神 FISCO BCOS开源社区致力打造开放多元的开源联盟链生态目前社区已汇聚了超70000名社区用户大家聚集于此碰撞观点交流技术围绕FISCO BCOS开发各类实用的应用组件持续优化项目并自发输出技术解析使
网络教育进入新里程碑？斯坦福大学教授创立的免费在线课程教育项目Coursera

原文地址 http www 36kr com p 201273 html 近两年来网络教育在国外可谓是非常的热门无论是课程质量还是其模式都在不断走向成熟由斯坦福大学两位教授创立的免费在线课程项目Coursera今天宣称旗下有 5 门
request.getScheme() 使用方法

今天在看代码时发现程序使用了 request getScheme 不明白是什么意思查了一下结果整理如下 1 request getScheme 返回当前链接使用的协议一般应用返回http SSL返回https 2 在程序中的应用如下
电脑文件误删除恢复的解决办法

有时候我们常常会头脑发热把电脑中的一些重要文件不小心删除了比如一些重要的图片或者文档甚至还把回收站给清空了怎么才能将误删除的文件找回来呢可能大家会马上百度会看到乱七八糟的找回误删除文件的方法这些方法无非几种情况 1 软件下载下
电脑ftp服务器信息,电脑上的ftp信息服务器地址

电脑上的ftp信息服务器地址内容精选换一换通常园区视频功能主要集中在存储和查看视频分析和态势感知能力较弱通过使用智能边缘平台与视频分析服务提升视频分析和感知能力实现智慧园区人脸识别检测功能本实践需要使用到视频分析服务的边缘人
EXCEL中TEXTJOIN 函数的使用*

EXCEL中TEXTJOIN 函数的使用函数说明 textjoin 文本合并函数函数组成 textjoin 分隔符忽略空白单元格字符串1 字符串2 字符串253 示例需要将需要将左边的表格样式转换成右边的样式操作步骤 1 将A列
Tensorflow2.x模型搭建的几种代码形式

相信很多新手小白在才开始初学时就想要搭建自己的深度学习模型但在看到每个风格不同的算法时又会把前向传播反向传播和模型的搭建过程混淆我总结了一下几种基于Tensorflow2 x搭建模型的代码 1 学习过程中最常见的数据切片载入并预

Tensorflow2.x模型搭建的几种代码形式

Tensorflow2.x模型搭建的几种代码形式 的相关文章

随机推荐

热门标签

Tensorflow2.x模型搭建的几种代码形式的相关文章