tensorflow2.0（一）----多层感知机（MLP）

2023-11-12

在TensorFlow 1.X版本中，调用tf.enable_eager_execution（）函数启动Eager Execution模式。则需要调用tf.compat.v1.disable_eager_execution（）函数）张量流使用张量（张量）作为数据的基本单元。

自动求导机制
对y = x*x的导数

import tensorflow as tf
x = tf.Variable(initial_value=3.)
with tf.GradientTape() as tape: # 在 tf.GradientTape() 的上下文内，所有计算步骤都会被记录以用于求导
	y = tf.square(x)
y_grad = tape.gradient(y, x) # 计算y关于x的导数
print([y, y_grad])

x 是一个初始化为3的变量（Variable），使用 tf.Variable() 声明。与普通张量一样，变量同样具有形状、类型和值三种属性。使用变量需要有一个初始化过程，可以通过在tf.Variable() 中指定initial_value 参数来指定初始值。变量与普通张量的一个重要区别是其默认能够被TensorFlow的自动求导机制所求导，因此往往被用于定义机器学习模型的参数。tf.GradientTape() 是一个自动求导的记录器，在其中的变量和计算步骤都会被自动记录。在上面的示例中，变量 x 和计算步骤 y = tf.square(x) 被自动记录，因此可以通过 y_grad =tape.gradient(y, x) 求张量 y 对变量 x 的导数。在机器学习中，更加常见的是对多元函数求偏导数，以及对向量或矩阵的求导。以下代码是如何使用 tf.GradientTape() 计算函数的偏导数。

x = tf.constant([[1., 2.], [3., 4.]])
y = tf.constant([[1.], [2.]])
w = tf.Variable(initial_value=[[1.], [2.]])
b = tf.Variable(initial_value=1.)
with tf.GradientTape() as tape:
	L = 0.5 * tf.reduce_sum(tf.square(tf.matmul(x, w) + b - y))
w_grad, b_grad = tape.gradient(L, [w, b]) # 计算L(w, b)关于w, b的偏导数
print([L.numpy(),w_grad.numpy(),b_grad.numpy])

numpy下线性回归：

a, b = 0, 0
num_epoch = 10000
learning_rate = 1e-3
for e in range(num_epoch):
# 手动计算损失函数关于自变量（模型参数）的梯度
y_pred = a * X + b
grad_a, grad_b = (y_pred - y).dot(X), (y_pred - y).sum()
# 更新参数
a, b = a - learning_rate * grad_a, b - learning_rate * grad_b
print(a, b)

tensorflow下的线性回归

import tensorflow as tf
x = tf.constant(x)
y = tf.constant(y)

a = tf.Variable(initial_value=0.)
b = tf.Variable(initial_value=0.)
variables = [a,b]

num_epoch = 10000
optimizer = tf.keras.optimizers.SGD(learning_rate = 0.0003)
for e in range(num_epoch):
	# 使用tf.GradientTape()记录损失函数的梯度
	with tf.GradientTape() as tape:
		y_pred = a * x + b
		loss = 0.5 * tf.reduce_sum(tf.square(y_pred - y)) # 损失函数
	grads = tape.gradient(loss, variables) # 求偏导
	optimizer.apply_gradients(grads_and_vars = zip(grads, variables)) # 优化器
print(a, b)

使用tf.keras.optimizers.SGD(learning_rate=1e-3) 声明了一个梯度下降优化器（Optimizer）。优化器可以帮助我们根据计算出的求导结果更新模型参数，从而最小化某个特定的损失函数，具体使用方式是调用其 apply_gradients() 方法。 optimizer.apply_gradients() 需要提供参数 grads_and_vars ，即待更新的变量（如上述代码中的 variables ）及损失函数关于这些变量的偏导数（如上述代码中的grads ）。这里需要传入一个Python列表（List），列表中的每个元素是一个（变量的偏导数，变量）对。比如这里是 [(grad_a, a), (grad_b, b)] 。我们通过 grads = tape.gradient(loss,variables) 求出tape中记录的 loss 关于 variables = [a, b] 中每个变量的偏导数，也就是grads = [grad_a, grad_b] ，再使用Python的 zip() 函数将 grads = [grad_a, grad_b] 和variables = [a, b] 拼装在一起，就可以组合出所需的参数了。

自定义模型类

在实际中使用实例化的模型类model = Modle 代替y = a * x +b ，然后使用y_pred = model(x)调用模型，并使用model.variables获取模型参数

tensorflow模型建立和训练，模型（model）和层（layer）

'''
模型类
'''
class MyModel(tf.keras.Model):
	def __init__(self):
		super().__init__()   # python2中 super(MyModel,self).__init__()
		# 此处添加初始代码（包含call方法中会用到的层），例如
		# layer1 = tf.keras.layers.BuiltInLayer(...)
		# layer2 = MyCustomLayer()

	def call(self,input):
		# 此处添加模型调用的代码（处理输入并返回输出），例如
		# x = layer1(input)
		# output = layer2(x)

	# 还可以添加自定义的函数

将上面线性模型y_pred = a * x + b ，以模型类的方式编写：

import tensorflow as tf

x = tf.constant([[1.0,2.0,3.0],[4.0,5.0,6.0]])
y = tf.constant([[10.0],[20.0]])

class Linear(tf.keras.Model):
	def __init__(self):
		super().__init__()
		self.dense = tf.keras.layer.Dence(
			units = 1,
			activation=None,
			kernel_initializer=tf.zeors_initializer(),
			bias_initializer=tf.zeros_initializer(),
		)
	def call(self,input):
		output = self.dense(input)

		return output = 

model = Linear()
optimizer = tf.keras.optimizers.SGD(learning_rate=0.01)
for i in range(100):
	with tf.GradieneTape() as tape:
		y_pred = model(x)    # 全连接层（不激活时）相当于线性变换
		loss = tf.reduce_mean(tf.square(y_pred - y))
	grads = tape.gradient(loss,model.variables) # model.variables获取模型中的所有变量
	optimizer.apply_gradients(grads_and_vars=zip(grads,model.variables))
print(model.variables)

多层感知机（MLP），进行一下步骤：
1、使用 tf.keras,datasets 获取数据集并预处理
2、使用 tf.keras.Model 和 tf.keras.layers 构建模型
3、构建模型训练流程，使用 tf.keras.losses 进行损失函数的计算，并使用 tf.keras.optimizer 优化模型
4、构建模型评估流程，使用 tf.keras.metrics计算评估指标

import tensorflow as tf 

'''
加载数据
'''

class MNISTLoader():
	def __init__(self):
		mnist = tf.keras.datasets.mnist # 自动从网上加载数据
		(self.train_data,self.train_label),(self.test_train,self.test_label) = mnist.load_data()
		# MNIST中的图像默认为unit8(0-255)。下面将其归一化，并在最后加一维作为颜色通道
		self.train_data = np.expand_dims(self.train_data.astype(np.float32) / 255.0,axis = -1)
		# [60000,28,28,1],np.expand_dims()添加一维通道
		self.test_data = np.expand_dims(self.test_data.astype(np.float32) / 255.0,axis = -1)
		# [10000,28,28,1]
		self.train_label = self.train_label.astype(np.int32) 
		self.test_label = self.test_label.astype(np.int32)
		self.num_train_data,self_num_test_data = self.train_data.shape[0],self.test_data.shape[0]
	
	def get_batch(self,batch_size):
		# 从数据中随机取出batch_size个元素并返回
		index = np.random.randint(0,np.shape(self.train_data)[0],batch_size)
		return self.train_data[index,:],self.train_label[index]

'''
模型构建：tf.keras.Model 和 tf.keras.Layer
'''
class MLP(tf.keras.Model):
	def __init__(self):
		super().__init__:
		self.flatten = tf.keras.layers.Flatten() # 将除第一维(batch_size以外的维度展平
		self.dense1 = tf.keras.layers.Dense(units=100,activation=tf.nn.relu)
		self.dense2 = tf.keras.layers.Dense(units=10)
	
	def call(self,inputs):            # [batch_size,28,28,1]
		x = self.flatten(inputs)      # [batch_size,784]
		x = self.dense1(x)            # [batch_size,100]
		x = self.dense2(x)            # [batch_size,10]
		output = tf.nn.softmax(x)

'''
模型训练：tf.keras.losses 和 tf.keras.optimizer
'''
num_epochs = 5
batch_size = 50
learning_rate = 0.001
model = MLP()
data_loader = MNISTLoader()
optimizer = tf.keras.optimizers.Adam(learning_rate)

num_batches = int(data_loader.num_train_data // batch_size * num_epochs)
for batch_index in range(num_batches):
	x,y = data_loader.get_batch(batch_size)
	with tf.GradieneTape() as tape:
		y_pred = model(x)
		loss = tf.keras.losses.sparse_categorical_crossentropy(y_true=y,y_pred=y_pred)
		print("batch &d:loss %f" % (batch_index.loss.numpy()))
	grads = tape.gradient(loss,model.variables)
	optimizer.apply_gradients(grads_and_vars=zip(grads,model.variables))

'''
模型评估：tf.keras.metrics
'''
sparse_categorical_accuracy = tf.keras.metrics.SparseCategoricalAccuracy()
num_batches = int(data_losder.num_test_data // batch_size)
for batch_index in range(num_batches):
	start_index,end_index = batch_index *batch_size，（batch_index + 1）* batch_size 
	y_pred = model.predict(data_loader.test_data [START_INDEX：END_INDEX])
	sparse_categorical_accuracy.update_state(y_ture = data_loader.test_label[start_index:
	end_index],y_pred=y_pred)
	print("test accuracy: %f" % sparse_categorical_accuracy.result())

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

深度学习

tensorflow

tensorflow2.0（一）----多层感知机（MLP）的相关文章

从tensorflow 2.0 beta中的tf.data.Dataset检索下一个元素

在tensorflow 2 0 beta之前要从tf data Dataset中检索第一个元素我们可以使用迭代器如下所示 usr bin python import tensorflow as tf train dataset tf
Keras 中的 Tensorflow 自定义损失函数 - 张量循环

我正在尝试在 Keras 中编写自定义损失函数如下所示 Keras 中的自定义损失函数 https stackoverflow com questions 43818584 custom loss function in keras 我的
应定义密集层输入的最后一个维度。没有找到。收到完整的输入形状：<未知>

我在将模型从一些本地虚拟数据切换到使用 TF 数据集时遇到问题抱歉模型代码太长我已尝试尽可能缩短它以下工作正常 import tensorflow as tf import tensorflow recommenders as tfr
如何防止 Keras 在训练期间计算指标

我正在使用 Tensorflow Keras 2 4 1 并且有一个无监督的自定义指标它将我的几个模型输入作为参数例如 model build model returns a tf keras Model object my met
在tensorflow .ckpt文件中使用预训练模型

我有一个 ckpt 文件我只想得到 cnn 的权重我已经从 ckpt 检查点文件中进行了训练 inception resnet v2 2016 08 30 import tensorflow as tf saver tf train S
带有 s3 路径的张量板 logdir

我看到tensorflow支持AWS s3文件系统 https github com tensorflow tensorflow tree master tensorflow core platform s3 https github co
在 Windows 上将 Word2vec 与 Tensorflow 结合使用

In 本教程文件 https github com tensorflow models blob master tutorials embedding word2vec py L45通过 Tensorflow 找到以下行第 45 行来加
TensorFlow：在输入处获取梯度时性能缓慢

我正在使用 TensorFlow 构建一个简单的多层感知器并且我还需要获取神经网络输入损失的梯度或误差信号这是我的代码它有效 cost tf reduce mean tf nn softmax cross entropy with
如何在 Keras 中将多个数据集与一个模型一起使用？

我正在尝试使用 LSTM 网络通过 Keras 和 Tensorflow 进行外汇预测我当然希望它能够在很多天的交易中进行训练但要做到这一点我必须给它提供具有大跳跃和无运动阶段的连续数据当市场收盘时这并不理想因为它变得由于这些跳
在不丢失基数信息的情况下对 TensorFlow 数据集进行窗口处理？

tf data Dataset window返回一个新的数据集其元素是数据集这些嵌套数据集的元素是所需大小的窗口如果您有一个数据集例如 Dataset range 10 并想要一个像这样的窗口数据集 0 1 2 1 2 3 7 8
用于分布式计算的 Tensorflow 设置

任何人都可以提供有关如何设置张量流以在网络上的许多CPU上工作的指导吗到目前为止我发现的所有示例最多只使用一个本地盒子和多个 GPU 我发现我可以在 session opts 中传递目标列表但我不确定如何在每个盒子上设置张量流来侦听网
scikit-learn 和tensorflow 有什么区别？可以一起使用它们吗？

对于这个问题我无法得到满意的答案据我了解 TensorFlow是一个数值计算库经常用于深度学习应用而Scikit learn是一个通用机器学习框架但它们之间的确切区别是什么 TensorFlow 的目的和功能是什么我可以一起使用它
如何在Tensorflow中保存估计器以供以后使用？

我按照教程 TF Layers 指南构建卷积神经网络以下是代码 https github com tensorflow tensorflow blob r1 1 tensorflow examples tutorials layers
可视化 TFLite 图并获取特定节点的中间值？

我想知道是否有办法知道 tflite 中特定节点的输入和输出列表我知道我可以获得输入输出详细信息但这不允许我重建发生在Interpreter 所以我要做的是 interpreter tf lite Interpreter model
在 GPU 支持下对高维数据进行更快的 Kmeans 聚类

我们一直在使用 Kmeans 来对日志进行聚类典型的数据集有 10 mill 具有 100k 特征的样本为了找到最佳 k 我们并行运行多个 Kmeans 并选择轮廓得分最佳的一个在 90 的情况下我们最终得到的 k 介于 2 到 1
PIL.Image.open和tf.image.decode_jpeg返回值的区别

我使用 PIL Image open 和 tf image decode jpeg 将图像文件解析为数组但发现PIL Image open 中的像素值与tf image decode jpeg不一样为什么会出现这种情况 Thanks 代
带有 CUDA 的 Tensorflow：导入错误

我已经按照 NVIDIA 教程中的说明一步步安装了 TensorFlow Ubuntu 16 04 桌面版 GTX 970 http www nvidia com object gpu accelerated applications te
TensorFlow：带有轴选项的 bincount

在 TensorFlow 中我可以使用 tf bincount 获取数组中每个元素的计数 x tf placeholder tf int32 None freq tf bincount x tf Session run freq feed
如何手动计算分类交叉熵？

当我手动计算二元交叉熵时我应用 sigmoid 来获取概率然后使用交叉熵公式并平均结果 logits tf constant 1 1 0 1 2 labels tf constant 0 0 1 1 1 probs tf nn sigm
如何将张量流模型部署到azure ml工作台

我在用Azure ML Workbench执行二元分类到目前为止一切正常我有很好的准确性我想将模型部署为用于推理的 Web 服务我真的不知道从哪里开始 azure 提供了这个doc https learn microsoft co

随机推荐

一文看尽深度学习中的15种损失函数

转自 https zhuanlan zhihu com p 377799012 在机器学习中损失函数是代价函数的一部分而代价函数则是目标函数的一种类型 1 Loss function 即损失函数用于定义单个训练样本与真实值之间的误差
解决PL/SQL 8 ORA-12514: TNS: 监听程序当前无法识别连接描述符中请求的服务的问题

今天晚上貌似遇到的ORACLE11G问题特别多不过还好几经尝试都在网上找到了答案并解决了这些问题留个备份 PL SQL Developer工具在连oracle11g的时候碰到了这个问题 ORA 12514 TNS 监听程序当前无法
【C语言数据结构】带头节点与不带头节点的单链表头插法对比

前言近期在学习STM32代码框架的过程中老师使用链表来注册设备发现使用了不带头节点的单链表注册时使用头插法之前在本专题整理学习过带头节点的单链表因此本文整理对比一下两种方式的头插法区别具体实现在次重点在于用以理解两种思路以
Apikit 自学日记：API 异常监控-创建 API 监控

如何在apikit中创建 API 监控呢创建并开启监控API 一手动创建监控API Eolink API 网络监控平台支持从 Eolink API Management API管理产品中导入API信息或者手动创建监控API 进入A
(杭电多校)2023“钉耙编程”中国大学生算法设计超级联赛（3）

1005 Out of Control 先将序列a升序然后离散化比如说序列a为1000 1000 500 200 10 然后升序后为10 200 500 1000 1000 映射到从1开始的数为1 2 3 4 4 此即为前缀最大值序列
Flask 学习-70.Flask-RESTX 注册接口实例

前言注册接口主要是密码需要加密用到werkzeug security 模块的2个方法generate password hash check password hash 数据库操作用到Flask SQLAlchemy 相关的基础配置就不
如何利用路由器连接wifi并将wifi网络分发出去

有时候我们的wifi网络设置了最大连接数该数字小于我们的需求数我们可以考虑利用路由器来进一步分发wifi网络下面以tp link的产品为例介绍如何分发网络 1 开启路由器让其发出广播信号 2 使用电脑无线功能连接该路由器登录路由
Vue项目this.$router.push()找不到push问题

在使用Vue cli开发项目时我喜欢使用Es6语法但在使用语法跳路由时却会受到报错因为Es6的箭头函数的this指向的是最近的一个this 而不是全局的所以会造成找不到路由方法的问题解决方法使用传统语法 XXX function
7-4 多态练习-计算面积

定义三个类父类抽象类 GeometricObject代表几何形状子类Circle代表圆形子类Rectangle代表矩形具体属性和方法如下父类抽象类 GeometricObject 属性 private String color
华硕主板BIOS设置虚拟化技（virtualization technology）

华硕主板BIOS设置虚拟化技 virtualization technology 背景环境介绍 win安装docker介绍 bios虚拟技术是否开启检查虚拟技术开启打开bios设置虚拟技术设置参考文献背景从2013开始 doc
A,NS，cname，forward，txt,aaaa记录讲解

最近刚好处理DNS问题比较多对DNS复习一下基础知识在DNS域名解析中记录存在很多种例如主要的A记录 NS记录 CNAME记录 FORWARD记录还有X记录等等现在就对它们的区别与联系做总结 1 A记录 A记录又称IP指向用户
前端面试题总结带答案（持续更新）

Vue面试题 1 什么是 vue 生命周期 Vue 实例从创建到销毁的过程就是生命周期也就是从开始创建初始化数据编译模板挂载Dom 渲染更新渲染卸载等一系列过程我们称这是 Vue 的生命周期它可以总共分为8个阶段创建前
音乐铃声解析提取API接口

接口地址 https api hackeus cn api kgring 请求协议 HTTP HTTPS 请求方式 GET POST 返回格式 JSON 请求示例 https api hackeus cn api kgring api ke
intellij IDEA中我一运行程序，就提示我edit configuration

因为你直接使用open来打开别人的项目所以有问题正确方法重新打开intellij界面使用import来导入别人的项目
[UnityShader入门精要读书笔记]06.顶点/片元着色器基本结构

Unity Shader基本结构包含Shader Properties SubShader FallBack等语义块结构如下 Shader MyShaderName Properties 属性 SubShader 针对显卡A的SubSha
GoWeb——处理XML文件

目录处理XML文件 1 解析XML文件 2 生成XML文件处理XML文件 XML eXtensible Markup Language 可扩展标记语言是一种数据表示格式可以描述非常复杂的数据结构常用于传输和存储数据 1 解析XML
x86 calling conventions

原文地址 http en wikipedia org wiki X86 calling conventions x86 calling conventions From Wikipedia the free encyclopedia Thi
无监督分类的4种方法

1 等宽法类似于制作频数分布图将属性分布值分为几个等分的分布区间 2 等频法将相同数量的记录放入每个区间 3 基于聚类的分析方法将属性按照K means算法进行聚类然后根据聚类的分类将同一聚类的记录合并到同一组内 4 模拟退火法
mysql 修改 sql model_mysql 开发基础系列22 SQL Model(带迁移事项)

一概述与其它数据库不同 mysql 可以运行不同的sql model 下 sql model 定义了mysql应用支持的sql语法数据校验等这样更容易在不同的环境中使用mysql sql model 常用来解决下面几类问题 1 通过
tensorflow2.0（一）----多层感知机（MLP）

在TensorFlow 1 X版本中调用tf enable eager execution 函数启动Eager Execution模式则需要调用tf compat v1 disable eager execution 函数张量流使用张

tensorflow2.0（一）----多层感知机（MLP）

tensorflow2.0（一）----多层感知机（MLP） 的相关文章

随机推荐

热门标签

tensorflow2.0（一）----多层感知机（MLP）的相关文章