使用 TensorFlow 进行训练和预测出了什么问题？

2024-03-14

请看下面写的代码。

x = tf.placeholder("float", [None, 80])
W = tf.Variable(tf.zeros([80,2]))
b = tf.Variable(tf.zeros([2]))

y = tf.nn.softmax(tf.matmul(x,W) + b)

y_ = tf.placeholder("float", [None,2])

所以在这里我们看到数据中有 80 个特征，只有 2 个可能的输出。我设置了cross_entropy和train_step像这样。

cross_entropy = tf.nn.softmax_cross_entropy_with_logits(tf.matmul(x, W) + b, y_)
train_step = tf.train.GradientDescentOptimizer(0.01).minimize(cross_entropy)

初始化所有变量。

init = tf.initialize_all_variables()
sess = tf.Session()
sess.run(init)

然后我使用这段代码来“训练”我的神经网络。

g = 0
for i in range(len(x_train)):

    _, w_out, b_out = sess.run([train_step, W, b], feed_dict={x: [x_train[g]], y_: [y_train[g]]})

    g += 1

print "...Trained..."

训练网络后，无论我训练多少次，它总是产生相同的准确率。则准确率是0.856067我用这段代码达到了这种准确性-

correct_prediction = tf.equal(tf.argmax(y,1), tf.argmax(y_,1))
accuracy = tf.reduce_mean(tf.cast(correct_prediction, "float"))
print sess.run(accuracy, feed_dict={x: x_test, y_: y_test})
0.856067

所以这就是问题所在。是因为我的尺寸太小了吗？也许我应该将这些特征分解成 10x8 矩阵？也许是 4x20 矩阵？ ETC。

然后我尝试获取实际测试数据产生 0 或 1 的概率，如下所示 -

test_data_actual = genfromtxt('clean-test-actual.csv',delimiter=',')  # Actual Test data

x_test_actual = []
for i in test_data_actual:
    x_test_actual.append(i)
x_test_actual = np.array(x_test_actual)

ans = sess.run(y, feed_dict={x: x_test_actual})

并打印出概率：

print ans[0:10]
[[ 1.  0.]
 [ 1.  0.]
 [ 1.  0.]
 [ 1.  0.]
 [ 1.  0.]
 [ 1.  0.]
 [ 1.  0.]
 [ 1.  0.]
 [ 1.  0.]
 [ 1.  0.]]

（注：它确实产生[ 0. 1.]有时。）

然后我尝试看看应用专家方法是否会产生更好的结果。请看下面的代码。

def weight_variable(shape):
    initial = tf.truncated_normal(shape, stddev=0.1)
    return tf.Variable(initial)

def bias_variable(shape):
    initial = tf.constant(0.1, shape=shape)
    return tf.Variable(initial)

def conv2d(x, W):
    return tf.nn.conv2d(x, W, strides=[1, 1, 1, 1], padding='SAME')

def max_pool_2x2(x):
    return tf.nn.max_pool(x, ksize=[1, 1, 1, 1],
                        strides=[1, 1, 1, 1], padding='SAME')

（请注意我如何更改strides以避免错误）。

W_conv1 = weight_variable([1, 80, 1, 1])
b_conv1 = bias_variable([1])

这就是问题再次出现的地方。我将张量（向量/矩阵，如果你愿意的话）定义为 80x1（因此 1 行包含 80 个特征）；我在其余代码中继续这样做（请参见下文）。

x_ = tf.reshape(x, [-1,1,80,1])
h_conv1 = tf.nn.relu(conv2d(x_, W_conv1) + b_conv1)

第二卷积层

h_pool1 = max_pool_2x2(h_conv1)
W_conv2 = weight_variable([1, 80, 1, 1])
b_conv2 = bias_variable([1])

h_conv2 = tf.nn.relu(conv2d(h_pool1, W_conv2) + b_conv2)
h_pool2 = max_pool_2x2(h_conv2)

密集连接层

W_fc1 = weight_variable([80, 1024])
b_fc1 = bias_variable([1024])

h_pool2_flat = tf.reshape(h_pool2, [-1, 80])
h_fc1 = tf.nn.relu(tf.matmul(h_pool2_flat, W_fc1) + b_fc1)

Dropout

keep_prob = tf.placeholder("float")
h_fc1_drop = tf.nn.dropout(h_fc1, keep_prob)

Readout

W_fc2 = weight_variable([1024, 2])
b_fc2 = bias_variable([2])

y_conv=tf.nn.softmax(tf.matmul(h_fc1_drop, W_fc2) + b_fc2)

在上面你会看到我将输出定义为 2 个可能的答案（也是为了避免错误）。

Then cross_entropy和train_step.

cross_entropy = tf.nn.softmax_cross_entropy_with_logits(tf.matmul(h_fc1_drop, W_fc2) + b_fc2, y_)

train_step = tf.train.AdamOptimizer(1e-4).minimize(cross_entropy)

correct_prediction = tf.equal(tf.argmax(y_conv,1), tf.argmax(y_,1))
accuracy = tf.reduce_mean(tf.cast(correct_prediction, "float"))

开始会话。

sess.run(tf.initialize_all_variables())

“训练”神经网络。

g = 0

for i in range(len(x_train)):
    if i%100 == 0:
        train_accuracy = accuracy.eval(session=sess, feed_dict={x: [x_train[g]], y_: [y_train[g]], keep_prob: 1.0})

    train_step.run(session=sess, feed_dict={x: [x_train[g]], y_: [y_train[g]], keep_prob: 0.5})

    g += 1

print "test accuracy %g"%accuracy.eval(session=sess, feed_dict={
    x: x_test, y_: y_test, keep_prob: 1.0})
test accuracy 0.929267

而且，再一次，它总是产生0.929267作为输出。

实际数据产生 0 或 1 的概率如下：

[[ 0.92820859  0.07179145]
 [ 0.92820859  0.07179145]
 [ 0.92820859  0.07179145]
 [ 0.92820859  0.07179145]
 [ 0.92820859  0.07179145]
 [ 0.92820859  0.07179145]
 [ 0.96712834  0.03287172]
 [ 0.92820859  0.07179145]
 [ 0.92820859  0.07179145]
 [ 0.92820859  0.07179145]]

如你所见，有some这些概率存在差异，但通常结果相同。

我知道这不是深度学习问题。这显然是一个训练问题。我知道每次重新初始化变量并重新训练网络时，训练准确性总是会存在一些差异，但我只是不知道为什么或哪里出了问题。

答案是2倍。

问题之一是尺寸/参数。另一个问题是这些功能被放置在错误的位置。

W_conv1 = weight_variable([1, 2, 1, 80])
b_conv1 = bias_variable([80])

注意其中的前两个数字weight_variable对应于输入的尺寸。后两个数字对应于特征张量的维度。这bias_variable总是取最后一个数字weight_variable.

第二卷积层

W_conv2 = weight_variable([1, 2, 80, 160])
b_conv2 = bias_variable([160])

这里前两个数字仍然对应于输入的维度。后两个数字对应于特征数量以及由之前 80 个特征产生的加权网络。在这种情况下，我们将加权网络加倍。 80x2=160。这bias_variable然后取最后的数字weight_variable。如果您此时要完成代码，则最后一个数字weight_variable将为 1，以防止由于输入张量和输出张量的形状而导致的尺寸错误。但是，为了更好的预测，我们添加第三个卷积层。

第三卷积层

W_conv3 = weight_variable([1, 2, 160, 1])
b_conv3 = bias_variable([1])

再次，前两个数字weight_variable采取输入的形状。第三个数字对应于我们在第二个卷积层中建立的加权变量的数量。中的最后一个数字weight_variable现在变为 1，因此我们预测的输出不会遇到任何尺寸错误。在这种情况下，输出的尺寸为1, 2.

W_fc2 = weight_variable([80, 1024])
b_fc2 = bias_variable([1024])

这里，神经元的数量是1024这是完全任意的，但是第一个数字weight_variable需要是我们的特征矩阵的维度需要被整除的东西。在这种情况下，它可以是任何数字（例如2, 4, 10, 20, 40, 80）。再一次，bias_variable取最后一个数字weight_variable.

此时，请确保最后一个数字h_pool3_flat = tf.reshape(h_pool3, [-1, 80])对应于第一个数字W_fc2 weight_variable.

现在，当您运行训练程序时，您会注意到结果会有所不同，并且不会总是猜测全 1 或全 0。

当你想预测概率时，你必须输入x to the softmax变量->y_conv=tf.nn.softmax(tf.matmul(h_fc2_drop, W_fc3) + b_fc3)就像这样-

ans = sess.run(y_conv, feed_dict={x: x_test_actual, keep_prob: 1.0})

您可以更改keep_prob变量，但将其保持在1.0总是产生最好的结果。现在，如果你打印出ans你会得到看起来像这样的东西-

[[ 0.90855026  0.09144982]
 [ 0.93020624  0.06979381]
 [ 0.98385173  0.0161483 ]
 [ 0.93948185  0.06051811]
 [ 0.90705943  0.09294061]
 [ 0.95702559  0.04297439]
 [ 0.95543593  0.04456403]
 [ 0.95944828  0.0405517 ]
 [ 0.99154049  0.00845954]
 [ 0.84375167  0.1562483 ]
 [ 0.98449463  0.01550537]
 [ 0.97772813  0.02227189]
 [ 0.98341942  0.01658053]
 [ 0.93026513  0.06973486]
 [ 0.93376994  0.06623009]
 [ 0.98026556  0.01973441]
 [ 0.93210858  0.06789146]

注意概率如何变化。您的训练现在正常进行。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

使用 TensorFlow 进行训练和预测出了什么问题？的相关文章

为什么我们应该在 Keras 中对深度学习数据进行标准化？

我正在 Keras 中测试一些网络架构以对 MNIST 数据集进行分类我已经实现了一个类似于 LeNet 的方法我看到在网上找到的例子中有一个数据标准化的步骤例如 X train 255 我在没有这种标准化的情况下进行了测试我发
Python Pandas 从宽到长的格式更改以及列标题拆分

我有一个包含以下列标题和行示例的表 Subject Test1 Result1 Test1 Result2 Test2 Result1 Test2 Result2 0 John 10 0 5 20 0 3 我想将其改造成 Subject l
如何在不破坏默认行为的情况下覆盖 __getattr__ ？

我如何覆盖 getattr https docs python org 3 reference datamodel html object getattr 类的方法而不破坏默认行为压倒一切 getattr 应该没事 getattr 仅作为
如何使用 boto3 从 AWS Cognito 获取经过身份验证的身份响应

我想使用 boto3 获取访问 AWS 服务的临时凭证用例是这样的我的 Cognito 用户池中的用户登录到我的服务器我希望服务器代码为该用户提供访问其他 AWS 服务的临时凭证我有一个存储我的用户的 Cognito 用户池我有一
检查多维 numpy 数组的所有边是否都是零数组

n 维数组有 2n 个边 1 维数组有 2 个端点 2 维数组有 4 个边或边 3 维数组有 6 个 2 维面 4 维数组有 8 个边 ETC 这类似于抽象 n 维立方体发生的情况我想检查 n 维数组的所有边是否仅由零组成以下是边由零组
如何充分释放函数中使用的GPU内存

我在用着cupy在接收一个函数numpy数组将其推到 GPU 上对其进行一些操作并返回cp asnumpy它的副本问题函数执行后内存没有被释放如ndidia smi 我知道内存的缓存和重用cupy 但是这似乎仅适用于每个用户当
为什么我不能“string”.print()？

我的理解print 在 Python 和 Ruby 以及其他语言中它是字符串或其他类型上的方法因为它的语法非常常用打印嗨 works 那么为什么不呢 hi print 在 Python 中或 hi print在红宝石工作当你
来自数据框 groupby 的条形图

import pandas as pd import numpy as np import matplotlib pyplot as plt df pd read csv arrests csv df df replace np nan 0
PyTorch LSTM 中的“隐藏”和“输出”有什么区别？

我无法理解 PyTorch 的 LSTM 模块以及类似的 RNN 和 GRU 的文档关于输出它说输出输出 h n c n 输出 seq len batch hidden size num directions 包含RNN最后一层的
直接打开Spyder还是通过Pythonxy打开？

之前我一直在运行PythonSpyder 我总是开始Spyder直接双击其图标今天突然发现我还有一个东西叫Python x y 我注意到我也可以开始Spyder通过它这两种方法有什么区别吗如果不是的话有什么意义Python x y
如何将 pip 指向 Mercurial 分支？

我正在尝试通过 pip 将我的应用程序安装到 virtualenv 进行测试安装时效果很好default or tip像这样 pip install e hg https email protected cdn cgi l email p
Bottle 是否可以处理没有并发的请求？

起初我认为 Bottle 会并发处理请求所以我编写了如下测试代码 import json from bottle import Bottle run request response get post import time app B
PyPI 上的轮子平台约束有什么限制吗？

是否有任何地方 PEP 或其他地方声明关于 Linux 轮子上传范围的限制 PyPI http pypi io 应该有具体来说上传是否被认为是可接受的做法linux x86 64轮子到 PyPI 而不是manylinux1 x86 6
使用 .map() 在 pandas DataFrame 中高效创建附加列

我正在分析形状与以下示例类似的数据集我有两种不同类型的数据 abc数据和xyz data abc1 abc2 abc3 xyz1 xyz2 xyz3 0 1 2 2 2 1 2 1 2 1 1 2 1 1 2 2 2 1 2 2 2 3
如何让 Python 找到 ffprobe？

I have ffmpeg and ffprobe安装在我的 mac macOS Sierra 上并且我已将它们的路径添加到 PATH 中我可以从终端运行它们我正在尝试使用ffprobe使用以下代码获取视频文件的宽度和高度 impor
使用 plone.api 创建文件的 Python 脚本在设置文件时出现错误 WrongType

Dears 我正在创建一个脚本python来在Plone站点中批量上传文件安装是UnifiedInstaller Plone 4 3 10 该脚本读取了一个txt 并且该txt以分号分隔在新创建的项目中设置文件时出现错误下面是脚本 f
Docker Build 找不到 pip

尝试关注一些 1 https aws amazon com blogs aws run docker apps locally using the elastic beanstalk eb cli 2 http docs aws amazo
Matplotlib 渲染日期、图像的问题

我在使用 conda forge 的 Matplotlib v 3 1 3 和 python 3 7 时遇到问题我拥有 Matplotlib 所需的所有依赖项当我输入这段代码时它应该可以工作我得到了泼溅艺术它基于此 YouTube
使用 Python 进行 Google 搜索网页抓取 [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案最近为了工作中的一些项目学习了很多python 目前我需要使用谷歌搜索结果进行一些网络抓取我发现几
使用字符串数组在 Hive 表上加载 CSV 文件

我正在尝试将 CSV 文件插入 Hive 其中一个字段是 string 数组这是 CSV 文件 48 Snacks that Power Up Weight Loss Aidan B Prince Health Fitness Trave

随机推荐

如何在 NDK 中加载视频文件（位于 asset 文件夹中）？

我正在通过 android ndk 执行 ffmpeg 我可以运行一个示例在这里 https github com ccggaass android ffmpeg sample 我想把视频放在android的assets文件夹中那么如何
类型错误：+= 不支持的操作数类型：“builtin_function_or_method”和“int”

我收到此错误 TypeError unsupported operand type s for builtin function or method and int 当尝试运行此代码时 total exams 0 for total exa
ios 8 Touch ID 新增指纹检测

我正在深入研究 Apple 的 Touch ID 更准确地说是本地身份验证器目前的文档还相当稀疏主要就是这样 LAContext myContext LAContext alloc init NSError authError nil
FragmentManager 已经在执行事务。提交后什么时候初始化寻呼机是安全的？

我有一个活动托管两个片段该活动开始时会在加载对象时显示加载程序然后加载的对象通过 newInstance 方法作为参数传递给两个片段并附加这些片段 final FragmentTransaction trans getSupport
错误-1054 order子句中未知的列e.id

我有一个这样的查询 SELECT e id FROM event e WHERE e startdatetime
即使 num_threads(1) 时，openmp 的性能提升也难以理解

下面几行代码 int nrows 4096 int ncols 4096 size t numel nrows ncols unsigned char buff unsigned char malloc numel unsigned cha
Magento 选项卡更改/重定向

我有一个带有两个选项卡的页面一个搜索选项卡和一个带有数据库网格的选项卡用户编辑网格中的一个项目后我想将它们保留在网格选项卡上而不是按顺序排列在第一位的表单选项卡上有没有办法通过代码更改页面上的活动选项卡这是选项卡的代码 prot
如何在服务器上将 X-Frame 选项设置为 ALLOW-FROM https://example.com 和 SAMEORIGIN

我需要在服务器级别至 X 框架选项 SAMEORIGIN X 框架选项 ALLOW FROMhttps example com https example com 了解 X 框架选项是互斥的看here https developer mo
从 c# SelectList 获取文本项

使用 Visual Studio Express 2012 for Web 和 Razor 我创建一个选择列表 List
如果不同的条件成立，Firebase如何中断具有不同状态/消息的实时数据库事务？

这是一个好的做法吗如果是的话什么是正确的方法针对不同情况使用不同的错误状态消息来中断事务我有一个事务在优惠条目上运行进行座位预订如果满足以下 3 个条件之一我想打破它并将状态消息返回给调用者函数如果提出请求的用户已经预
临时函数参数的生命周期是多长？ [复制]

这个问题在这里已经有答案了当创建一个新实例时MyClass作为函数的参数如下所示 class MyClass MyClass int a myFunction MyClass 42 该标准是否对析构函数的时间做出任何保证具体来说我可
SSH -L 连接成功，但本地主机端口转发不起作用“通道 3：打开失败：连接失败：连接被拒绝”

我的实验室在服务器上运行 RStudio 几周前我在表弟家里成功通过 ssh 连接到服务器并通过本地 Firefox 浏览器启动了服务器端 RStudio 现在当我尝试从家里访问服务器 RStudio 通过我自己的路由器时它不起作
Java - 在对资源使用 try 时跳过第一行

我需要跳过文件中找到的第一行我的代码 List
Xcode 和 NASM 编码

如何在 Xcode 中用汇编语言编写和构建程序我寻找它但没有成功你能帮助我吗如果无法在 xcode 中编写 NASM 代码请推荐一些好的 IDE 自从您提出这个问题以来这可能已经发生了变化但目前安装Xcode 命令行工具 ht
启动应用程序时出现白屏的原因是什么？如何才能彻底避免呢？

我有一个简单的应用程序其中使用 openssl 进行一些加密但我在启动应用程序时出现白屏超过 5 秒这是我的等级 apply plugin com android application android signingConfigs
.NET 6.0 C# 库中此平台不支持 Microsoft.Data.SqlClient

当我从控制台程序运行 C NET 6 0 库时我没有遇到任何问题System Data SqlClient或 Microsoft Data SqlClient 我用两个 DLL 进行了测试但是如果我用另一个 DLL 调用该 DLL ex
调用 makeViewWithIdentifier:owner: 导致 ARC 重新创建 ivar

我正在编写一个沙盒 ARC 应用程序其中包含基于视图的 NSTableView 它接受拖放文件 NSURLs 我在下面遇到了一些明显的奇怪之处NSTableViewDelegate method NSView tableView NSTa
如何让子组跨越三列？

我正在尝试做什么在我的报告中我试图在 tablix 中获取一些基本数据在这个 tablix 中有一个主要的summary行和detail里面有行我想要做的是将详细信息放在子行中但分为三列例如我的 tablix 现在看起来像这样
如何在 .Net Core ActionFilterAttribute 中使用依赖注入？

身份验证所需属性类 public class AuthenticationRequiredAttribute ActionFilterAttribute ILoginTokenKeyApi loginTokenKeyApi IMemoryC
使用 TensorFlow 进行训练和预测出了什么问题？

请看下面写的代码 x tf placeholder float None 80 W tf Variable tf zeros 80 2 b tf Variable tf zeros 2 y tf nn softmax tf matmul x

使用 TensorFlow 进行训练和预测出了什么问题？

使用 TensorFlow 进行训练和预测出了什么问题？ 的相关文章

随机推荐

热门标签

使用 TensorFlow 进行训练和预测出了什么问题？的相关文章