Tensorflow：logits 和标签必须具有相同的第一维

2024-05-09

我是张量流新手，我想改编 MNIST 教程https://www.tensorflow.org/tutorials/layers https://www.tensorflow.org/tutorials/layers用我自己的数据（40x40 的图像）。这是我的模型函数：

def cnn_model_fn(features, labels, mode):
        # Input Layer
        input_layer = tf.reshape(features, [-1, 40, 40, 1])

        # Convolutional Layer #1
        conv1 = tf.layers.conv2d(
                inputs=input_layer,
                filters=32,
                kernel_size=[5, 5],
                #  To specify that the output tensor should have the same width and height values as the input tensor
                # value can be "same" ou "valid"
                padding="same",
                activation=tf.nn.relu)

        # Pooling Layer #1
        pool1 = tf.layers.max_pooling2d(inputs=conv1, pool_size=[2, 2], strides=2)

        # Convolutional Layer #2 and Pooling Layer #2
        conv2 = tf.layers.conv2d(
                inputs=pool1,
                filters=64,
                kernel_size=[5, 5],
                padding="same",
                activation=tf.nn.relu)
        pool2 = tf.layers.max_pooling2d(inputs=conv2, pool_size=[2, 2], strides=2)

        # Dense Layer
        pool2_flat = tf.reshape(pool2, [-1, 10 * 10 * 64])
        dense = tf.layers.dense(inputs=pool2_flat, units=1024, activation=tf.nn.relu)
        dropout = tf.layers.dropout(
                inputs=dense, rate=0.4, training=mode == tf.estimator.ModeKeys.TRAIN)

        # Logits Layer
        logits = tf.layers.dense(inputs=dropout, units=2)

        predictions = {
            # Generate predictions (for PREDICT and EVAL mode)
            "classes":       tf.argmax(input=logits, axis=1),
            # Add `softmax_tensor` to the graph. It is used for PREDICT and by the
            # `logging_hook`.
            "probabilities": tf.nn.softmax(logits, name="softmax_tensor")
        }

        if mode == tf.estimator.ModeKeys.PREDICT:
            return tf.estimator.EstimatorSpec(mode=mode, predictions=predictions)

        # Calculate Loss (for both TRAIN and EVAL modes)
        loss = tf.losses.sparse_softmax_cross_entropy(labels=labels, logits=logits)

        # Configure the Training Op (for TRAIN mode)
        if mode == tf.estimator.ModeKeys.TRAIN:
            optimizer = tf.train.GradientDescentOptimizer(learning_rate=0.001)
            train_op = optimizer.minimize(
                    loss=loss,
                    global_step=tf.train.get_global_step())
            return tf.estimator.EstimatorSpec(mode=mode, loss=loss, train_op=train_op)

        # Add evaluation metrics (for EVAL mode)
        eval_metric_ops = {
            "accuracy": tf.metrics.accuracy(
                    labels=labels, predictions=predictions["classes"])}
        return tf.estimator.EstimatorSpec(
                mode=mode, loss=loss, eval_metric_ops=eval_metric_ops)

我的标签和 logits 之间存在形状大小错误：

InvalidArgumentError（请参阅上面的回溯）：logits 和标签必须具有相同的第一维，得到 logits 形状 [3,2] 和标签形状 [1]

filenames_array 是一个包含 16 个字符串的数组

["file1.png", "file2.png", "file3.png", ...]

labels_array是一个16个整数的数组

[0,0,1,1,0,1,0,0,0,...]

主要功能是：

# Create the Estimator
mnist_classifier = tf.estimator.Estimator(model_fn=cnn_model_fn, model_dir="/tmp/test_convnet_model")

# Train the model
cust_train_input_fn = lambda: train_input_fn_custom(
        filenames_array=filenames, labels_array=labels, batch_size=1)

mnist_classifier.train(
        input_fn=cust_train_input_fn,
        steps=20000,
        hooks=[logging_hook])

我尝试重塑 logits 但没有成功：

logits = tf.reshape(logits, [1, 2])

我需要你的帮助，谢谢

EDIT

经过更多时间的搜索，在我的模型函数的第一行

input_layer = tf.reshape(features, [-1, 40, 40, 1])

表示将动态计算batch_size维度的“-1”在此具有值“3”。与我的错误中相同的“3”：logits 和 labels 必须具有相同的第一维，得到 logits 形状 [3,2] 和 labels 形状 [1]

如果我强制将该值设置为“1”，则会出现此新错误：

reshape 的输入是一个具有 4800 个值的张量，但请求的形状具有 1600 个值

也许是我的功能有问题？

EDIT2 :

完整的代码在这里：https://gist.github.com/geoffreyp/cc8e97aab1bff4d39e10001118c6322e https://gist.github.com/geoffreyp/cc8e97aab1bff4d39e10001118c6322e

EDIT3

我更新了要点

logits = tf.layers.dense(inputs=dropout, units=1)

https://gist.github.com/geoffreyp/cc8e97aab1bff4d39e10001118c6322e https://gist.github.com/geoffreyp/cc8e97aab1bff4d39e10001118c6322e

但我不完全理解你关于批量大小的答案，批量大小如何可以是 3 ，而我选择批量大小 1 ？

如果我选择batch_size = 3，则会出现此错误：logits 和 labels 必须具有相同的第一维，得到 logits 形状 [9,1] 和 labels 形状 [3]

我尝试重塑标签：

labels = tf.reshape(labels, [3, 1])

我更新了功能和标签结构：

    filenames_train = [['blackcorner-data/1.png', 'blackcorner-data/2.png', 'blackcorner-data/3.png',
                   'blackcorner-data/4.png', 'blackcorner-data/n1.png'],
                   ['blackcorner-data/n2.png',
                   'blackcorner-data/n3.png', 'blackcorner-data/n4.png',
                   'blackcorner-data/11.png', 'blackcorner-data/21.png'],
                   ['blackcorner-data/31.png',
                   'blackcorner-data/41.png', 'blackcorner-data/n11.png', 'blackcorner-data/n21.png',
                   'blackcorner-data/n31.png']
                   ]

labels = [[0, 0, 0, 0, 1], [1, 1, 1, 0, 0], [0, 0, 1, 1, 1]]

但没有成功...

问题在于您的目标形状，并且与正确选择适当的损失函数有关。你有两种可能性：

1. 可能性：如果你有一维整数编码目标，你可以使用sparse_categorical_crossentropy作为损失函数

n_class = 3
n_features = 100
n_sample = 1000

X = np.random.randint(0,10, (n_sample,n_features))
y = np.random.randint(0,n_class, n_sample)

inp = Input((n_features,))
x = Dense(128, activation='relu')(inp)
out = Dense(n_class, activation='softmax')(x)

model = Model(inp, out)
model.compile(loss='sparse_categorical_crossentropy',optimizer='adam',metrics=['accuracy'])
history = model.fit(X, y, epochs=3)

2. 可能性：如果您对目标进行了 one-hot 编码以获得 2D 形状（n_samples，n_class），您可以使用categorical_crossentropy

n_class = 3
n_features = 100
n_sample = 1000

X = np.random.randint(0,10, (n_sample,n_features))
y = pd.get_dummies(np.random.randint(0,n_class, n_sample)).values

inp = Input((n_features,))
x = Dense(128, activation='relu')(inp)
out = Dense(n_class, activation='softmax')(x)

model = Model(inp, out)
model.compile(loss='categorical_crossentropy',optimizer='adam',metrics=['accuracy'])
history = model.fit(X, y, epochs=3)

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Tensorflow：logits 和标签必须具有相同的第一维的相关文章

Python Popen 与 psexec 挂起 - 不良结果

我对 subprocess Popen 和我认为是管道的问题有疑问我有以下代码块从 cli 运行时 100 都不会出现问题 p subprocess Popen psexec serverName get cmd c ver echo
通过列表理解压平列表列表

我正在尝试使用 python 中的列表理解来展平列表我的清单有点像 1 2 3 4 5 6 7 8 只是为了打印这个列表列表中的单个项目我编写了这个函数 def flat listoflist for item in listoflis
将数据帧行转换为字典

我有像下面的示例数据这样的数据帧我正在尝试将数据帧中的一行转换为类似于下面所需输出的字典但是当我使用 to dict 时我得到了索引和列值有谁知道如何将行转换为像所需输出那样的字典任何提示都非常感激 Sample data pri
Django 模型在模板中不可迭代

我试图迭代模型以获取列表中的第一个图像但它给了我错误即模型不可迭代以下是我的模型和模板的代码我只需要获取与单个产品相关的列表中的第一个图像模型 py class Product models Model title models
if 语句未命中中的 continue 断点

在下面的代码中两者a and b是生成器函数的输出并且可以评估为None或者有一个值 def testBehaviour self a None b 5 while True if not a or not b continue pri
如何计算numpy数组中元素的频率？

我有一个 3 D numpy 数组其中包含重复的元素 counterTraj shape 13530 1 1 例如 counterTraj 包含这样的元素我只显示了几个元素 array 136 129 130 103 102 101 我
在Python中调整图像大小

我有一张尺寸为 288 352 的图像我想将其大小调整为 160 240 我尝试了以下代码 im imread abc png img im resize 160 240 Image ANTIALIAS 但它给出了一个错误TypeErro
使用 OLS 回归预测未来值（Python、StatsModels、Pandas）

我目前正在尝试在 Python 中实现 MLR 但不确定如何将我找到的系数应用于未来值 import pandas as pd import statsmodels formula api as sm import statsmodels
如何通过在 Python 3.x 上按键来启动和中断循环

我有这段代码当按下 P 键时会中断循环但除非我按下非 P 键否则循环不会工作 def main openGame while True purchase imageGrab if a sum gt 1200 fleaButton ti
如何解决使用 Spark 从 S3 重新分区大量数据时从内存中逐出缓存的表分区元数据的问题？

在尝试从 S3 重新分区数据帧时我收到一个一般错误 Caused by org apache spark SparkException Job aborted due to stage failure Task 33 in stage 1
奇怪的 MySQL Python mod_wsgi 无法连接到 'localhost' (49) 上的 MySQL 服务器问题

StackOverflow上也有类似的问题但我还没有发现完全相同的情况这是在使用 MySQL 的 OS X Leopard 机器上一些起始信息 MySQL Server version 5 1 30 Apache 2 2 13 Uni
在 pytube3 中获取 youtube 视频的标题？

我正在尝试构建一个应用程序来使用 python 下载 YouTube 视频pytube3 但我无法检索视频的标题这是我的代码 from pytube import YouTube yt YouTube link print yt titl
如何使用列表作为pandas数据框中的值？

我有一个数据框需要列的子集包含具有多个值的条目下面是一个带有运行时列的数据框其中包含程序在各种条件下的运行时 df condition a runtimes 1 1 5 2 condition b runtimes 0 5 0 7
如何在 python 中没有 csv.reader 迭代器的情况下解析单行 csv 字符串？

我有一个 CSV 文件需要重新排列和重新编码我想跑 line line decode windows 1250 encode utf 8 在由 CSV 读取器解析和分割之前的每一行或者我想自己迭代行运行重新编码并仅使用单行解析表单
Python 将日志滚动到变量

我有一个使用多线程并在服务器后台运行的应用程序为了无需登录服务器即可监控应用程序我决定包括Bottle http bottlepy org为了响应一些HTTP端点并报告状态执行远程关闭等我还想添加一种查阅日志文件的方法我可以使用以
限制 django 应用程序模型中的单个记录？

我想使用模型来保存 django 应用程序的系统设置因此我想限制该模型使其只能有一条记录极限怎么办尝试这个 class MyModel models Model onefield models CharField The fiel
在Python中按属性获取对象列表中的索引

我有具有属性 id 的对象列表我想找到具有特定 id 的对象的索引我写了这样的东西 index 1 for i in range len my list if my list i id specific id index i break
Elastic Beanstalk 中的 enum34 问题

我正在尝试在 Elastic Beanstalk 中设置 django 环境当我尝试通过requirements txt 文件安装时我遇到了python3 6 问题 File opt python run venv bin pip li
Python 无法使用套接字绑定我的外部/公共 IP 地址，给出错误但是当使用本地 IP 地址时，错误不会显示

这是出现主要错误的代码与我的本地 IP 的绑定将起作用 s bind 192 168 1 4 port 与我的公共 IP 的绑定失败并出现以下错误 s bind 99 99 99 99 port WinError 10049 请求的地址在
Scrapy Spider不存储状态（持久状态）

您好有一个基本的蜘蛛可以运行以获取给定域上的所有链接我想确保它保持其状态以便它可以从离开的位置恢复我已按照给定的网址进行操作http doc scrapy org en latest topics jobs html http d

随机推荐

将文件保存到 icloud 驱动器

我正在尝试将文件保存到 icloud 驱动器我要使用简单版本不让用户选择保存文件的位置我只是将其保存在 icloud 驱动器的根目录中这是我正在使用的代码 func exportToFiles for page in pages l
通过移动地址栏时，视差背景图像在移动设备上改变大小

一周以来我的视差元素一直在碰壁寻求帮助对我来说是最后的手段我已经在各种论坛上寻找这些问题的解决方案但我尝试过的都没有效果 only在移动设备上 chrome 如果您按住触摸屏并继续向下滚动则在初始屏幕图像之后会出现一个白条屏幕
Emacs/Swank/Paredit for Clojure 的温和教程

我要转向 Emacs 来工作Clojure http en wikipedia org wiki Clojure Lisp 为了能够执行以下操作我需要在 Emacs 上设置哪些信息自动匹配生成相应的右括号自动缩进 Lisp Cloj
在“弹出”模式下交换访问令牌时出现“redirect_uri_mismatch”

我们根据此文档构建 Web 应用程序并与 Google OAuth2 集成Google 身份服务 JavaScript SDK https developers google com identity oauth2 web guides u
对常量数组的未定义引用

a cpp const unsigned char whatever 123 a h extern const unsigned char whatever 123 b cpp include a h unsigned char x wha
使用 .NET SDK / C# 在 StarTeam 中查找文件的过去修订版本

我正在尝试编写一个 C 程序来比较 StarTeam 存储库中不同版本的文件查看文件的当前版本与给定的先前签入之间是否有任何更改我目前能够从当前版本中查找签出文件但很难找到正确的方法来查找这些文件的过去版本至少在 NET 方面 B
如何创建提供自定义问题匹配器的 VS Code 扩展？

我有一个使用自定义的项目problemMatcher 但我想将其提取到扩展中使其可配置所以最终它可以用于tasks json like problemMatcher myCustomProblemMatcher 怎么做从 VSCode
在 Vue.js 的 eslint 中删除“组件已注册但未使用”

我正在实现动态组件其中使用
如何从后端 API 获取标头或特定标头？

我想使用 fastAPI 从函数内的 API 中检索特定标头但我找不到解决方案在烧瓶中很简单 request headers your header name 为什么 fastAPI 做这么简单的事情却这么复杂有人知道检索标头的解决方
有条件地将可选组替换为 gsub

一位用户问我如何做到这一点如何使 ggplot 图例中的选定单词变为斜体 https stackoverflow com questions 76054997 how to italicize select words in a ggplo
除括号中的空格外，将字符串拆分为所有空格

我正在尝试将文本拆分为以下内容例如在空格上 var line Text what is what s a story fable called named about Search Title 但我希望它忽略括号内的空格这应该产生一个数
基于 SQS 队列大小的自动缩放

我已将这些命令组合在一起以根据 SQS 队列大小自动缩放 EC2 实例我已运行所有命令我的队列有 10 条消息但尚未启动单个实例我想弄清楚我的 cloudwatch 警报正在侦听哪个 SQS 队列此外我们还感谢任何有助于识别问
将 ArrayList 保存到 SharedPreferences

我有一个ArrayList与自定义对象每个自定义对象都包含各种字符串和数字即使用户离开活动然后想要稍后返回我也需要该数组保留下来但是在应用程序完全关闭后我不需要该数组可用我通过使用这种方式保存了很多其他对象SharedPrefer
如何使用 try.zorba.io 从 JSON 运行 JSONiq

我需要编写一个 JSONiq 表达式仅列出成本至少为 3 的产品的名称这是我在XQuery部分 supermarket visit date 08032019 bought item type confectionary item na
使用 matplotlib 从 TeX 创建数学表达式的图像

使用 python 库 matplotlib 我发现了这个问题的解决方案在 PyQt 中很好地显示代数表达式 https stackoverflow com questions 14097463 displaying nicely a
在哪里指定图像尺寸以实现最快渲染：在 HTML 中还是在 CSS 中？

我了解到明确指定图像尺寸是最佳实践然后浏览器可以在仍然下载图像本身的同时布局页面从而缩短感知的页面渲染时间这是真的如果是这样在 HTML 或 CSS 中指定尺寸是否有区别 HTML img src width 200 he
XMLReader - 如何处理未声明的命名空间

Merged https meta stackexchange com questions 158066 what is a merged question with 如何使用 XMLReader 读取未定义命名空间的 XML 文件 que
jQuery Mobile 弹出内容高度超过窗口高度

The jQuery 移动弹出窗口 http jquerymobile com demos 1 2 0 docs pages popup 尺寸仅限于具有左右边距 15 像素顶部和底部边距 30 像素 http jquerymobile c
如何使用广播接收器检查音乐是否正在播放？

我想阻止我的一些代码执行only当前正在播放音乐或视频时我如何使用广播接收器来实现这一点为此你不需要广播接收器 AudioManager是你的朋友 AudioManager isMusicActive 是否有您想要的工作请仔细查看此处
Tensorflow：logits 和标签必须具有相同的第一维

我是张量流新手我想改编 MNIST 教程https www tensorflow org tutorials layers https www tensorflow org tutorials layers用我自己的数据 40x40 的图

Tensorflow：logits 和标签必须具有相同的第一维

Tensorflow：logits 和标签必须具有相同的第一维 的相关文章

随机推荐

热门标签

Tensorflow：logits 和标签必须具有相同的第一维的相关文章