ImageDataGenerator 预测类 - 为什么预测未正确从概率转换为预测类？

2024-05-01

我有一个这样设置的目录：

images

-- val
    --class1
    --class2
-- test
   --all_classes
-- train
    --class1
    --class2

每个目录中都有一组图像。我想预测测试中的每个图像是否属于 1 类或 2 类。

我写这个是为了读取训练和验证数据：

train_path = "/content/drive/train/"
valid_path = "/content/drive/val/"

train_datagen = ImageDataGenerator(
    rescale=1./255,
    shear_range=0.2,
    zoom_range=0.2,
    horizontal_flip=True)

test_datagen = ImageDataGenerator(rescale=1./255)

train_generator=train_datagen.flow_from_directory(
  directory=train_path,
  batch_size=32,
  class_mode='binary',
  target_size=(150,150)
)

validation_generator=test_datagen.flow_from_directory(
  directory=valid_path,
  batch_size=32,
  class_mode='binary',
  target_size=(150,150)
)

创建了一个网络：

def create_network(): 
  model = Sequential()
  model.add(Input(shape=(150,150,3)))

  model.add(Conv2D(32, kernel_size=3,strides=(1, 1),activation='relu', padding='valid', dilation_rate=1))
  model.add(MaxPooling2D(pool_size=(2, 2)))

  model.add(Conv2D(64, kernel_size=3, strides=(1, 1), activation='relu',padding='valid', dilation_rate=1))
  model.add(MaxPooling2D(pool_size=(2, 2)))

  model.add(Flatten())
  model.add(Dense(512, activation='relu'))

  model.add(Dense(1, activation='sigmoid'))
  plot_model(model, to_file='/content/drive/question1_model.png', show_shapes=True, show_layer_names=True)

  model.compile(optimizer = 'adam',
                   loss = 'binary_crossentropy', 
                   metrics = ['accuracy'])
  return model

拟合模型：

def fit_model(train_generator=train_generator, validation_generator=validation_generator,network=create_network()):
  checkpoint_path = "/content/drive/question1_checkpoint.h5"
  checkpoint_dir = os.path.dirname(checkpoint_path)

  callbacks_list = [
      callbacks.EarlyStopping(
          monitor = 'accuracy',
          patience = 5,
      ),

      callbacks.ModelCheckpoint(
          filepath=checkpoint_path,
          monitor = 'val_loss',
          #save_weights_only=True,
          save_best_only=True,
      ),

  ]

  model = network
  history = model.fit(train_generator,
                      epochs=200,
                      validation_data=validation_generator,
                      batch_size=32, 
                      callbacks = callbacks_list,
                      verbose=1
                      )
  return history,model,time_taken

history,model = fit_model(train_generator,validation_generator)

模型的准确率和验证准确率>80%，我将其重新加载进行预测：

model = load_model('/content/drive/question1_checkpoint.h5')

然后我想预测测试目录中的一组图像：

test_datagen = ImageDataGenerator(rescale=1./255)
test_path = "/content/drive/test/"

test_generator = test_datagen.flow_from_directory(
  directory=test_path,
  batch_size=16,
  class_mode='binary',
  target_size=(150,150),
  shuffle = False
)
test_generator.reset()
filenames = test_generator.filenames
nb_samples = len(filenames)
batch_size=16
predict = model.predict(test_generator,steps=test_generator.n/batch_size)

当我打印预测的开始时，我可以看到：

[[6.09035552e-01]
 [2.47541070e-02]
 [7.37663209e-02]
 [5.22839129e-02]
 [2.94408262e-01]
 [1.39171720e-01]
 [6.15863085e-01]

我认为这给了我 1 类正确的概率。但是当我打印每个预测的类别时：

predicted_class_indices=np.argmax(predict,axis=-1)
print(predicted_class_indices)

输出是：

[0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
 0 0 0 0 0 0 0 0 0 0 0]

这意味着我的预测概率没有被正确地转换到课堂上，对吗？因为例如 2.47541070e-02 是 0.02，而 6.09035552e-01 是 0.60，所以这些不应该被预测为不同的类别吗？有人可以告诉我哪里出错了吗？

这段代码给出了以下输出：（在使用相同的二进制类数据集训练模型后，我拍摄了 10 张图像进行测试 - 5 张狗的图像、5 张猫的图像）。

nb_samples = len(filenames)
batch_size=5
predict = model.predict(test_generator,steps=test_generator.n/batch_size)
predict

Output:

array([[0.06690815],
       [0.7787118 ],
       [0.109512  ],
       [0.39706784],
       [0.07243159],
       [0.61042166],
       [0.5808931 ],
       [0.86361384],
       [0.9961897 ],
       [0.61571515]], dtype=float32)

你用过哪个是正确的sigmoid https://www.tensorflow.org/api_docs/python/tf/keras/activations/sigmoid最后一层的激活函数，则输出范围将从 0 到 1。

请不要使用argmax for sigmoid价值观。您可以使用argmax使用时的方法softmax https://www.tensorflow.org/api_docs/python/tf/keras/activations/softmax激活函数来查找其他类别概率中类别的最高概率值。

在这里你可以使用下面的代码：

import tensorflow as tf

predictions = tf.where(predict <= 0.5, 0, 1)

print('Predictions:\n', predictions.numpy())

Output:

Predictions:

 [[0]
 [1]
 [0]
 [0]
 [0]
 [1]
 [1]
 [1]
 [1]
 [1]]

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

ImageDataGenerator 预测类 - 为什么预测未正确从概率转换为预测类？的相关文章

根据日期列过滤并创建列

我有一个样本数据如下 date Deadline 2018 08 01 2018 08 11 2018 09 18 2018 12 08 2018 12 18 我想用代码中描述的条件填写截止日期列如 1 DL 2 DL 3 DL 等基于
为什么 takewhile() 会跳过第一行？

我有一个这样的文件 1 2 3 TAB 1 2 3 TAB 我想将 TAB 之间的行作为块读取 import itertools def block generator file with open file as lines for li
python：如何检查一行是否为空行

试图弄清楚如何编写一个 if 循环来检查一行是否为空该文件有许多字符串其中之一是一个空行用于与其他语句分隔开不是我认为是一个回车符后面跟着另一个回车符 new statement asdasdasd asdasdasdasd ne
Redis 队列工作程序在 utcparse 中崩溃

我正在尝试按照以下教程获得基本的 rq 工作 https blog miguelgrinberg com post the flask mega tutorial part xxii background jobs https blog m
根据另一个非索引数组中的值从 numpy 数组中选择元素

假设我有以下两个数组 a array 1 L 74 423088306605 5 H 128 05441039929008 2 L 68 0581377353869 0 H 88 15726964130869 4 L 97 45015825
使用 Numpy 与 einsum 和 tensordot 进行相同的操作

假设我有两个 3D 数组A and B形状的 3 4 N and 4 3 N 我可以计算沿第三轴的切片之间的点积 with einsum np eisum ikl kjl gt ijl A B 是否可以执行相同的操作numpy tensor
pandas dataframe 对列进行排序会引发索引上的 keyerror

我有以下数据框 df peaklatency snr 0 52 99 0 0 1 54 15 62 000000 2 54 12 82 000000 3 54 64 52 000000 4 54 57 42 000000 5 54 13 7
keras 模型拟合：ValueError：无法找到可以处理输入的数据适配器：，

我正在构建一个简单的 CNN 模型用于多类分类训练和测试数据位于data path根据所需的类子目录flow from directory的函数ImageDataGenerator 这是我根据数据构建和训练模型的代码 from tenso
如何使用httplib2进行相互证书认证

我正在使用 httplib2 从我的服务器向另一个 Web 服务发出请求我们想要使用相互证书身份验证我了解如何使用证书进行传出连接 h set certificate 但是如何检查应答服务器使用的证书这张票 http code goo
python中的unicode错误[关闭]

很难说出这里问的是什么这个问题是含糊的模糊的不完整的过于宽泛的或修辞性的无法以目前的形式得到合理的回答如需帮助澄清此问题以便重新打开访问帮助中心 help reopen questions 在下面的代码中我收到错误mailSe
使用 matplotlib 在 python3 中对多个形状进行动画处理

尝试在 python3 中使用 matplotlib 动画函数同时对多个对象进行动画处理下面写的代码是我到目前为止的位置我能够创建多个对象并将它们显示在图中我通过使用包含矩形补丁函数的 for 循环来完成此操作从这里开始我希望通过
数据框更新后如何刷新绘图？

假设您已经使用以下方法构建了一个图形px line 使用数据框数据框稍后会添加新数据用新数据刷新数据的好方法是什么一个例子可以是px data stocks 从列的子集开始 GOOG AAPL AMZN FB NFLX MSFT 例如
在keras自定义损失中使用层输出

我正在 Keras 中开发自定义损失函数我需要第一层输出我怎样才能取回它 def custom loss y true y pred cross K mean K binary crossentropy y true y pred ax
为什么Python安装程序不断弹出？

每当我尝试运行 Python 文件时都会自动弹出此窗口虽然我可以关闭它但有时它会连续打开 7 10 个窗口这令人恼火谁能告诉我为什么会发生这种情况 None
Python UPnP/IGD 客户端实现？

我正在寻找一个开源实现UPnP http elinux org UPnPPython 中的客户端更具体地说是它的互联网网关设备 http en wikipedia org wiki Internet Gateway Device Prot
将 pi 打印到小数点后几位

w3resources 面临的挑战之一是将 pi 打印到小数点后 n 位这是我的代码 from math import pi fraser str pi length of pi number of places raw input En
在 Python 中，如果我有 unix 时间戳，如何将其插入 MySQL 日期时间字段？

我正在使用 Python MySQLDB 我想将其插入 Mysql 中的 DATETIME 字段我该如何使用cursor execute 来做到这一点要将 UNIX 时间戳转换为 Python 日期时间对象请使用datetime fr
如何从 Pandas DataFrame 转换为 Tensorflow BatchDataset 以进行 NLP？

老实说我想弄清楚如何转换数据集格式 pandasDataFrame或 numpy 数组转换为简单文本分类张量流模型可以训练用于情感分析的形式我使用的数据集类似于 IMDB 包含文本和标签正面或负面我看过的每个教程要么以不同的方式
Python 单元测试：Nose 失败时重试？

我有一个随机失败的测试我想让它在发送错误消息之前重试多次我将 python 与 Nose 一起使用我写了以下内容但不幸的是即使使用 try except 处理当第一次尝试测试失败时 Nose 也会返回错误 def test so
Python google云函数部署失败-Madmom pip包

我正在尝试使用 madmom python pip 包部署 Python3 7 Google Cloud Function 但是指定madmom 0 16 1requirements txt 中的内容导致部署失败当我从requiremen

随机推荐

在 SugarCRM 中，将帐户所有权转让给其他用户不会更新联系人所有权

我正在使用 SugarCRM v6 x 并发现当将帐户所有权转移给新的销售代表分配的用户 ID 字段时联系人和其他相关子记录也不会转移这是 SugarCRM 作者的实际设计选择吗如果是其背后的原因是什么是否有推荐的帐户转移方法
Android 数字格式不知为何是错误的，我得到的不是 3.5，而是 3.499999999，为什么？

我将一些数据存储在数据库中然后使用游标读取这些数据所有数据均为 56 45 3 04 0 03 类型即小数点后两位现在我想对它们求和但这似乎并不容易我得到这些数字c getDouble 3 然后我将它添加到 sum 变量中如下
iOS 信号处理程序可以轻松收集哪些原因信息？

我正在尝试向应用程序添加一些崩溃日志记录并且我有一个signal设置处理程序以捕获标准致命信号我可以在信号处理程序中实际简单地收集哪些原因信息如果有以进行记录我花了大约 2 小时谷歌搜索内容但我找到的大部分内容都是针对
Java多线程和安全发布[关闭]

Closed 这个问题是基于意见的 help closed questions 目前不接受答案看完之后 Java并发实践 http jcip net and OSGI 实践 http neilbartlett name blog osgi
PayPal API 监听器网站支付标准 URI

PayPal IPN 指南文档说得很清楚将请求发布到 www paypal com 或 www sandbox paypal com 具体取决于您是要在沙盒中上线还是测试您的侦听器等待 PayPal 的响应该响应要么已验证要么无效
在 MVC 中重用 WPF ViewModel 是否可行？

我们有一个用 WPF WCF 编写的富客户端应用程序并打算在 ASP net 中创建一个配套网站如果可能使用 MVC 我被要求弄清楚我们当前的代码库中有多少是可以重用的由一个单独的团队而且我对 ASP net 几乎没有经验我们将
CSS 中的圆帽下划线

你能用 CSS 制作圆形下划线如上图所示吗如何有没有办法做到这一点border bottom border radius相反会产生这种时尚的效果编辑我误解了皮克想要什么但这应该有效 test font size 50px b
根据条件过滤数据集

我正在使用 asp net 2 0 和 c 我有一个数据集正在获取员工信息现在我想根据用户在搜索文本框中输入的名称来过滤网格视图我正在这样做 DataSet ds new DataSet EmployeeInformation loa
使用VBA从Zip中删除一些特定文件[重复]

这个问题在这里已经有答案了在完整的宏观过程中我正在创建一个Zip的文件Folder 该文件夹有多个子文件夹和文件使用此代码 Dim oApp As Object NewZip s path acc name zip Set oApp
ORA-02289: 序列不存在，hibernbate 中出错

ORA 02289 序列不存在 hibernbate 中出错在 Oracle 中您无法自动生成值您应该创建一个序列我们称之为 VEHICLE SEQ 然后你应该把这个注释放在你的 id 上 GeneratedValue strate
在 fork() 之后寻求有关“文件描述符”的简单描述

Unix 环境中的高级编程第二版作者 W Richard Stevens 第 8 3 节 fork 函数描述如下父级和子级共享相同的文件偏移量非常重要考虑一个分叉子进程然后等待子进程完成的进程假设两个进程都写入标准输出作为其正
使用选择器获取最接近的父元素（不包括当前元素）

我正在尝试获取元素的最接近的父元素看着 closest https developer mozilla org en US docs Web API Element closest 如果选择器与元素匹配它似乎会返回元素本身 Closes
WEBHID API：条形码扫描仪未触发输入报告

我几乎使用 Nintendo Switch Joy Con 控制器演示我对其进行了一些修改以使其与我的条形码扫描仪一起使用它就是行不通如果行得通则每 100 次站点刷新就会工作一次 console log text gt log t
如何将 Mercurial 存储库克隆到已存在的目录中？

我有一个客户的 Django 项目正在本地开发使用 Mercurial 进行版本控制我将本地存储库推送到我的个人远程服务器我保存所有项目的地方然后当我部署它时在任何 Web 服务器上我从我的个人服务器克隆该存储库这在大多数服
作为颜色表示的值

将值转换为颜色是众所周知的我确实理解以下两种方法在改变 RGB 颜色值来表示一个值 https stackoverflow com questions 1423925 changing rgb color values to repre
如何从控制器 Symfony2 内部访问不同的控制器

我需要从另一个控制器内的不同控制器访问方法我该怎么做我可以用吗this gt get method 我可以将控制器包含在当前控制器中并创建它的对象并通过该对象访问该方法吗这样做可以吗我想调用另一个控制器的表单方法 newActi
找不到 build.xml (Android)

我一直在寻找这个问题的答案有一段时间了但我似乎找不到它我通过 perfoce 移动了 NeBeans Android 项目现在出现以下错误 ZYAndroidAPP build xml 81 Cannot find F Program
我应该如何处理 Android 应用程序中 http post 的服务器超时和错误代码响应？

我的 Android 应用程序会向 URL 发送 http 帖子例如http example com 电子邮件受保护 http example com abc php email abc xyz com因此 Android 应用程序基本上
在哪里可以找到所有 HQL 关键字的列表？

在哪里可以找到所有 HQL 关键字的列表在完整的 Hibernate 源代码下载中有一个grammar hql g文件这是ANTLR http www antlr org 语言定义您可以从官方GitHub源码仓库查看该文件的最新版本
ImageDataGenerator 预测类 - 为什么预测未正确从概率转换为预测类？

我有一个这样设置的目录 images val class1 class2 test all classes train class1 class2 每个目录中都有一组图像我想预测测试中的每个图像是否属于 1 类或 2 类我写这个是为了读

ImageDataGenerator 预测类 - 为什么预测未正确从概率转换为预测类？

ImageDataGenerator 预测类 - 为什么预测未正确从概率转换为预测类？ 的相关文章

随机推荐

热门标签

ImageDataGenerator 预测类 - 为什么预测未正确从概率转换为预测类？的相关文章