Keras：如何扩展validation_split以生成第三组，即测试集？

2023-12-10

我正在使用带有 TensorFlow 后端的 Keras。我使用带有 valid_split 参数的 ImageDataGenerator 将数据拆分为训练集和验证集。因此，我使用 flow_from_directory 并将子集设置为“训练”和“测试”，如下所示：

total_gen = ImageDataGenerator(validation_split=0.3)


train_gen = data_generator.flow_from_directory(my_dir, target_size=(input_size, input_size), shuffle=False, seed=13,
                                                     class_mode='categorical', batch_size=BATCH_SIZE, subset="training")

valid_gen = data_generator.flow_from_directory(my_dir, target_size=(input_size, input_size), shuffle=False, seed=13,
                                                     class_mode='categorical', batch_size=32, subset="validation")

这非常方便，因为它允许我只使用一个目录而不是两个目录（一个用于训练，一个用于验证）。现在我想知道是否可以扩展此过程以生成第三组，即测试集？

这是不可能开箱即用的。您应该能够通过对源代码 of ImageDataGenerator:

if subset is not None:
    if subset not in {'training', 'validation'}: # add a third subset here
        raise ValueError('Invalid subset name:', subset,
                         '; expected "training" or "validation".') # adjust message
    split_idx = int(len(x) * image_data_generator._validation_split) 
    # you'll need two split indices here
    if subset == 'validation':
        x = x[:split_idx]
        x_misc = [np.asarray(xx[:split_idx]) for xx in x_misc]
        if y is not None:
            y = y[:split_idx]
    elif subset == '...' # add extra case here

    else:
        x = x[split_idx:]
        x_misc = [np.asarray(xx[split_idx:]) for xx in x_misc] # change slicing
        if y is not None:
            y = y[split_idx:] # change slicing

Edit：这是修改代码的方法：

if subset is not None:
    if subset not in {'training', 'validation', 'test'}:
        raise ValueError('Invalid subset name:', subset,
                         '; expected "training" or "validation" or "test".')
    split_idxs = (int(len(x) * v) for v in image_data_generator._validation_split)
    if subset == 'validation':
        x = x[:split_idxs[0]]
        x_misc = [np.asarray(xx[:split_idxs[0]]) for xx in x_misc]
        if y is not None:
            y = y[:split_idxs[0]]
    elif subset == 'test':
        x = x[split_idxs[0]:split_idxs[1]]
        x_misc = [np.asarray(xx[split_idxs[0]:split_idxs[1]]) for xx in x_misc]
        if y is not None:
            y = y[split_idxs[0]:split_idxs[1]]
    else:
        x = x[split_idxs[1]:]
        x_misc = [np.asarray(xx[split_idxs[1]:]) for xx in x_misc]
        if y is not None:
            y = y[split_idxs[1]:]

基本上，validation_split现在预计是两个浮点数的元组而不是单个浮点数。验证数据将是 0 到 0 之间的数据分数validation_split[0], 之间的测试数据validation_split[0] and validation_split[1]和训练数据之间validation_split[1]1. 使用方法如下：

import keras
# keras_custom_preprocessing is how i named my directory
from keras_custom_preprocessing.image import ImageDataGenerator

generator = ImageDataGenerator(validation_split=(0.1, 0.5))
# First 10%: validation data - next 40% test data - rest: training data        
gen = generator.flow_from_directory(directory='./data/', subset='test')
# Finds 40% of the images in the dir

您需要在另外两行或三行中修改该文件（您必须更改类型检查），但仅此而已，应该可以工作。我有修改后的文件，如果您有兴趣请告诉我，我可以将其托管在我的 github 上。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Keras：如何扩展validation_split以生成第三组，即测试集？的相关文章

如何在Python中循环并存储自变量中的值

我对 python 很陌生所以这听起来可能很愚蠢我进行了搜索但没有找到解决方案我在 python 中有一个名为 ExcRng 的函数我可以对该函数执行什么样的 for 循环以便将值存储在独立变量中我不想将它们存储在列表中而是
一次将Python dict的内容分配给多个变量？

我想做这样的事情 def f return a 1 b 2 c 3 a b f or a b f IE 这样 a 被分配为 1 b 被分配为 2 并且 c 是未定义的这与此类似 def f return 1 2 a b f 依赖于变量名称
用 tf.data 替换基于队列的输入管道

我正在阅读 Ganegedara 的 NLP with Tensorflow 输入pipieline的介绍有以下例子 import tensorflow as tf import numpy as np import os Defining
python - 是否可以扩展 xml-rpc 可以序列化的事物集？

我看到几个问题询问如何发送numpy ndarray通过 xml rpc 调用这不能开箱即用因为正如 xml rpc 中所述docs https docs python org 2 library xmlrpclib html 有一组固
即使使用 .loc[row_indexer,col_indexer] = value 时也会设置 WithCopyWarning

这是我的代码中得到的行之一SettingWithCopyWarning value1 Total Population value1 Total Population replace to replace value 4 然后我将其更改为
Python BeautifulSoup XML 解析

我编写了一个简单的脚本来使用 BeautifulSoup 模块解析 XML 聊天日志标准 soup prettify 工作正常只是聊天日志中有很多绒毛您可以在下面看到我正在使用的脚本代码和一些 XML 输入文件 Code import
可以在 TensorFlow 中使用排名相关作为成本函数吗？

我正在处理偶尔充满异常值的极其嘈杂的数据因此我主要依靠相关性来衡量我的神经网络的准确性是否可以明确使用诸如等级相关性斯皮尔曼相关系数之类的东西作为我的成本函数到目前为止我主要依赖 MSE 作为相关性的代理我现在面临三个主要障碍
Paramiko - 使用私钥连接 - 不是有效的 OPENSSH 私钥/公钥文件

我正在尝试找到解决方案但无法理解我做错了什么在我的 Linux 服务器上我运行了以下命令 ssh keygen t rsa 这产生了一个id rsa and id rsa pub file 然后我将它们复制到本地并尝试运行以下代码 s
为什么 Python 中的“pip install”会引发语法错误？

我正在尝试使用 pip 安装软件包我试着跑pip install从Python shell 但我得到了SyntaxError 为什么我会收到此错误如何使用 pip 安装软件包 gt gt gt pip install selenium
sudo pip install python-Levenshtein 失败，错误代码 1

我正在尝试在 Linux 上安装 python Levenshtein 库但每当我尝试通过以下方式安装它时 sudo pip install python Levenshtein 我收到此错误命令 usr bin python c 导入
如何通过双击在浏览器中打开 ipynb 文件

以前我安装了 Canopy 当时我只需双击 ipynb 文件并在浏览器中打开它们即可但是后来我需要Anaconda 一旦我安装了它这个功能就没有了现在我只希望能够简单地双击 ipynb 文件然后该文件就会在 Firefox 中
matplotlib matshow 标签

我一个月前开始使用 matplotlib 所以我仍在学习我正在尝试用 matshow 制作热图我的代码如下 data numpy array a reshape 4 4 cax ax matshow data interpolation
更改 pandas 中多个日期时间列的时区信息

有没有一种简单的方法可以将数据帧中的所有时间戳列转换为本地任何时区不是逐列进行吗您可以有选择地将转换应用于所有日期时间列首先选择它们select dtypes https pandas pydata org pandas docs
conda-env list / conda info --envs 如何查找环境？

我一直在尝试 anaconda miniconda 因为我的用户使用随 miniconda 安装的结构生物学程序并且作者都没有 A 考虑到可能存在其他 miniconda 应用程序 B 他们的程序将在多用户环境中使用因此使用 Arch
Matplotlib Scatter - ValueError：RGBA 序列的长度应为 3 或 4

我正在尝试为我的功能绘制图表但不断收到此错误 ValueError RGBA sequence should have length 3 or 4 每当我只有 6 种形状时代码就可以完美运行但现在我将其增加到 10 种它就不起作用了
查找给定节点的最高权重边

我在 NetworkX 中有一个有向图边缘的权重从 0 到 1 表示它们发生的概率网络连通性非常高所以我想修剪每个节点的边缘只保留最高概率的节点我不确定如何迭代每个节点并仅保留最高权重in edges在图中有没有一个networ
Scipy 稀疏 Cumsum

假设我有一个scipy sparse csr matrix代表下面的值 0 0 1 2 0 3 0 4 1 0 0 2 0 3 4 0 我想就地计算非零值的累积和这会将数组更改为 0 0 1 3 0 6 0 10 1 0 0 3 0 6
Python 3.2 中 **kwargs 和 dict 有什么区别？

看起来Python的很多方面都只是功能的重复除了我在 Python 中的 kwargs 和 dict 中看到的冗余之外还有什么区别吗参数解包存在差异许多人使用kwargs 并通过dict作为论据之一使用参数解包 Prepare f
如何将列表字典写入字符串而不是 CSV 文件？

This 堆栈溢出问题 https stackoverflow com questions 37997085 how to write a dictionary of lists to a csv file将列表字典写入 CSV 文件的答案
在 Python 模块中使用 InstaLoader

我正在尝试使用 Instaloader 下载与主题标签相关的照片以进行图像分析我在GitHub存储库中找到了一个全面的方法如何在终端中执行它但是我需要将脚本集成到Python笔记本中这是脚本 instaloader no vide

随机推荐

模板中的读取路径[重复]

这个问题在这里已经有答案了有没有办法读取当前页面的路径例如我在 www example com foo bar 我想阅读 foo bar 我必须在模板文件中执行此操作而不修改视图并且我有太多视图文件而无法编辑每个视图文件 Cheer
在可序列化对象上获取 NotSerializedException

基本上我编写了一个程序将形状绘制到屏幕上并将每个形状保存到 ArrayList 中我想要做的是弄清楚如何将 ArrayList 保存到文件中以便我可以稍后调用它并编辑已经存在的形状因此当我已经将对象 Shape 可序列化时我
在 HTML 页面上并排显示两个图像

我试图并排放置两个相同大小的图像如果我使用一个table然后我就可以并排显示两个图像但在我的 CSS 样式表中我对表格使用了自定义格式这也显示在包含图像的页面上我想只显示两个图像没有任何自定义背景边框等我尝试使用div sp
字符串前面的 b 有何作用？

binary b Binary string 创建一个字符串会产生什么后果binary 我在文档中找不到任何关于此的提示刚刚在浏览 language scanner 时发现了这个小小的好奇心这是永远不会发布的 PHP 版本 6 的前向兼
是否有另一种方法在工作人员中加载额外的包（并行计算）？

R 中并行化的一种方法是通过snowfall包裹要将自定义函数发送给工作人员您可以使用sfExport 参见乔里斯的帖子here 我有一个自定义函数它依赖于非基本包中未自动加载的函数因此当我并行运行我的函数时 R 会崩溃因为某些
使用 iText 提取文本不起作用：编码或加密文本？

我有一个 pdf 文件其安全属性如下打印允许文件组装不允许内容复制允许可访问性内容副本允许页面提取不允许我尝试获取带有示例代码的文本作为文档示例如下所示 pdftext Text null StringBuilde
Rails 3 public_activity，销毁记录

我正在使用公共活动如果用户创建帖子则进行 gem 跟踪有没有办法在删除帖子时销毁公共活动记录以便在活动源中不会显示类似以下内容的内容 A post was deleted 而只是删除活动表中的特定活动 Thanks 我认为这就是OP正
通过 CURL POST JSON 数据并抓取它

我正在尝试传递 json 数据作为 cURL POST 的参数然而我坚持抓住它并将其保存在数据库上卷曲文件 data array name gt Hagrid age gt 36 data string json encode dat
在面板上绘制 Html 表格？

如何生成常规的 html table 在 Sencha Touch 2 的面板上每行的数据可能来自商店它不像列表那样非常移动但我想在我的平板电脑应用程序上有一些详细面板其中包含如下几个部分 header 1 table tr td
Codeigniter多个文件上传路径

我正在构建一个应用程序需要获取上传的文件并将它们放在单独的缩略图和全尺寸图像目录中但是 config upload path uploads 只允许我选择一个上传路径如何定义两个或多个上传路径实际上您需要做的就是重新初始化上传类
为什么 Laravel 或 Beanstalkd 会跳槽？

我正在管理音频转换Laravel 队列 and 豆茎监测者监督者当用户上传音频文件时它会转到AudioController php这会触发一个Queue push AudioProcess 它本身会触发exec sh some scr
JavaScript 从嵌套对象获取值[重复]

这个问题在这里已经有答案了如果这是我的目标 var obj bakery1 small name Small cookie price 0 75 large name Large cookie price 3 00 bakery2 sma
使用 if 语句查找特定值

您好我在 Excel 中有一个很大的产品订单数据集并且它将不断增长数据集看起来像这样 Product Date Lsat24 Next24 Summary Buyer day1 AX1 2 1 2019 Checking invent
在主线程上继续执行任务

如果这是一个简单的问题请原谅我我无法用足够通用的方式来表达它来寻找答案考虑这段代码 var task Task Factory StartNew gt Whatever task ContinueWith Callback TaskS
递归 CTE - 获取后代（多对多关系）

我拥有的给定一棵树或更类似于有向图描述系统如何由其通用部分组成现在让这个系统例如人体及其身体部位的节点例如3可能是有左叶和右叶的肝脏 6 and 9 两者都有静脉 8 也可以在肝脏的任何未指定的位置找到因此8 gt 3 而且也在
如何快速从照片库中获取图像或电影路径

我有这段代码但在尝试获取图像路径时遇到问题我在 google 和 stack over flow 中搜索但我找到的解决方案是 Objective C 或在 swift 中不再工作的代码这是我的代码 IBAction func cho
如何使用 jQuery 为表格制作下拉列表过滤器？

我想在特殊列中创建下拉表过滤器例如我想为已婚列创建过滤器并从下拉列表中选择是或否这是我的表我需要一个 jquery 代码来帮助我制作过滤器 table class table table bordered table stripe
SQL分区在mysql中使用“不存在”

我有下表 committee table commname profname commA bill commA jack commA piper commB bill commB piper 我正试图找到吹笛者所在的每个委员会中的教授
Chrome 配置文件未加载硒

这是我的代码 from selenium import webdriver options webdriver ChromeOptions options add argument r user data dir C Users shahr
Keras：如何扩展validation_split以生成第三组，即测试集？

我正在使用带有 TensorFlow 后端的 Keras 我使用带有 valid split 参数的 ImageDataGenerator 将数据拆分为训练集和验证集因此我使用 flow from directory 并将子集设置为训

Keras：如何扩展validation_split以生成第三组，即测试集？

Keras：如何扩展validation_split以生成第三组，即测试集？ 的相关文章

随机推荐

热门标签

Keras：如何扩展validation_split以生成第三组，即测试集？的相关文章