Keras ImageDataGenerator 相当于 csv 文件

2024-05-13

我在文件夹中排序了一堆数据，如下图所示：

我需要构建一个 DataIterator 以便将数据放入神经网络模型中。当数据是图像时，我找到了很多例子来解决这个问题，使用 Keras 类图像数据生成器及其方法流自目录，但当数据是 csv 结构时则不然。

每个 csv 文件都是一个 512x11 浮点数组，表示传感器获取的功率。我考虑过将每个 CSV 转换为图像格式，然后应用图像数据生成器类，但压缩会导致信息丢失（在图像中，每个值都由 8 位整数表示，而我的数据是 32 位浮点数）。

因此，Keras 中有一个等效项图像数据生成器加载 csv 文件而不是图像？

是的，您可以通过子类化来编写自己的生成器Sequence目的。这个想法是，您用两列组成某种数据框（例如 pandas 数据框）：一列用于标签，一列用于 csv 文件的路径。您的数据生成器将使用此文件来确定数据集的长度（csv 文件的数量）并批量读取文件并将其传递给模型。

您的代码可能如下所示：

class DataSequence(Sequence):
    """
    Keras Sequence object to train a model on a list of csv files
    """
    def __init__(self, df, batch_size, mode='train'):
        """
        df = dataframe with two columns: the labels and a list of filenames
        """
        self.df = df
        self.bsz = batch_size
        self.mode = mode

        # Take labels and a list of image locations in memory
        self.labels = self.df['label'].values
        self.file_list = self.df['file_names']

    def __len__(self):
        return int(math.ceil(len(self.df) / float(self.bsz)))

    def on_epoch_end(self):
        self.indexes = range(len(self.im_list))
        if self.mode == 'train':
            # Shuffles indexes after each epoch if in training mode
            self.indexes = random.sample(self.indexes, k=len(self.indexes))

    def get_batch_labels(self, idx):
        # Fetch a batch of labels
        return self.labels[idx * self.bsz: (idx + 1) * self.bsz]

    def get_batch_features(self, idx):
        # Fetch a batch of inputs
        return np.array([READ_CSV_FUNCTION(f) for f in self.file_list[idx * self.bsz: (1 + idx) * self.bsz]])

    def __getitem__(self, idx):
        batch_x = self.get_batch_features(idx)
        batch_y = self.get_batch_labels(idx)
        return batch_x, batch_y

你只需要更换READ_CSV_FUNCTION使用您选择的函数来读取和解析 csv 文件。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Keras ImageDataGenerator 相当于 csv 文件的相关文章

将非常大的Python列表输出保存到mysql表中

我想将 python 生成的列表的输出保存在 mysql 数据库的表中该表如下所示 mysql 中的 myapc8 表 https i stack imgur com 4B4Hz png这是Python代码在此输入图像描述 https
如何返回 cost, grad 作为 scipy 的 fmin_cg 函数的元组

我怎样才能使 scipy 的fmin cg使用一个返回的函数cost and gradient作为元组问题是有f对于成本和fprime对于梯度我可能必须执行两次操作非常昂贵 grad and cost被计算此外在它们之间共享变量可
反编译Python 3.9.2的PYC文件[重复]

这个问题在这里已经有答案了目前我有一个 3 9 2 版本的 python 的 PYC 文件 P S 这适用于所有 3 9 及更高版本我正在尝试反编译 PYC 文件但它显示错误因为 uncompyle6 或者更确切地说新版本 de
使用 Boto3 以字符串形式打开 S3 对象

我知道使用 Boto 2 可以使用以下命令将 S3 对象作为字符串打开 get contents as string http boto readthedocs org en latest ref file html highlight c
无法在 selenium 和 requests 之间传递 cookie，以便使用后者进行抓取

我用 python 结合 selenium 编写了一个脚本来登录网站然后从driver to requests这样我就可以继续使用requests进行进一步的活动 I used item soup select one div class
Matplotlib：如何有效地将大量线段着色为独立渐变

Python 绘图库如何有效地将大量线段着色为独立渐变已经阅读this https stackoverflow com questions 8500700 how to plot a gradient color line in ma
使用python从gst管道抓取帧到opencv

我在用着OpenCV http opencv org 和GStreamer0 10 我使用此管道通过自定义套接字通过 UDP 接收 MPEG ts 数据包sockfd由 python 提供并显示它xvimagesink 而且效果很好以下命
如何确保 re.findall() 停止在正确的位置？

这是我的代码 a import re re findall r lt title gt lt title gt a 结果是 title aaa
在Python上获取字典的前x个元素

我是Python的新手所以我尝试用Python获取字典的前50个元素我有一本字典它按值降序排列 k 0 l 0 for k in len dict d l 1 if l lt 51 print dict 举个小例子 dict d m
Python将文本文件解析为嵌套字典

考虑以下数据结构 HEADER1 key value key value HEADER2 key value key value HEADER3 key value HEADER4 key value key value 原始数据中没有缩进
根据其他单元格值更改多个单元格值

我想更改包含的单元格moving to movingToOpenor movingToClose基于下一个单元格中给出的状态有时循环会被中断并且不会从open to close or close to open 这是我当前的数据框 Dat
python中basestring和types.StringType之间的区别？

有什么区别 isinstance foo types StringType and isinstance foo basestring 对于Python2 basestring是两者的基类str and unicode while type
Airflow 1.9 - 无法将日志写入 s3

我在 aws 的 kubernetes 中运行气流 1 9 我希望将日志发送到 s3 因为气流容器本身的寿命并不长我已经阅读了描述该过程的各种线程和文档但我仍然无法让它工作首先是一个测试向我证明 s3 配置和权限是有效的这是在我们
XPath：通过当前节点属性选择当前和下一个节点的文本

首先这是从我之前的问题 https stackoverflow com questions 5202187 xpath select current and next nodes text by current node attribut
可以使用哪些技术来衡量 pandas/numpy 解决方案的性能

Question 如何简洁全面地衡量下面各个功能的性能 Example 考虑数据框df df pd DataFrame Group list QLCKPXNLNTIXAWYMWACA Value 29 52 71 51 45 76 68 6
使用 PIL 在 Tkinter 中显示动画 GIF

我正在尝试制作一个程序来使用 Tkinter 显示动画 GIF 这是我最初使用的代码 from future import division Just because division doesn t work right in 2 7 4
AWS Lambda 不读取环境变量

我正在编写一个 python 脚本来查询 Qualys API 中的漏洞元数据我在 AWS 中将其作为 lambda 函数执行我已经在控制台中设置了环境变量但是当我执行函数时出现以下错误 module initialization
Django 管理器链接

我想知道是否有可能如果可以的话如何将多个管理器链接在一起以生成受两个单独管理器影响的查询集我将解释我正在研究的具体示例我有多个抽象模型类用于为其他模型提供小型的特定功能其中两个模型是DeleteMixin 和GlobalMix
带 Flask 的 RPI dht22：无法将第 4 行设置为输入 - 等待 PulseIn 消息超时

我正在尝试制作一个 Raspberry Pi 3 REST API 使用 DHT22 提供温度和湿度整个代码 from flask import Flask jsonify request from sds011 import SDS01
如何获取pandas中groupby对象中的组数？

我想知道有多少个独特的组需要执行计算给定一个名为 groupby 的对象dfgroup 我们如何找到组的数量简单快速 Pandaic ngroups 较新版本的 groupby API pandas gt 0 23 提供了此未记录的

随机推荐

从 JSON 数组创建标记 php mySQL Google Maps v2 android

我正在尝试从 mySQL 数据库在 Google Maps v2 上创建标记但它不起作用地图确实出现了但没有标记谁能告诉我出了什么问题以及我需要改变什么我也尝试过让 getDouble 为 getDouble 0 和 getDou
ExpressJS - 提供通用 Nuxt 应用程序和 AngularJS SPA

我有一个具有以下结构的博客项目服务器用 Node Express 编写管理员 AngularJS SPA public AngularJS SPA 目前管理部分和公共部分具有相同的域但管理部分使用不同的子域这允许我在 Expre
如何在应用程序中创建会话对象

在我的应用程序中我想创建一个用于登录和注销的会话我不知道如何使用会话任何人都可以通过提供一些示例来帮助我我认为会话对象应该是在应用程序开始运行时声明和初始化的静态对象我遇到了这个问题并决定将我的会话对象放入 utils 类中该
通过Python通过蓝牙发送消息或数据

如何通过 python 通过蓝牙发送消息而无需输入数字等密钥身份验证我用过 pybluez 但我收到了这个错误 File send line 12 in
使用 LLVM/Clang 忽略特定文件中的所有警告

我的 iOS 项目中的一些文件有一些警告我想忽略这些警告我不想禁用整个项目中的警告知道如何做到这一点只是禁用一些特定文件那么有没有办法完全忽略特定文件中的所有警告呢我在 Xcode 4 2 上使用 LLVM 3 0 和 Cla
加权 Voronoi 的 CGAL 2D APOLLONIUS 图 - 如何生成和获取面和顶点？

我正在尝试根据阿波罗尼乌斯图生成加权沃罗诺伊我正在使用 CGAL 库我找不到如何从 apollonius 获取面和顶点的好例子我有以下类型定义 typedef double NT typedef CGAL Cartesian lt N
NHibernate Projections - 如何投影集合

有一个场景我只需要从实体中选择单个几列但在查询中选择多个子项我一直在尝试投影但在集合属性上出现错误这是很正常的情况但找不到有关投影集合的信息仅属性 Customer customerAlias null Order orde
'用户“postgres”的密码验证失败'

我已经安装了 PostgreSQL 8 4 Postgres 客户端和 Pgadmin 3 控制台客户端和 Pgadmin 的用户 postgres 身份验证失败我输入了用户 postgres 和密码 postgres 因为它以前有效但
绘制具有数据子集的图层时，因子水平的顺序会发生变化

我试图控制图例中项目的顺序ggplot2我查找了其他一些类似的问题并发现了如何更改我正在绘制的因子变量的水平顺序我正在绘制 12 月 1 月 7 月和 6 月 4 个月的数据如果我只对所有月份执行一个绘图命令它会按预期工作图例中排
永远不会在 ios 的 google API 中获取上传数据进度

我在我的应用程序中使用 Google Drive API 从我的应用程序上传文件到目前为止我成功了并找到了上传所有类型文件的良好结果我跟着谷歌示例 https developers google com drive examples
如何自定义 Mailboxer 电子邮件的模板？

它会自动发送电子邮件其中写着 You have a new message subject You have received a new message Body Visit http example com and go to you
如何通过 IPTables 阻止一些特殊的用户代理

我需要阻止来自任何来源的数据包其中包括使用 IPTables 的一些特殊用户代理但我不想通过管理它 htaccess或阿帕奇有什么办法吗你可以这样做 iptables A INPUT p tcp dport 80 m string
如何组合 3 个或更多 CompletionStages？

如果有 2 个 CompletionStages 我可以将它们与thenCombine method CompletionStage a aCompletionStage getA CompletionStage b bCompletion
有没有办法在 VSCode 中保存时运行 go 测试，并将其输出到终端？

现在我有几个项目在VSCode中运行运行起来相当繁琐go test每次我编写新代码时我宁愿立即看看我是否破坏了某些东西我知道在 Javascript 中我可以在每次保存文件时运行测试并将输出发送到终端现在我正在使用保存时运行 h
Rstudio 命令历史记录

这些天我经常使用 Rstudio 但最近注意到我的命令不再存储在历史记录中我不知道这是从什么时候开始的但可能是在安装最新版本时发生的关于问题可能是什么的任何想法吗 Thanks 这是我们在 v0 93 73 中引入并在 v0 93 7
实体框架 - 循环更新属性

我正在尝试找到一种方法来循环 EF 对象的属性并更新这些属性的值更具体地说我有 50 个字段其中最多填充 50 个下拉列表所有 50 个可能都需要填充也可能不需要填充为了解决这个问题我有一个中继器最多可以创建 50 个 DD
Jupyter 笔记本中未显示绘图

我正在尝试为 Anscombe 数据集创建 2x2 图加载数据集并分离数据集中的每个类 import seaborn as sns import matplotlib pyplot as plt anscombe sns load dat
如何使用movntdqa避免缓存污染？

我正在尝试编写一个 memcpy 函数该函数不会将源内存加载到 CPU 缓存中目的是避免缓存污染下面的 memcpy 函数可以工作但会像标准 memcpy 一样污染缓存我正在使用带有 Visual C 2008 Express 的
每个 CPU 核心处于 C0 电源状态的时间

任何帮助弄清楚如何做到这一点都会很棒在过去一秒内每个 CPU 核心处于 C0 电源状态的时间有多少这是针对 Mac 应用程序的因此需要 Objective C cocoa 和 c OS X 没有任何公开 CPU c 状态的 API
Keras ImageDataGenerator 相当于 csv 文件

我在文件夹中排序了一堆数据如下图所示我需要构建一个 DataIterator 以便将数据放入神经网络模型中当数据是图像时我找到了很多例子来解决这个问题使用 Keras 类图像数据生成器及其方法流自目录但当数据是 csv 结构时则

Keras ImageDataGenerator 相当于 csv 文件

Keras ImageDataGenerator 相当于 csv 文件 的相关文章

随机推荐

热门标签

Keras ImageDataGenerator 相当于 csv 文件的相关文章