有没有正确的方法来子类 Tensorflow 的数据集？

2024-01-26

我正在研究可以处理自定义 Tensorflow 数据集的不同方法，并且我习惯于查看PyTorch 的数据集 https://pytorch.org/tutorials/beginner/basics/data_tutorial.html#creating-a-custom-dataset-for-your-files，但是当我去看的时候Tensorflow 的数据集 https://www.tensorflow.org/guide/data_performance，我看到了这个例子：

class ArtificialDataset(tf.data.Dataset):
  def _generator(num_samples):
    # Opening the file
    time.sleep(0.03)

    for sample_idx in range(num_samples):
      # Reading data (line, record) from the file
      time.sleep(0.015)

      yield (sample_idx,)

  def __new__(cls, num_samples=3):
    return tf.data.Dataset.from_generator(
        cls._generator,
        output_signature = tf.TensorSpec(shape = (1,), dtype = tf.int64),
        args=(num_samples,)
        )

但出现了两个问题：

看起来它所做的就是当对象被实例化时，__new__方法只是调用tf.data.Dataset.from_generator静态方法。那么为什么不直接调用它呢？为什么有一个甚至子类化的点tf.data.Dataset？是否有任何方法可以使用tf.data.Dataset?
有没有一种方法可以像数据生成器一样做到这一点，其中一个人填写一个__iter__方法同时继承自tf.data.Dataset？我不知道，就像

class MyDataLoader(tf.data.Dataset):
  def __init__(self, path, *args, **kwargs):
    super().__init__(*args, **kwargs)
    self.data = pd.read_csv(path)

  def __iter__(self):
    for datum in self.data.iterrows():
      yield datum

非常感谢大家！

问题1

该示例只是将数据集与生成器封装在类中。它继承自tf.data.Dataset因为from_generator() https://www.tensorflow.org/api_docs/python/tf/data/Dataset#from_generator返回一个tf.data.Dataset基于对象。然而，没有方法tf.data.Dataset如示例中所示使用。因此，回答问题1：是的，可以直接调用而不使用类。

问题2

是的。可以这样做。

另一种类似的方法是使用tf.keras.utils.Sequence https://www.tensorflow.org/api_docs/python/tf/keras/utils/Sequence like here https://medium.com/@mrgarg.rajat/training-on-large-datasets-that-dont-fit-in-memory-in-keras-60a974785d71.

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

tensorflow

有没有正确的方法来子类 Tensorflow 的数据集？的相关文章

如何以“正确”的方式处理带有空字节的 Python unicode 字符串？

Question PyWin32 似乎很乐意将 null 终止的 unicode 字符串作为返回值我想以正确的方式处理这些字符串假设我得到一个像这样的字符串 u C Users Guest MyFile asy x00 x00sy
使用 python 中的公式函数使从 Excel 中提取的值的百分比相等

import xlrd numpy excel Users Bob Desktop wb1 xlrd open workbook excel assignment3 xlsx sh1 wb1 sheet by index 0 colA co
补丁 - 为什么相对补丁目标名称不起作用？

我已经从模块导入了一个类但是当我尝试修补类名而不使用模块作为前缀时出现类型错误 TypeError Need a valid target to patch You supplied MyClass 例如以下代码给出了上述错误 imp
保留完整姓氏，在 pandas 列中获取名字的首字母（如果有的话，还有中间名）

我有一个 pandas 数据框其中有一列表示几位网球运动员的姓氏和姓名如下所示 Player 0 Roddick Andy 1 Federer Roger 2 Tsonga Jo Wilfred 我想保留完整的姓氏并获取姓名的首字母和中
Python 2.7 中的断言对我来说不起作用示例assertIn

我的 Mac 上安装了 python 2 7 通过在终端中运行 python v 进行验证当我尝试使用任何新的 2 7 断言方法时我收到 AtributeError 我看过http docs python org 2 library u
Pandas：如果单元格包含特定文本则删除行

pandas 中的这段代码不起作用如果该列包含提供的任何文本数字我希望它删除该行目前我只能在单元格与我的代码中传递的确切文本匹配时才能使其工作因为它只删除显示 Fin 的单元格不是金融或金融 df2 df df Team Fin
如何使用文本相似性删除 pandas 数据框中相似（不重复）的行？

我有数千个数据这些数据可能相似也可能不相似使用 python 的默认函数 drop duplicates 并没有真正的帮助因为它们只检测相似的数据例如如果我的数据包含类似以下内容怎么办嗨早上好嗨早上好 Python 不会将
在 matplotlib 中的极坐标图上移动径向刻度标签

From matplotlib 示例 http matplotlib org examples pylab examples polar demo html import numpy as np import seaborn as sbs
Django send_mail SMTPSenderRefused 530 与 gmail

一段时间以来我一直在尝试使用 Django 从我正在开发的网站接收电子邮件现在我还没有部署它并且我正在使用Django开发服务器我不知道这是否会影响它这是我的 settings py 配置 EMAIL BACKEND djang
pytest：同一接口的不同实现的可重用测试

想象一下我已经实现了一个名为的实用程序可能是一个类 Bar在一个模块中foo 并为其编写了以下测试测试 foo py from foo import Bar as Implementation from pytest import ma
.pyx 文件出现未知文件类型错误

我正在尝试构建一个包含 pyx 文件的 Python 包 pyregion 但在构建过程中出现错误检查以下输出 python setup py build running build running build py creating b
使用Python计算目录的大小？

在我重新发明这个特殊的轮子之前有没有人有一个很好的例程来使用 Python 计算目录的大小如果例程能够很好地以 Mb Gb 等格式格式化大小那就太好了这会遍历所有子目录总结文件大小 import os def get size s
用 python 编写的数学语法检查器

我需要的只是使用 python 检查字符串是否是有效的数学表达式为了简单起见假设我只需要运算符也作为一元带有数字和嵌套括号为了完整性我还添加了简单的变量名称所以我可以这样测试 test 3 2 1 valid test 3
Anaconda 无法导入 ssl 但 Python 可以

Anaconda 3 Jupyter笔记本无法导入ssl 但使用Atom终端导入ssl没有问题我尝试在 Jupyter 笔记本中导入 ssl 但出现以下错误 C ProgramData Anaconda3 lib ssl py in
在系统托盘中隐藏 tkinter 窗口 [重复]

这个问题在这里已经有答案了我正在制作一个程序来提醒我朋友的生日这样我就不会忘记祝福他们为此我制作了两个 tkinter 窗口 1 First one is for entering name and birth date 2 Sec
从 NumPy 数组到 Mat 的 C++ 转换 (OpenCV)

我正在围绕 ArUco 增强现实库基于 OpenCV 编写一个薄包装器我试图构建的界面非常简单 Python 将图像传递给 C 代码 C 代码检测标记并将其位置和其他信息作为字典元组返回给 Python 但是我不知道如何在 Pytho
Django Admin 中的反向内联

我有以下 2 个型号现在我需要将模型 A 内联到模型 B 的页面上模型 py class A models Model name models CharField max length 50 class B models Model n
从 pandas DataFrame 中删除少于 K 个连续 NaN

我正在处理时间序列数据我在从数据帧列中删除小于或等于阈值的连续 NaN 时遇到问题我尝试查看一些链接例如标识连续 NaN 出现的位置以及计数 Pandas NaN 孔的游程长度 https stackoverflow com que
多个对象以某种方式相互干扰[原始版本]

我有一个神经网络 NN 当应用于单个数据集时它可以完美地工作但是如果我想在一组数据上运行神经网络然后创建一个新的神经网络实例以在不同的数据集甚至再次同一组数据上运行那么新实例将产生完全错误的预测例如对 XOR 模式进行训练
查找总和为给定数字的值组合的函数

这个帖子查找提供的 Sum 值的组合 https stackoverflow com a 20194023 1561176呈现函数subsets with sum 它在数组中查找总和等于给定值的值的组合但由于这个帖子已经有6年多了我发这

随机推荐

如何在表单完成期间设置外键（python/django）

在表单处理期间我希望能够在模型对象上设置外键字段而无需用户从下拉列表中选择键例如 models py class AAA models Model some field models TextField class BBB model
where 0=0 这样的条件的确切含义是什么？

我在 Oracle 过程中使用 where 0 0 这样的语句时有点困惑有人可以澄清一下吗即使我们这样做是为了动态选择为什么即使我们在查询中附加了实际条件也要添加这条语句呢这个 where 条件会对结果集产生任何影响吗我经历了如
LINQ 中的 GETDATE()

替代品是什么GETDATE 在 LINQ 中我从以下帖子中得到了一些解决方法如何在 Linq to SQL 表达式中使用 SQL 的 GETDATE 和 DATEADD https stackoverflow com questions
如何在 EasyNetQ 中为每个消费者声明自定义错误交换？

我有四个消费者当错误发生时消息发布到默认的 EasyNetQ Default Error Queue 是否可以让每个队列消费者编写自己的错误交换例如 Queue Name A ErrorExchange A ErrorExchange
未定义 navigator.push React-native 0.43.4

我正在使用react native的Navigator组件但当我想推送到anthor页面时仍然出现错误push undefined is not a function这是我的代码 import React Component from r
Google 地图路径的 SVG 渐变线

我正在解释谷歌地图中的 GPS 位置数据在这里我想创建一条带有渐变的路径该路径以红色开始以橙色结束 this https developers google com maps documentation javascript exam
std::function 可以序列化吗？

这是一个理论问题假设有一些对象其中包含订阅这些对象的事件的回调函数列表现在我们想将这些对象存储在磁盘上是一个std function可序列化 No 每当使用类型擦除即将实现细节隐藏在接口后面时在不知道对象的动态类型的情况下唯
如何将文本放入绘图的方框内

我想将文本放在 matplotlib 图上的框中但是文档 http matplotlib org users recipes html placing text boxes仅给出如何将其放在右上角的示例并且选择不同的角并不完全简单这是
将 json 字符串转换为 Java Map(JSONLib)

如何使用 JSON lib http json lib sourceforge net 将 json 字符串转换为 Java Map 我可以转换为 DynaBean JSONObject jsonObject JSONObject JSON
Scanf 似乎无法在带有 GDB 的 Eclipse CDT 中以调试模式工作

在调试模式下运行此代码时 include
如何在 Django 中使用 DeleteView 显示相关项目？

我正在做一个视图来从模型中删除实例使用 Django 中的通用视图DeleteView 但它会级联并删除其他模型中的实例 url r person P
UITextView 撤消管理器不适用于替换属性字符串（iOS 6）

iOS 6 已更新为使用 UITextView 进行富文本编辑 UITextView 现在获得一个 attributeText 属性该属性是愚蠢的不可变这是在 NDA 下在 iOS 6 Apple 论坛上提出的问题由于 iOS 6 现
Varchar数据有选择地显示结果

我正在开发一个应用程序来监控 IP 地址活动我在 Ubuntu 12 04 上使用 LAMP 堆栈在mysql数据库中我创建了一个包含2列的表 ip和mac 数据类型均为varchar 我将一些数据放入表中当我使用 select f
是否可以手动分解 C++ 符号？

我收到一些这样的错误 dyld lazy symbol binding failed Symbol not found ZN2nm8RationalIxEC1ERKNS 10RubyObjectE Referenced from Users
如何查看模板类型参数推导的类型？

有没有一种简单的方法可以强制编译器向我显示为模板参数推导的类型例如给定 template
如何在 Spring 中使用注释和纯 Java 设置 hibernate.hbm2ddl.auto

如何仅使用 Java 和注释在 Spring 中设置以下内容
让线程等待计时器或信号？

我正在编写一个多线程Python应用程序其中每个线程应该在以下情况下唤醒来自主线程的信号自行启动的 Timer 调用换句话说线程应该根据它们为自己设置的计时器唤醒并且能够在相关事件出现时响应来自管理线程的信号实现双重定时器
为什么 sql server 在 NVarchar 字段中存储问号字符而不是日语字符？

我正在尝试将日语字符存储在 SQL Server 2000 数据库的 nvarchar 字段中当我运行如下更新语句时 update blah set address N where key ID 1 从 SQL Server Manage
我需要将利率转换为小数值

我有以下内容应该返回利息除以 100 的值我如何实现这个 import math p int raw input Please enter deposit amount n r float raw input Please input
有没有正确的方法来子类 Tensorflow 的数据集？

我正在研究可以处理自定义 Tensorflow 数据集的不同方法并且我习惯于查看PyTorch 的数据集 https pytorch org tutorials beginner basics data tutorial html cre

有没有正确的方法来子类 Tensorflow 的数据集？

问题1

问题2

有没有正确的方法来子类 Tensorflow 的数据集？ 的相关文章

随机推荐

热门标签

有没有正确的方法来子类 Tensorflow 的数据集？的相关文章