使用 tfds.load() 无法访问 CelebA 数据集

2024-02-08

我正在尝试在深度学习项目中使用 CelebA 数据集。我有来自 Kaggle 的压缩文件夹。我想解压缩，然后将图像拆分为训练、测试和验证，但后来发现这在我的设备上是不可能的不那么强大 system.

因此，为了避免浪费时间，我想使用 TensorFlow-datasets 方法来加载 CelebA 数据集。但不幸的是，数据集无法访问，并出现以下错误：

（代码先）

ds = tfds.load('celeb_a', split='train', download=True)

---------------------------------------------------------------------------
KeyError                                  Traceback (most recent call last)
<ipython-input-69-d7b9371eb674> in <module>
----> 1 ds = tfds.load('celeb_a', split='train', download=True)

c:\users\aman\appdata\local\programs\python\python38\lib\site-packages\tensorflow_datasets\core\load.py in load(name, split, data_dir, batch_size, shuffle_files, download, as_supervised, decoders, read_config, with_info, builder_kwargs, download_and_prepare_kwargs, as_dataset_kwargs, try_gcs)
    344   if download:
    345     download_and_prepare_kwargs = download_and_prepare_kwargs or {}
--> 346     dbuilder.download_and_prepare(**download_and_prepare_kwargs)
    347 
    348   if as_dataset_kwargs is None:

c:\users\aman\appdata\local\programs\python\python38\lib\site-packages\tensorflow_datasets\core\dataset_builder.py in download_and_prepare(self, download_dir, download_config)
    383           self.info.read_from_directory(self._data_dir)
    384         else:
--> 385           self._download_and_prepare(
    386               dl_manager=dl_manager,
    387               download_config=download_config)

c:\users\aman\appdata\local\programs\python\python38\lib\site-packages\tensorflow_datasets\core\dataset_builder.py in _download_and_prepare(self, dl_manager, download_config)
   1020   def _download_and_prepare(self, dl_manager, download_config):
   1021     # Extract max_examples_per_split and forward it to _prepare_split
-> 1022     super(GeneratorBasedBuilder, self)._download_and_prepare(
   1023         dl_manager=dl_manager,
   1024         max_examples_per_split=download_config.max_examples_per_split,

c:\users\aman\appdata\local\programs\python\python38\lib\site-packages\tensorflow_datasets\core\dataset_builder.py in _download_and_prepare(self, dl_manager, **prepare_split_kwargs)
    959     split_generators_kwargs = self._make_split_generators_kwargs(
    960         prepare_split_kwargs)
--> 961     for split_generator in self._split_generators(
    962         dl_manager, **split_generators_kwargs):
    963       if str(split_generator.split_info.name).lower() == "all":

c:\users\aman\appdata\local\programs\python\python38\lib\site-packages\tensorflow_datasets\image\celeba.py in _split_generators(self, dl_manager)
    137     all_images = {
    138         os.path.split(k)[-1]: img for k, img in
--> 139         dl_manager.iter_archive(downloaded_dirs["img_align_celeba"])
    140     }
    141 

c:\users\aman\appdata\local\programs\python\python38\lib\site-packages\tensorflow_datasets\core\download\download_manager.py in iter_archive(self, resource)
    559     if isinstance(resource, six.string_types):
    560       resource = resource_lib.Resource(path=resource)
--> 561     return extractor.iter_archive(resource.path, resource.extract_method)
    562 
    563   def extract(self, path_or_paths):

c:\users\aman\appdata\local\programs\python\python38\lib\site-packages\tensorflow_datasets\core\download\extractor.py in iter_archive(path, method)
    221     An iterator of `(path_in_archive, f_obj)`
    222   """
--> 223   return _EXTRACT_METHODS[method](path)

KeyError: <ExtractMethod.NO_EXTRACT: 1>

有人可以解释我做错了什么吗？

顺便说一句，如果这不起作用，有没有办法将已经从 Kaggle 下载的压缩文件转换为所需的格式，而无需解压缩，然后单独迭代每个图像？基本上我不能往下走解压缩然后分割如此大的数据集的路线...

TIA!

EDIT: I tried the same on Colab, but getting a similar error:

从 GDrive 下载似乎有某种配额限制。转到错误中显示的 google 驱动器链接，然后将其复制到您的驱动器。您也可以通过以下库下载副本gdown, google_drive_downloader.

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python3x

image

deeplearning

tensorflow20

tensorflowdatasets

使用 tfds.load() 无法访问 CelebA 数据集的相关文章

Tensorflow 可变图像输入大小（自动编码器、放大......）

Edit WARNING不建议使用不同图像大小的图像因为张量需要具有相同的大小才能实现并行化我一直在寻找解决方案了解如何使用不同大小的图像作为神经网络的输入 Numpy 第一个想法是使用numpy 然而由于每个图像的大小不同我无法
用 tf.data 替换基于队列的输入管道

我正在阅读 Ganegedara 的 NLP with Tensorflow 输入pipieline的介绍有以下例子 import tensorflow as tf import numpy as np import os Defining
带图像的简单 GUI [关闭]

很难说出这里问的是什么这个问题是含糊的模糊的不完整的过于宽泛的或修辞性的无法以目前的形式得到合理的回答如需帮助澄清此问题以便重新打开访问帮助中心 help reopen questions 我试图在简单的 GUI 上显示一些卡
为什么 python 对于共享锁抛出“multiprocessing.managers.RemoteError”？

我正在使用 python 3 6 7 和 Ubuntu 18 04 运行以下脚本后每个进程都有自己的共享锁 from multiprocessing import Process Manager def foo l1 with l1 pr
无法截取宽度为 0 的屏幕截图

我正在尝试截取 Bootstrap 模态内元素的屏幕截图经过一番努力我终于想出了这段代码 driver get https enlinea sunedu gob pe driver find element by xpath div c
Tensorflow 2.0 中的二阶导数

我正在尝试计算标量变量的简单向量函数的二阶导数f x x x 2 x 3 使用 TF 2 3 与tf GradientTape def f ab x return x x 2 x 3 import tensorflow as tf in1
为什么实现 __iter__ 的对象不被识别为可迭代的？

假设您使用包装对象 class IterOrNotIter def init self self f open tmp toto txt def getattr self item try return self getattribute
python多重继承，调用基类函数

我只是尝试在 python 中进行多重继承我想出了这个 class ParentOne def foo self print ParentOne foo is called class ParentTwo def foo self pri
如何使用 Box API 和 Python 下载文件

目前我的代码的上传部分正在运行我该如何将其转换为从 box 文件夹下载相应文件的程序这是上传程序 import requests import json the user acces token access token UfUNeH
在 Django 中定义视图和 url。为什么调用函数时不使用括号？

我已经在经历 Python速成课程目前正在进行 Django Web应用程序项目学习日志阶段有些东西与我已经学到的相矛盾 views py file from django shortcuts import render def i
是否有一个类可以获取应用程序中的默认图片查看器？

我不想访问 iPhone 上的图像我想显示我的应用程序中的图像但就像您查看 iPhone 相册中的图片一样使用所有捏合和缩放控件等这可能吗我认为可能偶然有像 AVMediaPlayer 类这样的类可以做到这一点谢谢汤姆如
在什么情况下，使用 HTTP/2 单独加载图像会比使用 HTTP/1.1 中的精灵一次加载所有图像慢？

HTTP 2 使多路复用连接成为可能从而消除了与服务器的多个连接的需要通过单个连接可以将许多单独的图像发送到客户端这避免了将多个图像组合成一个并使用 CSS 将其分开的旧图像精灵模式我很好奇精灵在 HTTP 2 世界中是否仍然会更
大收件箱上的 imaplib.select：命令参数太多

我正在尝试从 python 脚本访问 Gmail 中的电子邮件我使用的代码如下 import imaplib m imaplib IMAP4 SSL imap gmail com m login username password m s
如何在日志中查看MySqlHook结果

我在用MySqlHook建立连接气流数据库并且我正在执行一些查询但我需要在某处查看查询的结果比如说日志我怎样才能看到这是示例代码 t1 MySqlOperator task id basic mysql mysql conn id
不同时间视频截图

我在一条线上有 3 个画布我想在每个画布中放置一个图像视频的屏幕截图在不同的时间问题是所有 3 个屏幕截图都是在同一时间最后指定的时间下面是我的 JavaScript 代码 function getVideoScreenShot
如何以干净高效的方式在 pytorch 中获得小批量？

我试图做一件简单的事情即使用火炬通过随机梯度下降 SGD 训练线性模型 import numpy as np import torch from torch autograd import Variable import pdb def
Instagram 图表 api 日期之间的媒体帖子

我正在尝试使用以下方法从我管理的 Instagram Business 个人资料中检索上个月的媒体帖子 since and until 但它似乎无法正常工作因为 API 返回的帖子超出了我选择的时间范围我使用以下字符串来调用 API b
在java中将jpeg/png转换为像素数组

如何将包含 jpeg 或 png 的字符串转换为像素数组最好是一维理想情况下使用java内置的类原来你需要公共文件上传 http commons apache org fileupload 看着那这用户指南 http commons
如何在 apache poi 中找到包含图片的单元格

我尝试在 xls 文档中循环图像我写下一个代码 HSSFPatriarch patriarch sheet getDrawingPatriarch if patriarch null Loop through the objects fo
检测图像是否损坏或损坏

我需要以编程方式检查用户在我的应用程序上选择作为壁纸的图像是否已损坏或损坏基本上我为用户提供了选择自己的图像作为壁纸的选项现在当图像加载时我只想检查它是否已损坏如果您正在寻找 PHP 解决方案而不是 javascript 解决方案

随机推荐

jQuery - 选择输入字段的关联标签元素[重复]

这个问题在这里已经有答案了我有一组输入字段其中一些具有关联的标签有些没有
如何减小 SSRS PDF 导出大小

我有一份导出为 PDF 的 SSRS 报告该报告有一张表其中有 2 行没有格式的标题和一条记录创建的 PDF 导出大小为 130K 我确信这比它需要的要大得多有什么方法可以减小 SSRS 创建的 PDF 的大小吗或者我应该注意任
如何在 iPhone/Objective C 上找出 RSA 公钥的模数和指数

有没有可能的方法来找出使用 SecKeyGeneratePair 一般的安全框架创建的公钥的模数和指数我对此很困惑但这是我找到的解决方案不使用任何外部包首先转到 Apple 的 CryptoExercise 示例从那里下载 S
如何将聚类标签与 Matlab 中的“真实值”标签相匹配

我在这里搜索并用谷歌搜索但没有结果在 Weka 中进行聚类时有一个方便的选项即类到聚类它与算法生成的聚类相匹配例如简单的 k means 到您作为类属性提供的基本事实类标签这样我们就可以看到聚类准确率错误百分比现在我
仅使用 Java SE API 的 Java 简单 HTTP 服务器

有没有一种方法可以仅使用 Java SE API 在 Java 中创建一个非常基本的 HTTP 服务器仅支持 GET POST 而无需编写代码来手动解析 HTTP 请求并手动格式化 HTTP 响应 Java SE API 很好地封装了 H
使用 Appium 和 Python 在 Android Native 应用程序的 webview 页面上找不到元素

我无法在本机应用程序中找到 android webkit WebView 中的元素我能够通过将 setWebContentsDebuggingEnabled 设置为 TRUE 来检索用户名和密码字段属性然后在 DevTools chro
无法从数据框中删除空白，因此无法找到平均值

我需要找到这个值的平均值其中类新临时是字符数据是原始10 6 C这样的我删除了 C 但由于 as numeric 不起作用因此存在空间 newtemp 1 10 6 10 6 11 0 10 6 10 6 10 6 10 6
使用pipenv安装时如何忽略特定包的依赖关系？

是否可以使用 pipelinenv 安装 python 包而不安装依赖项我正在寻找类似物pip install package name no dependencies为了Pipfile 我已经尝试用标记指定但它引发了异常 packag
我可以强制 Visual Studio 使用 mingw 编译器吗

我不喜欢 qt Creator 作为 IDE 喜欢 VS 但我必须完全使用 mingw 编译器悲剧只需设置一个 makefile 项目这样您就可以告诉 VC 运行什么命令来编译您的文件除了 Visual Studio 项目之外您还
Git filter-branch 给了我两组提交

我需要从我的提交历史记录中删除一个文件我跟着Github 删除敏感数据的说明 https help github com articles remove sensitive data git filter branch force ind
win32 导出为固定格式

我试图更改 Excel 文件的页脚然后使用 Python3 6 中的 win32 包将其转换为 pdf 它实际上适用于我的家用电脑和工作电脑只有 pdf 导出部分给了我错误我想知道 MS Office 版本是否重要因为我家里使用的是
d3.js 节点在强制布局中快速拖动时“跳回”

我正在使用具有零重力和电荷值的力布局 var force d3 layout force gravity 0 charge 0 friction 0 9 linkDistance 250 linkStrength 1 size width
MySql查询缓存中的“query_cache_wlock_invalidate”有什么用？

在添加MySql Query Cache的概念时我们有一个名为 query cache wlock invalidate 的参数我想知道这个参数有什么用 Thanks 当您在查询缓存中进行查询时通常会返回缓存的内容即使该查询使用另一
无法提交 Hibernate 事务；嵌套异常是 org.hibernate.Transaction 异常：JDBC 提交失败

我在应用程序中使用 Windows Azure SQL Server 当我连接到应用程序时它显示以下错误 org springframework transaction TransactionSystemException Could n
UIImageView内容模式

蓝线是图像视图的边界 UIImageView s contentMode is UIViewContentModeScaleAspectFit 我想保持原始图片的比例怎样才能让图片的左边缘在UIImageView的左边缘但不喜欢UIVi
Android 上的 PhoneGap 不会加载外部脚本

我正在制作一个简单的应用程序来加载谷歌地图但问题是每次我加载这个它无法在我的 Android 模拟器上运行而在桌面上则可以正常运行如何让 Phonegap 或 Android 允许外部脚本工作加载更新我总是收到此错误应用程序
我无法在 Android 真实手机上获取位置

public class LocationService extends Service private Handler mHandler new Handler private Timer mTimer null private int
有 typeid 可供参考吗？

我正在寻找一种获取类型名称的方法类似于typeid但仅供参考根据这一页 http en cppreference com w cpp language typeid typeid删除引用如果 type 是引用类型则结果引用引用的类型
在 C# 中生成运行哈希（或校验和）？

Preface 我正在执行具有验证提交阶段的数据导入这个想法是第一阶段允许从各种来源获取数据然后在数据库上运行各种插入更新验证操作提交被回滚但会生成验证哈希校验和提交阶段是相同的但是如果验证哈希校验和相同则将
使用 tfds.load() 无法访问 CelebA 数据集

我正在尝试在深度学习项目中使用 CelebA 数据集我有来自 Kaggle 的压缩文件夹我想解压缩然后将图像拆分为训练测试和验证但后来发现这在我的设备上是不可能的不那么强大 system 因此为了避免浪费时间我想使用 Tens

使用 tfds.load() 无法访问 CelebA 数据集

使用 tfds.load() 无法访问 CelebA 数据集 的相关文章

随机推荐

热门标签

使用 tfds.load() 无法访问 CelebA 数据集的相关文章