【开源数据下载全步骤】利用Pytorch下载开源数据到本地,以Speech Command为例

2023-10-29

背景

开源数据来练练手,虽然可以直接通过pytorch或TensorFlow加载使用,但感觉太麻烦了,所以想直接下载到本地使用。上网直接搜数据集没有那种直接下载的链接,最后发现可以直接通过pytorch或是TensorFlow下载。下面以pytorch下载Speech Command数据集为例。

下载方法介绍(可直接看最后的下载代码)

1、找到对应数据的页面

Speech Command数据集

 拖到下面的Dataset Loader,根据需要选择对应的下载路径。本例使用pytorch。

 2、找到对应的代码仓

root (str or Path) – 
Path to the directory where the dataset is found or downloaded.

url (str, optional) – 
The URL to download the dataset from, or the type of the dataset to download. 
Allowed type values are "speech_commands_v0.01" and "speech_commands_v0.02" 
(default: "speech_commands_v0.02")

folder_in_archive (str, optional) – 
The top-level directory of the dataset. 
(default: "SpeechCommands")

download (bool, optional) – 
Whether to download the dataset if it is not found at root path. 
(default: False).

subset (str or None, optional) – 
Select a subset of the dataset [None, “training”, “validation”, “testing”]. 
None means the whole dataset. 
“validation” and “testing” are defined in “validation_list.txt” and “testing_list.txt”, respectively, and “training” is the rest. 
Details for the files “validation_list.txt” and “testing_list.txt” are explained in the README of the dataset and in the introduction of Section 7 of the original paper and its reference 12. 
(Default: None)

根据上面所说的调用,即可下载

下载代码

下载数据
from torchaudio import datasets

datasets.SPEECHCOMMANDS(
    root="./data",                         # 你保存数据的路径
    url = 'speech_commands_v0.02',         # 下载数据版本URL
    folder_in_archive = 'SpeechCommands',  
    download = True                        # 这个记得选True 
)

然后就等下载就行了(要等一段时间,不行就科学上网)

 

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

【开源数据下载全步骤】利用Pytorch下载开源数据到本地,以Speech Command为例 的相关文章

随机推荐

  • ElasticSearch 搜索引擎

    简称es 是类似于mysql但是专注于搜索的一种数据库 在elastic stack中占据重要地位 倒排索引 我们的数据库都是正向索引 比如根据id查询数据 那么倒排索引是将关键字进行分词 然后将词条和id保存在一张表中 不同数据分词后有相
  • retval释疑

    为了让方法返回一个与 方法的物理HRESULT 不相关的逻辑结果 COM IDL支持retval参数属性 retval属性的含义是 相关联的物理方法参数实际上是操作的逻辑结果 在支持retval的环境中 该参数应该被映射为操作的结果 例如
  • MyCAT 通过Native for MySQL 连接TESTDB 提示:1184 (HY000): Invalid DataSource:0

    问题描述 Windows 安装MyCAT服务 启动MyCAT服务 通过Native for MySQL 连接TESTDB 提示如下错误信息 1184 HY000 Invalid DataSource 0 造成问题原因 没有给root用户授予
  • 聚类尝试-kmeans-step2聚类模型训练及结果可视化

    step1 https blog csdn net nikita zj article details 122342746https blog csdn net nikita zj article details 122342746 1 数
  • python基础知识总结

    1 python相关 发布时间比java要早 1999年应用在网站后端开发 2004年发布web框架Django 2 特点 解释性语言 交互式语言 面向对象 跨平台 3 优点 易学 易读 易维护 有广泛标准库 互动模式 可嵌入性 嵌入C或者
  • 如何解决openstack中协程切换后request_id打印不对或者不打印的问题的

    OpenStack各组件一般都对外提供REST服务 当某个API请求过来之后 由于可能会涉及多个方法和进程的处理 为了方便的跟踪这个请求和后续通过日志定位 我们需要有个唯一标示来追踪这个请求 这样就能从大量日志信息中找到和这个请求相关的日志
  • Android开发之蓝牙(一)——基于SPP协议蓝牙模块通信

    使用设备 基本概念 基本流程 本文意在介绍蓝牙开发的主要流程 学习使用蓝牙开发一个星期了 写写一个星期以来遇到的一些小问题 还有介绍下流程 开发具有基本的通信功能 本项目主要是用于与蓝牙模块的串口读写功能 下一篇文章还有Android开发之
  • Java实现记忆化搜索

    记忆化搜索 是在使用递归搜索或者类似的情况下 使用一般的递归或许需要太多的时间与内存 这时我们就可以使用记忆化搜索 其本质为在递归搜索中 如果遇到了没有搜索过的 进行搜索并在内存中记录结果 如果之前搜索过 就直接调用结果 题目描述 对于一个
  • iPhone和ipad连接【华北理工大学】校园网快捷指令教程

    该教程仅适用于华北理工大学校园网 1 下载快捷指令 https www icloud com shortcuts 557cc9bf52b9474baae949773049cca3 用浏览器打开上面的链接 如果在QQ中打开的话 下载完了之后在
  • 自动化测试碰到比较难解决的问题是什么?如果出现这些问题给出你的解决方案?

    问题 自动化测试碰到比较难解决的问题是什么 如果出现这些问题给出你的解决方案 回答 比较难以解决的问题是 1 自动化测试没有达到预期目标 既没有节约人力 也没有提高产品质量 自动化测试脚本会频繁报错 但错误原因多半是脚本问题而不是产品质量问
  • C语言练习题(13)如果 x=2014 ,下面函数的返回值是( )A: 20 B: 21 C: 23 D 25(非常详细的讲解)

    1 如果 x 2014 下面函数的返回值是 int fun unsigned int x int n 0 while x 1 n x x x 1 return n A 20 B 21 C 23 D 25 解析 C 2014对应的二进制为 0
  • mysql索引

    为什么要使用索引 1 可以加快数据的检索速度 大大减少检索的数据量 这也是使用索引的主要原因 2 帮助服务器避免排序和临时表 3 将随机IO变为顺序IO 使用索引要注意的事项 1 在经常需要搜索的列上创建 可以加快搜索速度 2 在经常使用w
  • 什么是CVR,CTR,CPC,CPA,ROI?

    CVR Click Value Rate 转化率 衡量CPA Cost Per Action 广告效果的指标 CTR Click Through Rate 点击率 CPC Cost Per Click 按点击计费 CPA Cost Per
  • Apollo规划模块-规划器迭代版本

    一 三维问题 降维解决 x y维度求解路径规划 在路径规划的基础上进行s t速度规划 二 Apollo 规划器版本迭代 rtk循 1 0 EM Planning 基于DP和QP 1 5 Lattice Planning 路径和速度同时规划的
  • [网络安全提高篇] 一一五.Powershell恶意代码检测 (3)Token关键词自动提取

    网络安全提高班 新的100篇文章即将开启 包括Web渗透 内网渗透 靶场搭建 CVE复现 攻击溯源 实战及CTF总结 它将更加聚焦 更加深入 也是作者的慢慢成长史 换专业确实挺难的 Web渗透也是块硬骨头 但我也试试 看看自己未来四年究竟能
  • ExecutorService 的理解和使用

    前言 我们之前使用线程的时候都是使用new Thread来进行线程的创建 但是这样会有一些问题 如 a 每次new Thread新建对象性能差 b 线程缺乏统一管理 可能无限制新建线程 相互之间竞争 及可能占用过多系统资源导致死机或oom
  • AIX学习笔记

    学习笔记 这是我看191redbook第三遍的时候做的手记 放在这里大家提提意见 Created by workaholic 第一部分 系统启动问题cfgmgr configures devices and optionally insta
  • 在线生成发射爱心!生成网站直接发给你的ta

    一个网站直接帮你生成带名字的发射爱心 还可以直接分享给朋友看 网站放在最下面了 自从上次发了动态爱心的制作代码后 很多群友都来问 如何改名字 如何改文件 手机上如何编辑 这让我思考一个问题 能不能直接做成一个网站 点进去之后输入名字 点一下
  • 一个驱动同时兼容mysql5.7和mysql8.0

    driver class name org mariadb jdbc Driver org mariadb jdbc mariadb java client 2 6 0 url jdbc mysql 127 0 0 1 3306 datab
  • 【开源数据下载全步骤】利用Pytorch下载开源数据到本地,以Speech Command为例

    背景 找开源数据来练练手 虽然可以直接通过pytorch或TensorFlow加载使用 但感觉太麻烦了 所以想直接下载到本地使用 上网直接搜数据集没有那种直接下载的链接 最后发现可以直接通过pytorch或是TensorFlow下载 下面以