音频wav mp3 批量转文本

2023-11-11

作为一个业余的软件开发爱好者,我又捣鼓了一个有意思的小东西 ,使用完全免费哈

使用了目前已有的音频识别的深度学习网络,然后封装成了一个单独的模块,使用的方法就是下载软件,然后打开音频所在的文件夹就行了,会自动扫描wav, mp3 后缀结尾的文件并执行转换。

缺点就是空间占用较大,有1个G,因为把模型都放在了本地。

下载地址:

链接:https://pan.baidu.com/s/1WQQ8kaDilaagjoK5IrYZzA

提取码:1111

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

音频wav mp3 批量转文本 的相关文章

随机推荐

  • 【C++】类和对象&封装

    C 面向对象三大特征 多态 继承 封装 对象与类 对象 C 中认为万事万物都可以看作一个对象 而对象具有两个特征 属性和行为 属性 属性指的是对象具有的性质 例如将书看为一个对象 那么书具有的属性就是内容 目录 出版社 书名 行为 行为就是
  • spring cloud eureka 消费者使用服务名访问,不能访问的问题

    这里说一下我自己犯的一个错误 我有三个项目eureka server provide service consumer service 以下我统称为ABC三个项目 现在的步骤是这样的 先访问C项目的一个接口 接口里面用restTemplat
  • LAMPSECURITY: CTF6 内网拿到root 20211226

    LAMPSECURITY CTF6 参考博客 https blog csdn net weixin 42652002 article details 112132466 spm 1001 2101 3001 6650 2 utm mediu
  • 第14.17节 爬虫实战3: request+BeautifulSoup实现自动获取本机上网公网地址

    一 引言 一般情况下 没有特殊要求的客户 宽带服务提供商提供的上网服务 给客户家庭宽带分配的地址都是一个宽带服务提供商的内部服务地址 真正对外访问时通过NAT进行映射到一个公网地址 如果我们想确认自己的公网地址还不是很容易 但百度提供了一项
  • 使用oracle LogMiner查看日志文件

    LogMiner的使用 作者 tolywang http tolywang itpub net 发表于 2005 01 19 11 03 分类 Oracle数据库管理 出处 http tolywang itpub net post 48 1
  • Kubernetes学习篇之组件

    Kubernetes学习篇之组件 文章目录 Kubernetes学习篇之组件 前言 概述 控制平面组件 Control Plane Components kube apiserver etcd kube scheduler kube con
  • 代码质量度量标准_Codacy:一个新的容易使用的代码质量和审查自动化解决方案...

    Codacy被超过一千家公司使用来进行代码审查和分析 不仅展示代码的质量 而且随着时间推移的进步 不久前 我为公司组织了一次关于 代码质量和为什么开发人员应该关心它 的演讲 在这次演示中 我证明了一些工具的有效性 这些对于年轻开发者和久经沙
  • kubeadm安装k8s

    1 禁用防火墙 systemctl stop firewalld systemctl disable firewalld 2 禁用SELINUX 执行如下命令 vim etc sysconfig selinux 修改文件中的SELINUX为
  • Magento2.x中文语言包及安装使用

    下载 magento2中文语言包 安装 上传到mage2 store app i18n Magento zh Hans CN文件夹 备注 mage2 store vendor magento language zh hans cn 运行脚本
  • c++二分查找—来自编程珠玑

    c 二分查找 来自编程珠玑 二分查找法 Binary search algorithm 是一个很常见的算法 从 编程珠玑 里再次看到时又有新的收获 直接看代码吧 下面是常见的实现代码 int binary search int a int
  • linux vim使用

    读本文之前请注意 1 本文的目标是提供一些vim的使用技巧 利用这些技巧可以提高vim的操作效率 部分技巧在vi上也可以使用 但是现在基本上都是用vim了 2 本文是整理和总结使用技巧 而非讲解vim入门 因此不会涉及最基本的使用 例如如何
  • 笔试

    文章目录 前言 27 时钟抖动jitter 时钟偏移skew 28 EDA开发工具 29 时序约束 30 DMA 31 乒乓buffer 32 BRAM DRAM 33 设计描述方式 34 延迟设计 35 DDR带宽计算 总结 往期精彩 前
  • xml建模包括以下_建模干货,1分钟速学,Photoscan空三结果完美导入CC

    关注公众号 三维前沿 获取更多倾斜摄影 激光点云资讯 相信大家都经历过 有时CC空三总是失败或错误 最崩溃的是 一顿操作猛如虎 定睛一看原地杵 此时 Photoscan空三能力其实可优于CC 头疼的是 又不想放弃用CC来建模 所以今天 为你
  • JAVA题目~由Point类组合成Triangle类 Exp04-1

    问题描述 先定义Point类 再定义Triangle类 在Triangle类中定义三个Point对象来表示一个三角形的三个顶点 然后定义一个方法isTri 对这三个点是否能构成三角形进行判定 构造方法先调用isTri 如果三个点能够构成三角
  • VUE中 created(),mounted()与activated() 方法都是干嘛的?

    created html加载完成之前 执行 执行顺序 父组件 子组件 mounted html加载完成后执行 执行顺序 子组件 父组件 methods 事件方法执行 watch watch是去监听一个值的变化 然后执行相对应的函数 comp
  • Python爬虫-某网酒店评论数据

    前言 本文是该专栏的第6篇 后面会持续分享python爬虫案例干货 记得关注 本文以某网的酒店数据为例 采集对应酒店的评论数据 具体思路和方法跟着笔者直接往下看正文详细内容 附带完整代码 注意 本文的案例 数据集 选用的是本专栏上一篇 Py
  • 教程篇(7.2) 03. 第2层设计 & FortiSwitch ❀ Fortinet网络安全专家 NSE6

    在本课中 你将了解最常见的FortiSwitch拓扑 以及FortiSwitch上可用的不同环路预防协议和方法 在这节课中 你将学习上图显示的主题 通过展示FortiSwitch拓扑的能力 你应该能够确定最适合你的网络设计需求的拓扑 当涉及
  • chisel-book-chinese

    chisel book chinese 蓝奏云地址 https wwu lanzoue com isdim08x8x5i
  • 王爽老师汇编13.3对int iret和栈的深入理解 在屏幕中间显示80个叹号字符

    6666 问题 用7ch中断例程完成loop指令的功能 个人自学思考编写的 不知道和书中的要表达的意思是否相同 先编译运行第一个代码 再编译运行第二个显示代码 下面为写入内存0 200出的中断代码 iret指令为跳转指令 跳转到显示代码处
  • 音频wav mp3 批量转文本

    作为一个业余的软件开发爱好者 我又捣鼓了一个有意思的小东西 使用完全免费哈 使用了目前已有的音频识别的深度学习网络 然后封装成了一个单独的模块 使用的方法就是下载软件 然后打开音频所在的文件夹就行了 会自动扫描wav mp3 后缀结尾的文件