autosub字幕自动识别生成-最新windows配置方法

2023-05-16

给没有字幕的视频或者音频自动生成字幕文件,现阶段没有免费又好用的软件。大致阵营分为两类:

1、收费软件

太多了,网上一搜一堆。特点是好用,准确,功能丰富。果然钞能力就是不一样。

2、免费软件

没有现成的免费软件。一般网上会告诉你上传youtube后可以自动生成字幕,我发现现在这个功能也没了。还有facebook好像也有(国内视频或者社交网站目前都没有自动生成字幕功能,生成中文字幕应该更复杂且收费)

唯一的希望落在了一个开源项目autosub:

BingLingGroup/autosub: Command-line utility to transcribe/translate from video/audio/subtitles to subtitles (github.com)https://github.com/BingLingGroup/autosub

项目的开源者显然花费了巨大的精力来写代码,然而用户安装也需要一定的技术基础并花费大量的精力。终于理解为什么自动生成字幕的软件都收费了,因为很少有程序员愿意花这么多精力写一个好用的软件却不拿一分钱,而且也很难有不怕麻烦也有点技术基础的人(比如我)愿意折腾这么长时间去用一个开源的免费软件。总之,就是天下没有免费的午餐(还是感谢autosub的开源者)

进入正题,安装方法:

我是用源码安装在windows上面。参考官方说明

BingLingGroup/autosub: Command-line utility to transcribe/translate from video/audio/subtitles to subtitles (github.com)https://github.com/BingLingGroup/autosub#install-on-windows

不推荐用release page封装好的环境直接安装(因为旧版googletrans接口失效)。而且更推荐在ubuntu下面直接pip安装。

windows下源码安装具体步骤如下:

1)预先安装python3,安装python时顺带安装pip并配置好环境变量

2)安装git

3)下载安装dev分支的代码

pip install git+https://github.com/BingLingGroup/autosub.git@dev ffmpeg-normalize

现在打开cmd命令行,输入autos ub就应该显示说明文档了,说明安装autosub成功。

4)安装4.0.0版本的googletrans

为了避免可能出现的报错,可能还需要安装4.0.0版本的googletrans(这也是不用封装好的软件的原因,只有这样下载源码才能用到pip更新googletrans)

pip install googletrans==4.0.0rc1

5)安装ffmpeg

这其实很简单,官网下载安装并添加环境变量就可以了。参考:

Windows下安装使用ffmpeg - 知乎 (zhihu.com)https://zhuanlan.zhihu.com/p/118362010打开命令提示符窗口。输入命令“ffmpeg –version”。如果命令提示窗口返回FFmpeg的版本信息,那么就说明安装成功了。

使用方法

autosub的帮助说明:

autosub -h

示例1

autosub -SRC en -S en-US -surl translate.google.com -slp 0.1 -i "E:\a.m4a" 

其中-SRC -surl -slp都是新加入的,是为了解决一个JSON object must be str, bytes or bytearray, not 'NoneType'的报错

-SRC后是机器模型识别的语言,-S是识别语言,-D是翻译输出语言,这里不需要翻译,直接输出英语字幕,因此省略-D。-i后面"E:\a.m4a"是待识别的文件路径(音频或者视频或者字幕)

示例2

autosub -SRC en -S en-US -D zh-cn -surl translate.google.com -slp 0.1 -i "E:\a.m4a" 

同上,字幕输出是英语翻译后的汉语简体

示例3

autosub -SRC en -S en-US -D zh-cn -of bilingual -surl translate.google.com -slp 0.1 -i "E:\audio.m4a"

同上,输出双语字幕。其实用记事本打开输出的srt字幕文件,你就会发现它是英语字幕文件后面接了汉语字幕文件内容。

生成过程展示:

 生成过程有点慢,跟文件大小和网速有关(好像要求能连谷歌,fan-qiang请设置全局模式)。

输出srt格式的字幕文件在原文件目录下。

这个识别中文效果怎么样我还不知道。

 下一个问题:如何将srt字幕文件和视频合并到一起?这个好像也没有很好用的免费软件?

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

autosub字幕自动识别生成-最新windows配置方法 的相关文章

  • 关于准确率accuracy和召回率recall的理解

    假设有100个样本 xff0c 其中正样本70 xff0c 负样本30 xff0c 这个是由数据集本身决定的 xff0c 机器要做的就是判别这100个样本中哪几个样本是正样本 xff0c 哪几个样本是负样本 现在机器做出了预测 xff1a
  • pytorch BERT文本分类保姆级教学

    pytorch BERT文本分类保姆级教学 本文主要依赖的工具为huggingface的transformers xff0c 更详细的解释可以查阅文档 定义模型 模型定义主要是tokenizer config和model的定义 xff0c
  • class balanced loss pytorch 实现

    cb loss pytorch 实现 xff0c 可直接调用 参考 xff1a https github com vandit15 Class balanced loss pytorch blob master class balanced
  • 解决不平衡数据集问题

    解决不平衡数据集问题 数据不平衡通常反映数据集中类的不均匀分布 例如 xff0c 在信用卡欺诈检测数据集中 xff0c 大多数信用卡交易都不是欺诈 xff0c 只有很少的类是欺诈交易 这使得我们在欺诈类和非欺诈类之间的比例约为50 1 迄今
  • matlab报错解决---当前文件夹或MATLAB路径中未发现xxxx.m,但它位于xx\xxx\xxx\路径下

    解决 xff1a 选定为找到的文件 xff0c 右键 xff0c 找到 选择文件夹和子文件夹 选项 xff0c 添加到路径即可 xff0c 之后文件会变亮色 xff0c 不是灰色 修改之后 xff0c 发现没有 添加路径 的选项了 最后解决
  • sdf模型插入gazebo_ros_control插件

    gazebo ros control目前只支持老版的urdf模型 xff0c 官方教程 xff1a http gazebosim org tutorials tut 61 ros control sdf模型怎么办呢 xff1f 回答 xff
  • PreparedStatement 在mysql下中文乱码解决方案

    在顶目中无意中碰到PreparedStatement 在存DB时出现乱码 xff0c 困扰了好久终于解决问题 问题代码如下 pstmt 61 con prepareStatement INSERT OFFLINE pstmt setStri
  • 2013年终总结

    2013年即将过去 xff0c 回顾这一年 xff0c 有得有失 xff0c 有喜有悲 xff0c 些许记忆碎片留在脑海中 简单做个总结 xff0c 也算划上一个完美的句号 xff0c 再迎接充满挑战的2014 xff01 项目 一年过来
  • 程序员的生活,其实苦不堪言

    前一天 A 下班前把这个代码发给我 B 好的 xff01 第二天 A 都他妈中午了 xff0c 代码怎么还没发过来 xff1f B 我他妈还没下班呢 xff01 程序猿的真实写照 曾经刚参加工作 xff0c 接手一个项目的维护 xff0c
  • 不容错过的用户标签全面解读。建议收藏!

    过去几年来 xff0c 随着我国整体人口红利优势不再 xff0c 市场竞争加剧 xff0c 获客成本不断飙升 xff0c 互联网也告别增长进入存量时代 xff0c 品牌方的营销目标也从最大化追求用户数量规模转变为追求用户质量的精细化营销上
  • 【书写makefile】相关符号介绍

    本文将介绍一下几种符号 xff1a 61 43 61 61 61 makefile中 xff0c 的意思是取变量的意思 xff0c 比如 xff0c a 61 4 那么在后面的语句中 xff0c a 就代表的是取a的值 如果给a定义的是个宏
  • python人工智能技术

    人工智能 xff08 AI xff09 已成为当今世界的热门话题 xff0c 它的应用范围越来越广泛 其中 xff0c Python成为AI开发中最受欢迎的编程语言之一 Python提供了许多功能强大的库和框架 xff0c 大大简化了开发人
  • 利用X-CTU软件给P900数传配置参数

    转自 xff1a 70条消息 P900数传参数配置 落体偏东 CSDN博客 ATS104设置网络号 xff08 设置主从之间通讯连接的密码 xff09 ATS105设置单元号 xff08 给自己使用的数传进行编号 xff0c 防止主从混乱
  • px4添加自己编写的代码并编译

    1 在px4项目下的src文件夹下的modules文件夹中创建一个文件夹 xff0c 如图我创建了一个position control文件夹 xff0c 在该文件夹中添加自己写的代码程序 xff0c 同时添加一个CmakeLists txt
  • 思岚A1M8激光雷达-ubuntu18.04-slam建图参考

    Rplidar A1 A2使用及Hector SLAM建图 NouriXiiX的博客 CSDN博客 激光雷达初体验 Ubuntu 18 04 43 思岚科技 RPLIDAR A1M8 43 ROS 上手使用 银时大魔王的博客 CSDN博客
  • intel Realsense D/T系列 kalibr标定

    kalibr官方源码GitHub ethz asl kalibr The Kalibr visual inertial calibration toolbox 鼠标下拉找到install follow the install wiki pa
  • gazebo仿真遇到的FCU问题

    当使用roslaunch xxx launch命令进行gazebo仿真时出现 FCU Preflight Fail Accel 0 uncalibrated或者FCU Preflight Fail Baro Sensor 0 missing
  • 大广角USB摄像头选用指南

    起因是我要做一个二维码引导无人机降落的实验 四旋翼无人机搭载单目下视摄像头 xff0c 用于识别地面的二维码 我选择摄像头的标准基本上只有一个 xff1a 视场角越大越好 为此查阅了一些资料 xff0c 买了很多镜头和底板 xff0c 有了
  • 一:XTDrone平台上将视觉SLAM2与gazebo仿真集合

    1 XTDrone仿真平台配置 参考官方教程 xff0c 基本没大问题 仿真平台基础配置 语雀 依赖安装sudo apt install y n https www yuque com xtdrone manual cn basic con
  • 线程和进程的区别

    不少刚看到这两个词 xff08 特别是不是计算机专业的 xff09 小伙伴可能会比较疑惑 xff0c 线程和进程有什么区别 xff0c 网上有许多专业性的解答 xff0c 但是既然不少小伙伴不是计算机专业的 xff0c 那就结合例子做个大概

随机推荐