Python从视频文件中提取wav

2024-01-10

如何使用python从视频文件中提取音频？ https://stackoverflow.com/questions/19216450/how-to-extract-audio-from-a-video-file-using-python

从视频中提取音频为 wav https://stackoverflow.com/questions/2117488/extract-audio-from-video-as-wav

如何从视频中提取音频？ https://stackoverflow.com/questions/5506651/how-to-rip-the-audio-from-a-video

我的问题是如何从视频文件中提取 wav 音轨，例如video.avi？我读了很多文章以及人们建议使用的地方（来自Python）ffmpeg作为子进程（因为没有可靠的 python 绑定到 ffmpeg - 唯一的希望是PyFFmpeg但我发现它现在无人维护了）。我不知道这是否是正确的解决方案，我正在寻找好的解决方案。
我查看了 gstreamer，发现它很好，但无法满足我的需求——我发现从命令行完成此任务的唯一方法如下

 gst-launch-0.10 playbin2 uri=file://`pwd`/ex.mp4  audio-sink='identity single-segment=true ! audioconvert ! audio/x-raw-int, endianness=(int)1234, signed=(boolean)true, width=(int)16, depth=(int)16, rate=(int)16000, channels=(int)1 ! wavenc !  filesink location=foo.wav’

但它效率不高，因为我在播放视频和同时写入 wav 文件时需要等待很长时间。

ffmpeg好多了：

avconv  -i foo.mp4  -ab 160k -ac 1 -ar 16000 -vn ffaudio.wav

但我无法从 python 启动它（不是作为命令行子进程）。您能否指出从 python 作为命令行实用程序启动 ffmpeg 的优点和缺点？（我的意思是使用 pythonmultiprocessing模块或类似的东西）。

第二个问题。

有什么简单的方法可以将长 wav 文件切成碎片，这样我就不会打断任何单词？我的意思是 10-20 秒长度的片段，在句子/单词的暂停期间开始和结束？

我知道如何将它们任意分解：

import wave


win= wave.open('ffaudio.wav', 'rb')
wout= wave.open('ffsegment.wav', 'wb')

t0, t1= 2418, 2421 # cut audio between 2413, 2422 seconds
s0, s1= int(t0*win.getframerate()), int(t1*win.getframerate())
win.readframes(s0) # discard
frames= win.readframes(s1-s0)

wout.setparams(win.getparams())
wout.writeframes(frames)

win.close()
wout.close()

这是一个非常简单的任务，使用ffmpeg with pythonsubprocess，人们认为这个解决方案是一个好的解决方案是有原因的。

这是从给定视频文件中提取音频的基本命令：

ffmpeg -i test.mp4 -ab 160k -ac 2 -ar 44100 -vn 音频.wav

Python 代码只是包装了这个命令：

import subprocess

command = "ffmpeg -i C:/test.mp4 -ab 160k -ac 2 -ar 44100 -vn audio.wav"

subprocess.call(command, shell=True)

您必须确保 ffmpeg 是已知任务，因此在系统环境变量中的路径下，应列出 ffmpeg.exe 的路径，或者您可以在 python 代码中使用 exe 的完整路径。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Python从视频文件中提取wav 的相关文章

Django 营业时间

我想添加诊所的营业时间我已经对此进行了调查在 Django 中实现开放时间的任何现有解决方案 https stackoverflow com questions 8128143 any existing solution to imp
如何在Python中反转列表的列表？ [复制]

这个问题在这里已经有答案了我想知道如何反转 python 中的列表列表例如原来的 list 1 2 3 4 5 6 7 8 9 输出 new list 7 8 9 4 5 6 1 2 3 现在我正在尝试这样做 new list re
运行时高压缩的 AS3 视频编码（H.264？）

我需要在运行时将 AS3 中的视频图像数据比如说显示对象压缩为高压缩的字节数组帧速率只需在 5 左右但 1024x768 视频需要达到使用 JPG 或 PNG 编码器可提供更高的 KB s 有没有开源方法可以在运行时对 as3 中
Python：由于 OSError 无法安装软件包：[Errno 2] 没有这样的文件或目录

我尝试使用pip安装sklearn 并且我收到以下错误消息错误由于 OSError 无法安装软件包 Errno 2 没有这样的文件或目录 C Users 13434 AppData Local Packages PythonSoftwa
导入 SciPy 或 scikit-image，“from scipy.linalg import _fblas：导入错误：DLL 失败”

我正在导入 from scipy import misc io 但我收到这些错误 Traceback most recent call last File C work asaaki code generateProposals py li
如何搜索一列并用找到的内容填充另一列？

我有一个带有虚构人物数据的大熊猫数据框下面是一个小例子每个人都由一个数字定义 import pandas as pd import numpy as np df pd DataFrame Number 5569 3385 9832 64
如何检查给定的数字是否是2的幂？

下面的代码不适用于某些输入 a i set 1 while i lt 10000 a add i i lt lt 1 N int input if N in a print True else print False 我最初的想法是检查每个
如何用pygame画一条虚线？

我需要在坐标系上绘制正弦波和余弦波就像在this https i stack imgur com DGI8g png图片除了没能代表以外我所有的工作都做得很好虚线和曲线与 pygame 一致我有与我需要的类似的东西但我怎样才能让它
清理 MongoDB 的输入

我正在为 MongoDB 数据库程序编写 REST 接口并尝试实现搜索功能我想公开整个 MongoDB 接口我确实有两个问题但它们是相关的所以我将它们放在一篇文章中使用 Python json 模块解码不受信任的 JSON 是否
pandas DataFrame 中行的高效成对比较

我目前正在处理一个较小的数据集大约 900 万行不幸的是大多数条目都是字符串即使强制类别框架在内存中也只有几 GB 我想做的是将每一行与其他行进行比较并对内容进行直接比较例如给定 A B C D 0 cat blue old
python 硒按名称查找元素

查找电子邮件输入的正确代码是什么https accounts google com ServiceLogin html 是
python os.fork 使用相同的 python 解释器吗？

据我所知 Python 中的线程使用相同的 Python 解释器实例我的问题是与创建的流程相同os fork 或者每个进程创建的os fork有自己的翻译吗每当你 fork 时整个 Python 进程都会在内存中复制包括Python
如何在 tkinter 后台运行函数[重复]

这个问题在这里已经有答案了我是 GUI 编程新手我想用 tkinter 编写一个 Python 程序我想要它做的就是在后台运行一个可以通过 GUI 影响的简单函数该函数从 0 计数到无穷大直到按下按钮为止至少这是我想要它做的但
iPhone 上的全屏视频播放器是否有“onClose”事件？

我在网站上使用 html5 视频播放器当用户开始播放时播放器进入全屏模式并播放视频视频结束后我看到ended事件并通过关闭视频播放器myvideo webkitExitFullScreen 现在当玩家实际获得时我需要另一个事件cl
在添加数据之前使用 Python gdata 清除工作表中的行

我有一个 Google 电子表格我使用 python 脚本和 gdata 库填充值如果我多次运行脚本它会将新行附加到工作表中我希望脚本在填充之前首先清除行中的所有数据这样每次运行时我都会有一组新的数据脚本我尝试过使用 Updat
数据类和属性装饰器

我一直在阅读 Python 3 7 的数据类作为命名元组的替代品我通常在必须将数据分组到结构中时使用它我想知道数据类是否与属性装饰器兼容以便为数据类的数据元素定义 getter 和 setter 函数如果是这样是否在某处进行了描
混合语言源目录布局

我们正在运行一个使用多种不同语言的大型项目 Java Python PHP SQL 和 Perl 到目前为止人们一直在自己的私有存储库中工作但现在我们希望将整个项目合并到一个存储库中现在的问题是目录结构应该是什么样的我们应该为每种
从 HDF5 文件中删除信息

我意识到 SO 用户以前曾问过这个问题question https stackoverflow com questions 1124994 removing data from a hdf5 file rq 1但它是在 2009 年被问到的
Python 子进程：无法转义引号

我知道以前曾问过类似的问题但它们似乎都是通过重新设计参数的传递方式即使用列表等来解决的但是我这里有一个问题因为我没有这个选项有一个特定的命令行程序我使用的是 Bash shell 我必须向其传递带引号的字符串它不能不被引用
处理错误“TypeError: Expected tuple, got str”将 CSV 加载到 pandas 多级和多索引 (pandas)

我正在尝试加载 CSV 文件这个文件 https drive google com file d 13a eVeSzy6HkhffQw32S57U hm5YCj0 view usp sharing 创建一个多索引多级数据帧它有5 五指

随机推荐

如何防止角材料垫菜单关闭？

我正在角度材料中创建一个日期时间选择器控件并使用以下代码来执行此操作
如何自定义FBLoginVIew？

为了在我的 ios 应用程序中连接到 facebook 我正在使用 FBLoginVIew适用于 iOS 的 Facebook SDK http developers facebook com docs sdk reference ioss
在ggplot2facet_grid中旋转切换的facet标签

我想使用facet grid 在彼此之上绘制一些条形图 library ggplot2 df lt group by mpg manufacturer gt summarise cty mean cty hwy mean hwy gt un
我希望 shell 脚本可执行但不可读

我创建了一个脚本我希望其他用户使用我们的共享系统 to 执行但不读取我将权限设置为所有可执行文件但撤销了读写权限 x x x 1 dilletante staff 0 2013 04 02 11 42 expect sh 然而脚本无
使用 lambda 表达式参数调用泛型方法的反射

我正在寻找一种使用 lambda 表达式调用通用方法的方法该表达式在项目数组中调用 Contains 在本例中我使用实体框架Where方法但该场景可以应用于其他IEnumerables 我需要通过 Reflection 调用上面代码的
如何检查 SQL Server 当前池大小

有没有办法检查 SQL Server 中当前连接池的大小我不是在谈论最大连接池大小而是当前池大小假设最大池大小为 100 并且有 49 个打开的连接它现在应该显示 51 个可用连接或 49 个已消耗连接那么有这样的查询吗其中很
Golang写入套接字而不用担心数据不完整

我们都知道 Write 方法不能保证从缓冲区中写入高字节因此使用原始 Write 方法将字节写入套接字的规范方法如下所示 how many bytes we have written written 0 for written lt l
无法让 QWindow::fromWinId 正常工作

我的 Qt 5 9 程序在 X11 Linux 上使用以下命令启动其他应用程序QProcess 我想控制这些应用程序生成的窗口所以我获得了它们winId价值和用途QWindow fromWinId得到一个QWindow实例问题是这些
Laravel $request->expectsJson()

我正在为我的 Laravel 应用程序进行 Ajax 登录我正在使用角度 http method POST url admin login headers Content Type application json data email
如何读取图像上的文字？

我需要将一些扫描文档解析为文本数据是否可以使用某些软件解析图像上写的文本如果是请推荐任何此类在线实用程序或软件也许一些 OCR 软件会有帮助 http en wikipedia org wiki Optical character
忽略“证书未知”警报

我有以下简单的 Python 脚本 import socket import ssl if name main s socket socket socket AF INET socket SOCK STREAM s bind 443 s l
销毁 Bootstrap 弹出窗口时出现 Javascript 错误

尝试随时更改引导程序弹出窗口的标题和内容我遇到了一些麻烦我在销毁选择器中的弹出窗口内容时遇到此问题错误是这样的 TypeError undefined is not a function evaluating data option
T-SQL删除插入的记录

我知道标题可能看起来很奇怪但这就是我想做的我有很多记录的表我想获取其中一些记录并将它们插入到其他表中像这样的东西 INSERT INTO TableNew SELECT FROM TableOld WHERE 棘手的部分是我希望我插
Jquery UI 工具提示不支持 html 内容

今天我将所有 jQuery 插件升级为 jQuery 1 9 1 我开始将 jQueryUI 工具提示与 jquery ui 1 10 2 一起使用一切都很好但是当我在内容中使用 HTML 标签时在title我正在应用工具提示的元素
我怎样才能使这个模式持久化？

我正在寻找一种方法让这种模式在出现后持久存在正如此处所示用户只需在 div 外部单击一下即可将其关闭
如何制作一个反应本机输入，向用户提供验证状态反馈。 [有效、Printine、错误、编辑]

我希望输入能够随着用户键入而不断更新然后失去焦点反馈将是输入周围的边框 1 Green when valid 2 Amber when typing and is in error state Green when valid 3 Re
一面一示例 T 测试 Python

在 Python 中我使用 SciPy 进行单样本 t 检验 from scipy import stats one sample data 177 3 182 7 169 6 176 3 180 3 179 4 178 5 177 2
Checkstyles + Gradle 抛出引起：java.lang.IllegalArgumentException：给定名称 COMPACT_CTOR_DEF

我最近将 checkstyle 插件添加到项目中以进行静态代码分析但更新之后google style xml从最新的大师那里我开始收到以下异常 org gradle api tasks TaskExecutionException Ex
grails 2.0 - 正确使用 serverURL 进行生产？

Grails 2 0 改变了它使用 grails serverURL 进行开发和测试环境的方式如manual http grails org doc 2 0 x guide single html upgradingFromPreviou
Python从视频文件中提取wav

Related 如何使用python从视频文件中提取音频 https stackoverflow com questions 19216450 how to extract audio from a video file using pyt

Python从视频文件中提取wav

Python从视频文件中提取wav 的相关文章

随机推荐

热门标签