带麦克风输入的 Python Librosa

2023-12-30

因此，我试图让 librosa 使用麦克风输入而不是仅使用 wav 文件，但遇到了一些问题。最初我使用 pyaudio 库连接到麦克风，但我在翻译这些数据以供 librosa 使用时遇到问题。关于如何解决这个问题有什么建议，或者是否可能？

我尝试过的一些事情包括从 pyaudio mic 接收数据，将其解码为浮点数组并将其传递给 librosa （从文档来看，这就是 librosa 对带有 .load 的 wav 文件所做的事情），但它不起作用它会产生以下错误： “librosa.util.exceptions.ParameterError：音频缓冲区并非到处都是有限的”


FORMAT = pyaudio.paInt16
RATE = 44100
CHUNK = 2048
WIDTH = 2
CHANNELS = 2
RECORD_SECONDS = 5

stream = audio.open(format=FORMAT,
                    channels = CHANNELS,
                    rate = RATE,
                    input=True,
                    output=True,
                    frames_per_buffer=CHUNK)
while True:
        data = stream.read(CHUNK)
        data_float = np.fromstring(data , dtype=np.float16)
        data_np = np.array(data_float , dtype='d')
        # data in 1D array
        mfcc = librosa.feature.mfcc(data_np.flatten() , 44100)
        print(mfcc)

你可以使用callback函数来自pyaudio。我认为使用类更容易。

在构造函数中__init__您定义所需的所有常量并将 FORMAT 设置为pyaudio.paFloat32这将使您以后能够使用它librosa.

然后在start方法我打开音频流。这stream_callback中的参数.open()让您指定实现功能的方式。

callback方法作为参数in_data, frame_count, time_info, flag然后你会收到in_data在二进制文件中。所以你需要使用np.frombuffer(in_data, dtype=np.float32)将它们转换为 numpy 数组。

完成此操作后，您可以使用您的numpy.ndarray就像你通常对 librosa 所做的那样

我认为这可以优化，但这个解决方案对我来说效果很好，希望它有帮助:)

import numpy as np
import pyaudio
import time
import librosa

class AudioHandler(object):
    def __init__(self):
        self.FORMAT = pyaudio.paFloat32
        self.CHANNELS = 1
        self.RATE = 44100
        self.CHUNK = 1024 * 2
        self.p = None
        self.stream = None

    def start(self):
        self.p = pyaudio.PyAudio()
        self.stream = self.p.open(format=self.FORMAT,
                                  channels=self.CHANNELS,
                                  rate=self.RATE,
                                  input=True,
                                  output=False,
                                  stream_callback=self.callback,
                                  frames_per_buffer=self.CHUNK)

    def stop(self):
        self.stream.close()
        self.p.terminate()

    def callback(self, in_data, frame_count, time_info, flag):
        numpy_array = np.frombuffer(in_data, dtype=np.float32)
        librosa.feature.mfcc(numpy_array)
        return None, pyaudio.paContinue

    def mainloop(self):
        while (self.stream.is_active()): # if using button you can set self.stream to 0 (self.stream = 0), otherwise you can use a stop condition
            time.sleep(2.0)


audio = AudioHandler()
audio.start()     # open the the stream
audio.mainloop()  # main operations with librosa
audio.stop()

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

带麦克风输入的 Python Librosa 的相关文章

如何在 PyCharm 中设置运行配置的默认工作目录

当我想运行众多 python 脚本之一时我点击运行这会创建一个新的运行配置该配置的工作目录是 python 脚本文件所在的文件夹相反它应该从项目范围的固定文件夹运行我想以某种方式进行设置但我真的不明白为什么这有点奇怪因为我
Pandas - 按每个可能的键组合聚合

我有一个 DataFrame Pandas 我想通过 A B C 和 D 列的组合尽可能按数据进行分组假设它具有以下形式 A B C D E F G 0 Y X Y Z 1 2 7 1 Y X Y Z 3 4 8 2 X Y U V 1
使用 python 中的 java 库

我有一个 python 应用程序和 java 应用程序 python 应用程序为 java 应用程序生成输入并在命令行上调用它我确信一定有一个更优雅的解决方案就像使用 JNI 从 Java 调用 C 代码一样有什么指点吗仅供参考我
指定的可执行文件不是该操作系统平台的有效应用程序。

我不断收到错误消息System ComponentModel Win32Exception The specified executable is not a valid application for this OS platform 当
django 管理站点导航侧边栏搞砸了

我最近在我的项目中添加了一个包并做了一个pip freeze gt requirements txt然后然后我做了pip install r requirements txt到我的本地它添加了一个侧边栏 I did a pip inst
计时器显示负的已用时间

我正在使用一个非常简单的代码来计算每个循环的时间for陈述它看起来像这样 import time for item in list of files Start timing this loop start time clock Do a
Windows 中的信号处理

在Windows中我试图创建一个等待SIGINT信号的python进程当它收到SIGINT时我希望它只打印一条消息并等待SIGINT的另一次出现所以我使用了信号处理程序这是我的 signal receiver py 代码 impo
CodingBat sum67：为什么这个解决方案是错误的？

我正在解决以下codingbat问题返回数组中数字的总和但忽略以 6 开头并延伸到下一个 7 的数字部分每个 6 后面至少有一个 7 如果没有数字则返回 0 sum67 1 2 2 5 sum67 1 2 2 6 99 99 7 5
使用 theano 进行多处理

我正在尝试将 theano 与 cpu 多处理和神经网络库 Keras 结合使用 I use device gpu标记并加载 keras 模型然后为了提取超过一百万张图像的特征我使用多处理池该函数看起来像这样 from keras
如何从字典列表中查找键的值？

如何从字典列表中获取给定键的值 mylist powerpoint color blue client name Sport Parents Regrouped sort order ascending chart layout 1 cha
为什么 PySpark 中的 agg() 一次只能汇总 DataFrame 的一列？ [复制]

这个问题在这里已经有答案了对于下面的数据框 df spark createDataFrame data Alice 4 300 Bob 7 677 schema name High 当我尝试找到最小值和最大值时我只得到输出中的最小值 d
在 Qt Creator 中相互公开 QML 组件

我正在使用 Qt Quick 和 PySide2 开发仪表板应用程序但在 Qt Creator 的设计模式中公开我的 QML 组件时遇到问题我的文件夹结构如下所示 myapp mycomponents component1 qml co
解释 scipy.stats.entropy 值

我正在尝试使用scipy stats 熵来估计库尔巴克莱布勒 KL 两个分布之间的散度更具体地说我想使用 KL 作为衡量标准来确定两个分布的一致性但是我无法解释 KL 值例如 t1 numpy random normal 2 5
鉴于我的代码是开源的并且我在服务器上运行，并且我接受近乎原始的代码，那么对我来说最糟糕的情况是什么？

我正在研究几个案例在这些案例中接受近乎原始的代码会容易得多所以如果你不能使用 lambda 你能对表达式做的最糟糕的事情是什么以及如何做如果不能使用 import 那么对执行的代码最糟糕的情况是什么如何使用不能使用 X 扫描
Python：多重分配与单独分配速度

我一直在寻求从我的代码中挤出更多的性能最近在浏览时这个 Python 维基页面 https wiki python org moin PythonSpeed 我发现了这个说法多重分配比单独分配慢例如 x y a b 比 x a y
在 Mac OS x 10.7.5 中运行 Scrapy 所需的文件，使用 Python 2.7.3 IEPD_free（32 位）

我是第一次测试 scrapy 使用命令安装后 sudo easy install U scrapy 一切似乎都运行正常但是当我运行时 scrapy startproject tutorial 我得到以下信息 luismacbookpro
如何使用 Misc.imread 将图像分割为红色、绿色和蓝色通道

我正在尝试将图像切片为 RGB 但在绘制这些图像时遇到问题我使用此函数从某个文件夹获取所有图像 def get images path image type image list for filename in glob glob pat
PyTorch 中的交叉熵

交叉熵公式但为什么下面给出loss 0 7437代替loss 0 since 1 log 1 0 import torch import torch nn as nn from torch autograd import Variable
在Python中：检查文件修改时间是否早于特定日期时间

我用 C 编写了以下代码来检查文件是否已过期 DateTime lastTimeModified file getLastTimeModified if lastTimeModified HasValue File does not exi
仅在满足条件时添加到字典

我在用urllib urlencode构建 Web POST 参数但是有一些值我只想在除None为他们而存在 apple green orange orange params urllib urlencode apple apple or

随机推荐

Jenkins 中颠覆轮询失败的电子邮件通知

由于密码更改我们在 Jenkins 中的一项工作失败了它的颠覆轮询超过 24 小时当这种情况发生时并不是立即显而易见的除非您注意到作业没有运行并实际检查日志构建不会失败因为它从未启动有没有人找到解决方案来通知 Jenkins
Spark中如何获取数组列的所有组合？

假设我有一个数组列group ids user id group ids 1 5 8 3 1 2 3 2 1 4 Schema root user id integer nullable false group ids array null
Composer 未下载包的 src 目录

我正在使用 Laravel 和 Composer 构建一个网络应用程序在我的本地计算机上我在composer json 文件中设置了其要求并且一切正常我正在使用 Github 推送到生产服务器但是然后我运行composer in
我能否获取 C#/WPF 中绑定对象的 Type()（即使绑定值为 null）？

我与未知来源有绑定我所拥有的只是绑定我没有其他方法来查看绑定对象我需要找出绑定对象的类型即使该值为空这就是我的问题所在我通过绑定到一个对象然后使用该对象作为获取类型的方式来评估绑定但即使该值为 null 我也需要知道该类型例
使用 pytest 时如何组织装置

固定装置往往较小且可重复使用鉴于特定装置可以依赖其他装置 pytest fixture def Account db memcache 我想在模块中组织我的装置并将它们导入到特定的测试文件中如下所示例如 from fixtures
从 XP 中的隐藏或剪切窗口复制内容？

我需要将隐藏窗口 BitBlt 的内容复制到另一个窗口问题是一旦我隐藏源窗口我得到的设备上下文就不再被绘制你需要的是打印窗口 http msdn microsoft com en us library ms535695 aspx从
airodump-ng 使用 python subprocess.Popen 通信方法输出

嗨我正在尝试从中获得连续输出airodump ng mon0 因此我试图读取的输出airodump ng mon0经过一段时间与 Popen communicate 但仍然无法得到任何东西 import subprocess airod
如何在backbone.js中创建基本视图？

我需要创建一个基本视图我的所有视图都会扩展我不太确定何时何地声明这个观点基本上我需要注入global variables我的所有模板但我不会在每个模板中都这样做render 方法这是我现在的树结构 main js app js
MySQL 更新查询 - 竞争条件和行锁定会遵守“where”条件吗？（PHP、PDO、MySQL、InnoDB）

我正在尝试建立一个先到先得的模型销售页面我们有 n 个相同类型的物品我们希望将这 n 个项目分配给前 n 个发出请求的用户每个项目对应有一个数据库行当用户按下购买按钮时系统会尝试查找尚未出售的条目 reservationCompl
.用曲线制作动画

首先看一下猫需要移动到 a 中的 xcurve 见箭头当猫击中 x 时应停留 10 秒然后猫应返回 o 再次呈曲线状然后重复我用这段代码尝试过 function curve cat delay 10000 animate top
Webpack 从 /folder/folder.js 而不是 /folder/index.js 导入

使用 webpack 当我在 blah 中创建一个 index js 时然后执行import blah from blah 它成功地从index js获取但是我的代码编辑器现在充满了名为 index js 的选项卡并执行 Ctrl
旋转拨盘控制的核心动画困难（非常详细）

我正在尝试创建一个旋转拨号控件基本上是一组 6 位数字它们不断旋转以产生旋转数字计的效果类似于您的电表水表或者可能是扑克机实际上与现有的 UIPickerView 控件但具有完全不同的外观和感觉到目前为止我几乎可以正常工作
PMD - 跳过检查@PostConstruct或@PreDestroy注释的方法

我有以下课程 import javax annotation PostConstruct public class PmdUnusedMethod private void unusedMethod PostConstruct privat
分段错误-strcat

这是我的代码 include
asp.net mvc 4 - razor 视图中的 DataAnnotations 验证（正则表达式）

在正则表达式中使用特殊字符时 DataAnnotations 验证器无法在 asp net mvc 4 razor 视图中工作 Model StringLength 100 Display Description First Name Re
对非常量对象的 const 引用

下面在将 const 引用用于非 const 对象之前是否会创建一个临时对象 const int y 2000 const int s y ok const reference to const object int x 1000 co
使用 Cursor.Position、SetCursorPos()、SendInput() 和 mouse_event() 有什么区别？

Cursor Position SetCursorPos SendInput 和 mouse event 都将鼠标位置设置为指定坐标那么它们之间有什么区别呢 Cursor Position http msdn microsoft com
CacheDispatcher.java 中的 NegativeArraySizeException:99

负数组大小异常 java lang NegativeArraySizeException 1105 at com android volley toolbox d a DiskBasedCache java 300 at com andro
Matplotlib：第二个轴上的 twinx() 值错误

我遇到了一个问题plt twinx 的函数matplotlib pyplot当我尝试绘制主要的次要 x 轴时ln x axis 它们应该显示相应的值但具有不同的刻度为了清楚起见这是我迄今为止在 MWE 中尝试过的 import num
带麦克风输入的 Python Librosa

因此我试图让 librosa 使用麦克风输入而不是仅使用 wav 文件但遇到了一些问题最初我使用 pyaudio 库连接到麦克风但我在翻译这些数据以供 librosa 使用时遇到问题关于如何解决这个问题有什么建议或者是否可能我

带麦克风输入的 Python Librosa

带麦克风输入的 Python Librosa 的相关文章

随机推荐

热门标签