将多通道 PyAudio 转换为 NumPy 数组

2023-12-26

我能找到的所有例子都是单声道的，CHANNELS = 1。如何使用 PyAudio 中的回调方法读取立体声或多声道输入并将其转换为 2D NumPy 数组或多个 1D 数组？

对于单声道输入，类似这样的工作：

def callback(in_data, frame_count, time_info, status):
    global result
    global result_waiting

    if in_data:
        result = np.fromstring(in_data, dtype=np.float32)
        result_waiting = True
    else:
        print('no input')

    return None, pyaudio.paContinue

stream = p.open(format=pyaudio.paFloat32,
                channels=1,
                rate=fs,
                output=False,
                input=True,
                frames_per_buffer=fs,
                stream_callback=callback)

但不适用于立体声输入，result数组的长度是两倍，所以我假设通道是交错的或其他什么，但我找不到这方面的文档。

它似乎是逐个样本交错的，左通道在前。当左声道输入有信号且右声道输入静音时，我得到：

result = [0.2776, -0.0002,  0.2732, -0.0002,  0.2688, -0.0001,  0.2643, -0.0003,  0.2599, ...

因此，要将其分离为立体声流，请重新整形为 2D 数组：

result = np.fromstring(in_data, dtype=np.float32)
result = np.reshape(result, (frames_per_buffer, 2))

现在要访问左通道，请使用result[:, 0]，对于右通道，使用result[:, 1].

def decode(in_data, channels):
    """
    Convert a byte stream into a 2D numpy array with 
    shape (chunk_size, channels)

    Samples are interleaved, so for a stereo stream with left channel 
    of [L0, L1, L2, ...] and right channel of [R0, R1, R2, ...], the output 
    is ordered as [L0, R0, L1, R1, ...]
    """
    # TODO: handle data type as parameter, convert between pyaudio/numpy types
    result = np.fromstring(in_data, dtype=np.float32)

    chunk_length = len(result) / channels
    assert chunk_length == int(chunk_length)

    result = np.reshape(result, (chunk_length, channels))
    return result


def encode(signal):
    """
    Convert a 2D numpy array into a byte stream for PyAudio

    Signal should be a numpy array with shape (chunk_size, channels)
    """
    interleaved = signal.flatten()

    # TODO: handle data type as parameter, convert between pyaudio/numpy types
    out_data = interleaved.astype(np.float32).tostring()
    return out_data

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

NumPy

pyaudio

将多通道 PyAudio 转换为 NumPy 数组的相关文章

Cython 函数中的字符串

我想这样做将字符串传递给 Cython 代码 test py s Bonjour myfunc s test pyx def myfunc char mystr cdef int i for i in range len mystr err
如何让Python的socket服务器永远运行

我有这段代码创建了一个简单的Python套接字服务器但是每次客户端断开连接时它都会关闭如何让它永远运行 import socket HOST PORT 8000 s socket socket socket AF INET socket
HoughLinesP后如何合并线？

My task is to find coordinates of lines startX startY endX endY and rectangles 4 lines Here is input file 我使用下一个代码 img c
如何在不破坏默认行为的情况下覆盖 __getattr__ ？

我如何覆盖 getattr https docs python org 3 reference datamodel html object getattr 类的方法而不破坏默认行为压倒一切 getattr 应该没事 getattr 仅作为
Python 列表理解不适用于 itertools.groupby 解码

我正在尝试解码结果itertools groupby到一个值列表中我的来源是 x 1 2 2 1 6 3 6 5 1 3 最初的方法是使用 for 语句来实现如下所示 keyfunc itemgetter 0 groups unique
Highcharts 奇怪的分组行为

我正在使用延迟加载 http www highcharts com stock demo lazy loading加载 OHLC 数据的方法在服务器端我使用 Python MySQL 并有 4 个包含 OHLC 数据的表时间间隔为 5
使用 OpenCV 进行相机校准 - 如何调整棋盘方块大小？

我正在使用 OpenCV Python 示例开发相机校准程序来自 OpenCV 教程 http opencv python tutroals readthedocs io en latest py tutorials py calib3d
使用 python-docx 在 docx 文件中查找所有“正常”样式且字体大小不是 11 的文本

到目前为止我的实现 from docx api import Document import pandas as pd from docx shared import Pt texts sizes document Document new
为什么我在将数据上传到数据库时不断看到“正在重置断开的连接”？

我正在通过 REST API 将数亿个项目从 Heroku 上的云服务器上传到 AWS EC2 中的数据库我正在使用 Python 并且经常在日志中看到以下 INFO 日志消息 requests packages urllib3 conn
如何将 pip 指向 Mercurial 分支？

我正在尝试通过 pip 将我的应用程序安装到 virtualenv 进行测试安装时效果很好default or tip像这样 pip install e hg https email protected cdn cgi l email p
如何将字符串方法应用于数据帧的多列

我有一个包含多个字符串列的数据框我想使用对数据帧的多列上的系列有效的字符串方法我希望这样的事情 df pd DataFrame A 123f 456f B 789f 901f df Out 15 A B 0 123f 789f 1 45
当我打印“查询”时获取 PY_VAR1

我正在制作一个简单的网络抓取代码当我尝试打印一个值时它给了我其他东西 def PeopleSearch query SearchTerm query what is query print str query SearchTerm St
在Python中确定句子中2个单词之间的邻近度

我需要确定 Python 句子中两个单词之间的接近度例如在下面的句子中 the foo and the bar is foo bar 我想确定单词之间的距离foo and bar 确定之间出现的单词数foo and bar 请注意该词
如何使用 Ajax 在 Flask 中发布按钮值而不刷新页面？

我有一个问题当我单击 Flask 应用程序中的按钮时我想避免重新加载我知道有 Ajax 解决方案但我想知道如何将我的按钮链接到 ajax 函数以发布按钮值并运行链接到其值的 python 函数这是我的 html 按钮 div di
为什么 tesseract 无法从这个简单的图像中读取文本？

我在 pytesseract 上阅读了大量的帖子但我无法让它从一个简单的图像中读取文本它返回一个空字符串这是图像我尝试过缩放它灰度化它调整对比度阈值模糊以及其他帖子中所说的一切但我的问题是我不知道 OCR 想要更好地工作
Java 相当于 Python 的 urllib.urlencode（基于 HashMap 的 UrlEncode）

From https stackoverflow com questions 2018026 should i use urllib or urllib2 2018103 2018103 Java 中 Python 的 urllib url
用户的完整 UNIX 用户名

想知道您是否知道是否有一种巧妙的方法可以从 shell 获取完整的用户名示例如果我的 UNIX 用户名是 froyo 那么我想获取我的全名在本例中如系统中注册的那样 froyo Abhishek Pratap Finger 命令可以
Matplotlib 渲染日期、图像的问题

我在使用 conda forge 的 Matplotlib v 3 1 3 和 python 3 7 时遇到问题我拥有 Matplotlib 所需的所有依赖项当我输入这段代码时它应该可以工作我得到了泼溅艺术它基于此 YouTube
如何有效地计算另一列中每个元素的较大元素的数量？

我有以下内容df name created utc 0 t1 cqug90j 1430438400 1 t1 cqug90k 1430438400 2 t1 cqug90z 1430438400 3 t1 cqug91c 143043840
使用 Python 进行 Google 搜索网页抓取 [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案最近为了工作中的一些项目学习了很多python 目前我需要使用谷歌搜索结果进行一些网络抓取我发现几

随机推荐

使用 swiftmailer 在 symfony 2 中通过 smtp.gmail.com 发送邮件

我在使用 gmail 从 xampp 本地主机发送邮件时遇到问题经过很长一段时间我终于成功了我正在与大家分享如果我错了需要适当的解决方案在你的 symfony 2 的 config yml 中写下这些 swiftmailer di
mysqli_multi_query 是异步的吗？

databases array path Path To Directory main link mysqli connect localhost USERNAME PASSWORD files scandir path ignore fi
codeSandBox (React/Node) 的 Http 请求错误

我在 CodeSandBox StackBlitz 等在线 IDE 中遇到奇怪的错误我做了一个示例 http 请求使用 axios 但使用 fetch 或其他问题是相同的并尝试在控制台中打印响应我在前端使用 React 在后端使用
在 foreach 循环外部使用 foreach 循环的变量

我有一个 foreach 循环我在循环内创建了一个字符串但我想在循环外使用 var 这可能吗 List
.NET版本和C#版本之间的关系？ [关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案如何确定可以针对特定 NET Framework 版本使用哪个版本的 C 我读过了 https sta
Git 精选语法和合并分支

所以我之前已经做过无数次樱桃挑选看来我现在必须在生活中失败我正在尝试从一个分支挑选到另一个分支这应该很容易但是我收到了关于它是合并的错误但是没有给出 m 吗 git cherry pick a8c5ad438f6173dc34f6
Mono无法打开sqlite数据库

我正在尝试对 sqlite v3 数据库进行非常基本的连接并且我正在使用 monodevelop 3 0 和 Mono 2 10 但无法连接到数据库我可以让应用程序创建数据库但随后它尝试连接到数据库时立即失败有什么建议么我从不同的
查找可点击的元素

有没有办法找到用 click 或 live click 指定的所有可点击元素如果单击任何此类元素我想执行一些操作 container bind click function event actions 这个捕获所有点击 Thanks 这
如何使用时区偏移格式化 LocalDateTime

我尝试这样做 ZoneOffset zoneOffset ZoneOffset ofHours 3 DateTimeFormatter fmt DateTimeFormatter ofPattern HH mm ss LocalDateTi
如何确定我的 iOS 设备是否有手电筒？

在我的应用程序中我可以选择手电筒然而只有 iPhone 4 和 iPhone 4S 有手电筒灯其他设备没有手电筒灯如何找到当前设备型号请帮我提前致谢您不应使用设备型号作为是否存在某项功能的指示符相反请使用 API 来准确
blur.js 尝试请求“none”并且 div 未扩展 100%

我正在尝试使用http blurjs com http blurjs com 模糊标题栏的标题图像的背景然而它给了我一个有趣的错误我似乎无法追踪这可能与主要代码和兼容性有关但我不确定 http jordan rave5 com t
在 Numpy（或 Scipy）中计算斜率

我正在尝试找到使用 Numpy 和 Scipy 计算斜率的最快最有效的方法我有一组由三个 Y 变量和一个 X 变量组成的数据集我需要计算它们各自的斜率例如我可以轻松地一次一行执行此操作如下所示但我希望有一种更有效的方法来执行此
按下 iOS swift 后更改 UIBarButtonItem 图标

In the viewDidload方法我声明了一个按钮并设置了 RightBarButton let btnFavourite UIButton frame CGRectMake 0 0 30 30 btnFavourite addTa
找不到任何与 com.google.android.gms 匹配的版本：strict-version-matcher-plugin:[15.0.0, 16.0.0)

项目一直运行良好直到前两天突然出现错误我不知道如何解决它因为我已经做了我能做的一切包括重新安装 android studio 和 gradle 无法解析配置 app debugCompileClasspath 的所有文件找不到与
Array.push 返回推送值？

是否有任何实质性原因需要修改Array push 返回推送的对象而不是新数组的长度可能是一个坏主意我不知道这是否已经被提议或询问过谷歌搜索只返回了大量与当前功能相关的问题Array push 这是此功能的示例实现请随意更正它 func
ChildNode 类型上不存在属性“tagName”[Typescript]

我正在从父节点循环子节点我想访问子节点的 tagName 但错误是 tagName 在类型 ChildNode 上不存在 const contentParsed new DOMParser parseFromString content
创建 LocalDB 以从 Visual Studio SQL 项目进行测试

我正在尝试为我的项目创建集成测试我需要测试一个通过存储库调用存储过程的控制器应在每次运行某些范围的测试时创建一个空数据库所以我将实施以下步骤 Create LocalDB 运行一些预脚本以添加测试数据 Run test 运行一些后脚
GIMP的图层合成/混合方法

在我寻求为 Matlab 中的图像混合工具添加 Alpha 功能时我遇到了一些障碍其中我一直在使用these http ssp impulsetrain com porterduff html links http www adobe
显示一个 div，单击时隐藏所有其他 div

我有一个简单的图像视频库我想用 jQuery 制作动画我想要做的就是当有人点击链接时 big具有相同ID的div被设置为display block opacity 1所有其他 div 都设置为display none opacity
将多通道 PyAudio 转换为 NumPy 数组

我能找到的所有例子都是单声道的 CHANNELS 1 如何使用 PyAudio 中的回调方法读取立体声或多声道输入并将其转换为 2D NumPy 数组或多个 1D 数组对于单声道输入类似这样的工作 def callback in dat

将多通道 PyAudio 转换为 NumPy 数组

将多通道 PyAudio 转换为 NumPy 数组 的相关文章

随机推荐

热门标签

将多通道 PyAudio 转换为 NumPy 数组的相关文章