如何在我的 Flask 应用程序中连接浏览器的麦克风？

2023-12-13

我正在使用语音识别模块通过语音识别搜索查询，然后打开显示查询结果的 google chrome 页面。基本上，它是谷歌语音搜索的替代品，但它是通过终端启动的。但我想把它做成一个网络应用程序。我创建了烧瓶应用程序：

- 搜索（目录）

-search.py (opens a tab using terminal directly/works independently)

-app.py (main flask app)

-static(directory)

-templates (directory)

但由于该应用程序托管在服务器上，我的 search.py 从服务器麦克风获取输入（在本例中是我的 PC 麦克风/但在 AWS 上，它无法工作）。如何从客户端浏览器获取输入并在 voice.py 中使用它？我应该删除这个文件并直接在我的主应用程序中使用它吗？执行此功能的最有效方法是什么？

如果有人想知道的话，这是我的 search.py 脚本：它通过终端运行。

import subprocess

import speech_recognition as sr

browser_exe_path = "..."

r=sr.Recognizer()
with sr.Microphone() as source:
    print("Listening!")
    audio=r.listen(source)

    try:
        s_name=r.recognize_google(audio)
        """
        Code to open browser and search the query
        """
    except:
        print("Error!")

这两种可能是最好的方法：

制作您自己的语音识别工具的模块/包并将其导入到您的 Flask 应用程序中
将功能本身集成到应用程序中。

如果您打算再次使用它，最好将语音识别与网络应用程序分开，因为这样您就可以再次使用它。但是，如果将其与应用程序的视图函数等集成，您可以对其进行更多自定义。另外，您可能应该将所有 search.py 逻辑放在一个函数或类中，以便您可以调用它。否则，如果您按现在的样子导入它，它将立即运行。

无论哪种方式，您都需要一个如下所示的语音结构：

用户提交一些语音，可以是现场语音、录制语音或文件形式。我们将此语音文件称为speech.wav（或任何其他文件类型，您选择）
speech.wav由您的语音识别工具读取和解析。它可能返回一个单词列表，或者只是一个字符串。我们称之为output.
output返回到网页并呈现为供用户阅读的内容。

我建议从表单提交开始，如果您可以让它发挥作用，您可以尝试使用 AJAX 进行实时语音识别。从基础开始，只需要求用户添加音频文件或录制音频文件。如果在桌面上，以下脚本将打开文件浏览器；如果在 iOS 或 Android 上，则让用户进行录制。

  <input name="audio-recording" type="file" accept="audio/*" id="audio-recording" capture>
  <label for="audio-recording">Add Audio</label>

  <p id="output"></p>

因此，一旦他们在那里获得了文件，您就需要访问它。您可能想要自定义它，但这里有一个基本脚本，它将控制上述音频。该脚本的功劳归功于谷歌开发人员。

<script>
  const recorder = document.getElementById('audio-recording');

  recorder.addEventListener('change', function(e) {
    const file = e.target.files[0];
    const url = URL.createObjectURL(file);
    // Do something with the audio file.
    
  });
</script>

哪里说的// Do something with the audio file，发出 AJAX GET 请求可能是一个很酷的主意，该请求将返回句子。但这是真正棘手的地方，因为您需要在参数中向 Flask 提供信息，而不是音频文件。但是因为我们已经将文件存在的位置存储在常量中url在我们的脚本中，我们可以使用它作为参数，例如：

from flask import request, jsonify
import search # this is your own search.py that you mentioned in your question.

@app.route("/process_audio")
def process_audio():
    url = request.args.get("url")
    text = search.a_function(url) #returns the text from the audio, which you've done, so I've omitted code
    if text != None
        return jsonify(result="success",text=text)
    else:
        return jsonify(result="fail")

这将以 JSON 格式返回数据，这就像客户端 js 和服务器端 python 之间的桥梁。它可能看起来像这样：

{
 "result":"success",
 "text":"This is a test voice recording"
}

然后，您需要一些 jQuery（或任何其他 js 库，但 jQuery 很好而且很简单）来管理 AJAX 调用：

<script src="//ajax.googleapis.com/ajax/libs/jquery/1.9.1/jquery.min.js"></script>
    <script type=text/javascript>
        const recorder = document.getElementById('audio-recording');

  recorder.addEventListener('change', function(e) {
    const file = e.target.files[0];
    const url = URL.createObjectURL(file);
    $.getJSON('/process_audio', {
          url: url 
        }, function(data) {
          $("#output").text(data.text);
            });
            return false;
          
    </script>

对于任何包围错误，我们深表歉意。因此，应该将一些 JSON 的 GET 请求发送到“/audio_process”的 URL，这将返回我们之前看到的内容，然后它将输出"text"JSON 的"#output"HTML 选择器。

可能需要一些调试，但这似乎可以解决问题。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

如何在我的 Flask 应用程序中连接浏览器的麦克风？的相关文章

为什么从 Pandas 1.0 中删除了日期时间？

我在 pandas 中处理大量数据分析并每天使用 pandas datetime 最近我收到警告 FutureWarning pandas datetime 类已弃用并将在未来版本中从 pandas 中删除改为从 datetime 模块
使用特定的类/函数预加载 Jupyter Notebook

我想预加载一个笔记本其中包含我在另一个文件中定义的特定类函数更具体地说我想用 python 来做到这一点比如加载一个配置文件包含所有相关的类函数目前我正在使用 python 生成笔记本并在服务器上自动启动它们因为不同的
元组有什么用？

我现在正在学习 Python 课程我们刚刚介绍了元组作为数据类型之一我阅读了它的维基百科页面但是我无法弄清楚这种数据类型在实践中会有什么用处我可以提供一些需要一组不可变数字的示例吗也许是在 Python 中这与列表有何不同每
将html数据解析成python列表进行操作

我正在尝试读取 html 网站并提取其数据例如我想查看公司过去 5 年的 EPS 每股收益基本上我可以读入它并且可以使用 BeautifulSoup 或 html2text 创建一个巨大的文本块然后我想搜索该文件我一直在使用
处理 Python 行为测试框架中的异常

我一直在考虑从鼻子转向行为测试摩卡柴等已经宠坏了我到目前为止一切都很好但除了以下之外我似乎无法找出任何测试异常的方法 then It throws a KeyError exception def step impl contex
用枢轴点拟合曲线 Python

我有下面的图我想用 2 条线来拟合它使用 python 我设法适应上半部分 def func x a b x np array x return a x b popt pcov curve fit func up x up y 我想用另
使用 Python 从文本中删除非英语单词

我正在 python 上进行数据清理练习我正在清理的文本包含我想删除的意大利语单词我一直在网上搜索是否可以使用像 nltk 这样的工具包在 Python 上执行此操作例如给出一些文本 Io andiamo to the beach w
删除flask中的一对一关系

我目前正在使用 Flask 开发一个应用程序并且在删除一对一关系中的项目时遇到了一个大问题我的模型中有以下结构 class User db Model tablename user user id db Column db String
使用 kivy textinput 的 'input_type' 属性的问题

您好我在使用 kivy 的文本输入小部件的 input type 属性时遇到问题问题是我制作了两个自定义文本输入其中一个称为 StrText 其中设置了 input type text 然后是第二个文本输入名为 NumText 其
使用Python请求登录Google帐户

在多个登录页面上需要谷歌登录才能继续我想用requestspython 中的库以便让我自己登录通常这很容易使用requests库但是我无法让它工作我不确定这是否是由于 Google 做出的一些限制也许我需要使用他们的 API 或
如何使用 Mysql Python 连接器检索二进制数据？

如果我在 MySQL 中创建一个包含二进制数据的简单表 CREATE TABLE foo bar binary 4 INSERT INTO foo bar VALUES UNHEX de12 然后尝试使用 MySQL Connector P
如何使用python在一个文件中写入多行

如果我知道要写多少行我就知道如何将多行写入一个文件但是当我想写多行时问题就出现了但是我不知道它们会是多少我正在开发一个应用程序它从网站上抓取并将结果的链接存储在文本文件中但是我们不知道它会回复多少行我的代码现在如下 r
pyspark 将 twitter json 流式传输到 DF

我正在从事集成工作spark streaming with twitter using pythonAPI 我看到的大多数示例或代码片段和博客是他们从Twitter JSON文件进行最终处理但根据我的用例我需要所有字段twitter J
Cython 和类的构造函数

我对 Cython 使用默认构造函数有疑问我的 C 类 Node 如下 Node h class Node public Node std cerr lt lt calling no arg constructor lt lt std e
从 NumPy ndarray 中选择行

我只想从 a 中选择某些行NumPy http en wikipedia org wiki NumPy基于第二列中的值的数组例如此测试数组的第二列包含从 1 到 10 的整数 gt gt gt test numpy array nump
仅第一个加载的 Django 站点有效

我最近向 stackoverflow 提交了一个问题标题为使用mod wsgi在apache上多次请求后Django无限加载 https stackoverflow com questions 71705909 django infini
如何使用原始 SQL 查询实现搜索功能

我正在创建一个由 CS50 的网络系列指导的应用程序这要求我仅使用原始 SQL 查询而不是 ORM 我正在尝试创建一个搜索功能用户可以在其中查找存储在数据库中的书籍列表我希望他们能够查询书籍表中的 ISBN 标题作者列目前它
如何在 pygtk 中创建新信号

我创建了一个 python 对象但我想在它上面发送信号我让它继承自 gobject GObject 但似乎没有任何方法可以在我的对象上创建新信号您还可以在类定义中定义信号 class MyGObjectClass gobject GO
Scipy Sparse：SciPy/NumPy 更新后出现奇异矩阵警告

我的问题是由大型电阻器系统的节点分析产生的我基本上是在设置一个大的稀疏矩阵A 我的解向量b 我正在尝试求解线性方程A x b 为了做到这一点我正在使用scipy sparse linalg spsolve method 直到最近一切都
如何计算Python中字典中最常见的前10个值

我对 python 和一般编程都很陌生所以请友善我正在尝试分析包含音乐信息的 csv 文件并返回最常听的前 n 个乐队从下面的代码中每听一首歌曲都是一个列表中的字典条目格式如下 album Exile on Main Street

随机推荐

Strapi 在用户注册时返回错误代码 400

每次我尝试注册测试用户时 Strapi 用户注册都会返回错误 400 Bad Request 但用户确实是在 Users 集合中创建的我使用的是标准的 Strapi 电子邮件插件不是发送网格插件每次我注册用户时该插件不会发送电子邮件
如何在 Pandas 中绘制条形堆栈？

目标是使用 Pandas 内置绘图模块绘制如下所示堆叠的条形图然而我找不到任何试图实现类似目标的类似例子我正在工作的示例代码如下 import pandas as pd import matplotlib import matplot
语法错误：JSON 中出现意外的标记

我正在使用 http get 执行 GET 请求响应采用 JSON 格式但某些字符采用 HTML 编码示例如下编码为 quot quot description quot quot invalid quot quot errorCo
iCloud 会同步所有应用程序的 Document 文件夹中的文件吗？

我有一个关于 iCloud 的问题希望您能帮助我我已阅读iCloud 文档好几次了我从该文档中得到的是 iCloud 不会将应用程序的文档文件夹更新到 iCloud 服务器除非该应用程序有配置的 iCloud 权利但是我总是看到
C 错误“可变大小的对象可能未初始化”[重复]

这个问题在这里已经有答案了可能的重复 C 编译错误可变大小的对象可能未初始化我遇到了一个问题因为我的编译器仍然给我一个错误可变大小的对象可能未初始化我的代码有什么问题吗 int x y n i printf give me th
使用 VBA 识别并删除电子表格中的不间断空格字符

好吧我已经创建了在 StackOverflow 的最佳帮助下一个用户定义函数它标识给定单元格内特定的不可见的不可打印的控制字符然后 UDF 创建一个消息框告诉用户已找到并删除了哪些字符这些函数不会费心去定位 32 个 AS
设备设置独立字体大小

在开发我的应用程序时我意识到如果有人改变了设备的正常字体大小我的应用程序字体大小也会改变并且会破坏我设计的一些视觉效果所以我想问是否有一种方法可以独立于设备设置来修复文本大小 Thanks 查看源码DisplaySettings j
在 Application Insights 中查看 POST 请求正文

是否可以在 Application Insights 中查看 POST 请求正文我可以看到请求详细信息但看不到应用程序见解中发布的有效负载我必须用一些编码来跟踪这个吗我正在构建 MVC core 1 1 Web Api 你可以简单地
仅 while 循环的最后一次迭代保存

我有这个代码 symbolslist 100 200 300 400 500 600 700 800 900 1000 1500 2000 3000 4000 5000 7000 10000 i 0 while i
OnHeapColumnVector putLong NullPointerException

我正在使用spark sql v4 5 0 我必须读取 s3 文件如下所示 val df sc parallelize Array 2019 01 01 546209022 2018 10 12 2020 05 19 02 17 59 2
如何在一定数量的输出后终止脚本

我有一个 bash 脚本它执行一些处理记录操作并将其写入文件它持续运行直到用户终止它我想要做的是自动终止连续运行此脚本直到它将文件填充到用户指定的特定大小或行数这可能吗我想不出如何做到这一点因为如果这个脚本是连续的我就
如何使用 pymongo 对 mongodb 进行排序

我尝试在查询 mongoDB 时使用排序功能但失败了相同的查询在 MongoDB 控制台中有效但在这里不行代码如下 import pymongo from pymongo import Connection connection C
iOS canOpenURL 返回 true，但应用程序未安装（facebook）

目前我想检查我的应用程序是否安装了 Facebook 应用程序我在做什么 UIApplication shared canOpenURL URL string fb enter code here 在 URL 方案中我添加了 fb 所
C# 中的静态类有什么优点/缺点？

我正在为我的学校作业编写一个小游戏该游戏是一个简单的 2D 游戏有怪物物品和子弹基本上你跑来跑去并试图收集所有的物品硬币怪物试图阻止你你可以用你收集的子弹击落它们很简单问题是我已将怪物物品墙壁玩家和子弹添加到名为 L
底图上的“map.scatter”不显示标记

我有一张德国地图和几个城市的坐标 plot正确显示点我想用scatter相反为了能够相对于其他变量对市场进行着色然后显示colorbar 代码在控制台中运行但是当我替换时这些点不可见map plot with map scatte
如何使用java生成azure blob存储SAS url？

我想生成一个 SAS URL 我可以与用户共享该 URL 以连接到存储帐户并将文件上传到任何位置我如何使用 java api 生成 SAS url 我找到了一份文档但看起来所有 api 都已贬值https azuresdkdocs bl
索引 grouped_df 对象

尝试选择类对象的列grouped df按索引给出错误索引超出范围例如 x lt mtcars gt group by am gear gt summarise each funs sum disp hp drat class x gr
如何动态更改正在查看的网站的 CSS 样式表？

我有一个网站用户可以使用其中的向导生成自己的 Codeigniter 网站用户将提供模块字段和功能详细信息根据用户输入将生成一个网站并将其部署在我的网站上并在用户下载之前向用户展示演示一切正常现在我计划允许用户在预览生成的网
使用 SSIS 包中的 Python 脚本预测数据

我知道 Microsoft 在其 SQL Server 机器学习服务中包含了 Python 但这仅适用于 SQL Server 2017 及更高版本而我的服务器目前无法满足这一要求在这种情况下我想完全在 SSIS 中部署我的生成预测与
如何在我的 Flask 应用程序中连接浏览器的麦克风？

我正在使用语音识别模块通过语音识别搜索查询然后打开显示查询结果的 google chrome 页面基本上它是谷歌语音搜索的替代品但它是通过终端启动的但我想把它做成一个网络应用程序我创建了烧瓶应用程序搜索目录 search p

如何在我的 Flask 应用程序中连接浏览器的麦克风？

如何在我的 Flask 应用程序中连接浏览器的麦克风？ 的相关文章

随机推荐

热门标签

如何在我的 Flask 应用程序中连接浏览器的麦克风？的相关文章