Python检测关键字

2024-04-23

我正在做的应用程序执行以下操作：

1:如果麦克风检测到一些噪音，它就会开始录制音频，直到检测不到噪音。之后，音频被录制到 wav 文件中。

2:我必须检测上面的一些文字。只有 5 到 10 个单词需要检测。

到目前为止，我的代码只执行第一部分（检测噪声并记录音频）。现在，我有一个包含以下单词的列表：help, please, yes, no, could, you, after, tomorrow。我需要一种离线方式来检测我的声音是否包含这些单词。这可能吗？我怎样才能做到这一点？我使用的是linux，无法将我的操作系统更改为windows或使用虚拟机。

我正在考虑使用声音的频谱图，创建一个训练数据库并使用一些分类器来预测。例如，this http://www.zimagez.com/zimage/capturadetela2016-02-0713-15-26.php是一个单词的频谱图。这是一个很好的技术吗？

Thanks.

您可以使用 python 中的 pocketsphinx，安装pip install pocketsphinx。代码如下所示：

import sys, os
from pocketsphinx.pocketsphinx import *
from sphinxbase.sphinxbase import *


modeldir = "../../../model"
datadir = "../../../test/data"

# Create a decoder with certain model
config = Decoder.default_config()
config.set_string('-hmm', os.path.join(modeldir, 'en-us/en-us'))
config.set_string('-dict', os.path.join(modeldir, 'en-us/cmudict-en-us.dict'))
config.set_string('-kws', 'command.list')


# Open file to read the data
stream = open(os.path.join(datadir, "goforward.raw"), "rb")

# Alternatively you can read from microphone
# import pyaudio
# 
# p = pyaudio.PyAudio()
# stream = p.open(format=pyaudio.paInt16, channels=1, rate=16000, input=True, frames_per_buffer=1024)
# stream.start_stream()

# Process audio chunk by chunk. On keyword detected perform action and restart search
decoder = Decoder(config)
decoder.start_utt()
while True:
    buf = stream.read(1024)
    if buf:
         decoder.process_raw(buf, False, False)
    else:
         break
    if decoder.hyp() != None:
        print ([(seg.word, seg.prob, seg.start_frame, seg.end_frame) for seg in decoder.seg()])
        print ("Detected keyword, restarting search")
        decoder.end_utt()
        decoder.start_utt()

关键字列表应如下所示：

  forward /1e-1/
  down /1e-1/
  other phrase /1e-20/

这些数字是检测阈值

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Python检测关键字的相关文章

“NoneType”对象不可订阅？

list1 name1 info1 10 list2 name2 info2 30 list3 name3 info3 50 MASTERLIST list1 list2 list3 def printer lst print Availa
Enthought Python 中的线程 FFT

Numpy SciPy 中的快速傅立叶变换 FFT 不是线程化的 Enthought Python 附带 Intel MKL 数值库该库能够进行线程 FFT 如何获得这些例程以下代码适用于 Windows 7 Ultimate 64 位
是否可以将名为“None”的值添加到枚举类型？

我可以将名为 None 的值添加到枚举中吗例如 from enum import Enum class Color Enum None 0 represent no color at all red 1 green 2 blue 3 co
以类似字典的方式将新项目添加到某些结构化数组中

我想扩展 numpy 中的结构化数组对象以便我可以轻松添加新元素例如对于一个简单的结构化数组 gt gt gt import numpy as np gt gt gt x np ndarray 2 dtype names A B fo
MySQL 的 read_sql() 非常慢

我将 MySQL 与 pandas 和 sqlalchemy 一起使用然而它的速度非常慢对于一个包含 1100 万行的表一个简单的查询需要 11 分钟以上才能完成哪些行动可以改善这种表现提到的表没有主键并且仅由一列索引 fro
Python - 使用 win32com.client 将 Excel 单元格范围格式化为表格

我正在尝试编写一个函数该函数选择工作表中的所有非空单元格根据内容调整列宽并将其格式化为表格我被困在最后一点这是我当前的代码 import win32com client from win32com client import co
VSCode Jupyter Notebook - 恢复缓存版本

我正在使用在 Ubuntu 19 10 上运行的 VSCode v 1 48 0 创建一个 Jupyter Notebook VSCode 崩溃了不幸的是我没有保存笔记本当我重新启动时它是空的我已经能够在 config Code Us
可重用的 Tensorflow 卷积网络

我想重用来自Tensorflow 专业人士的 MNIST CNN 示例 http www tensorflow org tutorials mnist pros index md 我的图像尺寸为 388px X 191px 只有 2 个输出
Python 中 Goto 标签的替代方案？

我知道我不能使用 Goto 我也知道 Goto 不是答案我读过类似的问题但我只是想不出解决我的问题的方法所以我正在编写一个程序你必须在其中猜测一个数字这是我遇到问题的部分的摘录 x random randint 0 100 I
__subclasses__ 没有显示任何内容

我正在实现一个从适当的子类返回对象的函数如果我搬家SubClass from base py 没有出现子类 subclasses 它们必须在同一个文件中吗也许我从来没有直接导入subclass py对Python隐藏子类我能做些什么
可变和不可变类变量如何初始化？

运行下面的示例代码 class S i 0 a def init self self i 1 self a append 1 s1 S print s1 i s1 a s2 S print s2 i s2 a 输出将是 1 1 1 1 1
按多索引的一级对 pandas DataFrame 进行排序

我有一个多索引 pandas DataFrame 需要按索引器之一进行排序这是数据片段 gene VIM treatment dose time TGFb 0 1 2 0 158406 1 2 0 039158 10 2 0 052608
pip：证书失败，但curl 有效

我们在客户端安装了根证书 https 连接适用于curl 但如果我们尝试使用pip 它失败 Could not fetch URL https installserver 40443 pypi simple pep8 There was a
如何点击 Google Trends 中的“加载更多”按钮并通过 Selenium 和 Python 打印所有标题

这次我想单击一个按钮来加载更多实时搜索这是网站的链接该按钮位于页面末尾代码如下 div class feed load more button Load more div 由于涉及到一些 AngularJS 我不知道该怎么做有什么提
Tensorflow：提要字典错误：您必须为占位符张量提供值

我有一个错误我无法找出原因这是代码 with tf Graph as default global step tf Variable 0 trainable False images tf placeholder tf float32
在Python中计算矩阵乘以其转置（AA^T）的最快方法

在Python中将矩阵与其转置 AA T 相乘的最快方法是什么我认为 NumPy SciPy 没有考虑使用例如时涉及的对称性 np dot or np matmul 得到的矩阵总是对称的所以我可以想象有一个更快的解决方案 None
Windows 10 上的 Tensorflow 安装问题

我正在尝试在 Win 10 计算机上安装 Tensorflow 我成功安装了Python 3 7 然后尝试按照tensorflow org上的安装说明进行操作执行时 pip install tensorflow 我收到以下错误消息错误
Python中如何实现相对导入

考虑 stuff init py mylib py Foo init py main py foo init py script py script py想要进口mylib py 这只是一个示例但实际上我只想在父目录中进行模块的相对导入
mypy 错误：赋值中的类型不兼容（表达式的类型为“Dict[, ]”，目标的类型为“List[str]”）

我尝试过了实例化一个空字典在现有字典的第二层上然后为其分配一个键值对但 MyPy 会抛出错误这是一个最小的示例当激活 MyPy 检查时它将重现它 result Test something result key result key
如何访问模板缓存？ - 姜戈

I am 缓存 HTML在几个模板内例如 cache 900 stats stats endcache 我可以使用以下方式访问缓存吗低级图书馆例如 html cache get stats 我确实需要对模板缓存进行一些细粒度的控制有任

随机推荐

Java websocket 客户端不适用于 GDAX 沙箱环境

我正在使用 spring WebSocketWebSocketClient连接 GDAX 服务器它在实时环境中运行良好但相同的代码不适用于沙箱环境这是我连接到服务器的代码 public class Test public static
如何选择给定索引和长度的 RichTextBox 文本

如果只给你一个要选择的特定文本的索引和长度或 EndIndex 你如何在 RichTextBox 的 WPF 版本中执行此操作这在 Textbox 中非常可行因为您可以调用 Textbox Select startIndex Leng
非不相交集并集的最佳算法是什么？

假设有两个非不相交点集笛卡尔空间执行这两个集的并集的最佳情况复杂度算法是什么由于点坐标是任意的并且它们之间没有特殊关系因此我不认为这个问题是一个几何特定问题这是有效地将 S1 和 S2 合并成新集合 S 的通用问题我知道有
重新索引不完整的多级数据帧中的第二级以使其完整，在缺失的行上插入 NAN

我需要重新索引 pandas 数据框的第二级以便第二级成为一个完整列表0 N 1 对于每个一级索引我尝试使用艾伦海登的方法 https stackoverflow com questions 20104874 reindex su
如何在 rspec 测试中存根 gmaps4rails 地理编码函数？

我正在使用 gmaps4rails 并尝试开发一些测试我有一家工厂 factory country do sequence name n Country n end 这显然不被谷歌认可 Validation failed Gmaps4ra
如何在变量周围打印双引号？

例如我们有 word Some Random Word print word 有没有更好的方法在变量周围打印双引号 Update From Python 3 6 https docs python org 3 whatsnew 3 6 h
Oracle 相当于 information_schema.tables

当我尝试在 Oracle 中执行以下查询时出现表或视图不存在错误 SQL查询 SELECT table type table name FROM information schema tables WHERE table rows g
当一个数字完全整除时，如何在 python 中显示两个小数点？

目前我正在尝试解决一个问题我应该将答案打印到小数点后两位不四舍五入我为此目的使用了以下代码 import math a 1 175 value of a after some division print math floor a 10
Java：在 E4X 中解析 XML 的方法？

我想知道是否有一种方法可以使用 E4X 或类似于 E4X 的方法来解析 XML 这样的框架库存在吗 Thanks 您可以将 JavaScript 引擎 Rahino 与 Java 一起使用它可以处理 E4X http blogs ora
在 .NET Core (MS.DI) 中注册具有类型约束的泛型类型

我有一个通用界面IPipelineBehavior
如何使用 Curl 将文件从另一台服务器上传到另一台服务器？

如何在 Shell 脚本和 PHP 中使用 Curl 将文件从另一台服务器上传到另一台服务器我有一个 txt 文件存储在存储 Shell 脚本的服务器中现在我希望将该 txt 文件上传到另一台服务器的特定文件夹中 2台服务器已经连接 t
ASP.NET 数据集与业务对象/ORM

我正在考虑 ASP NET 应用程序的数据访问来自一家使用大量带有客户端数据集的 Windows 应用程序的公司自然而然地倾向于使用数据集方法来处理数据我更热衷于业务对象方法并且不喜欢在会话中缓存数据集然后应用更新的想法有谁有任何
在 MVC 应用程序中显示 jqGrid 页脚行中的数据

我需要帮助在 jqGrid 页脚行中显示数据这是我在服务器上的配置注意用户数据小时 line Format the data for the jqGrid var jsonData new total totalPages page
git config 命令返回：致命：无法读取配置文件'%HOMEDRIVE%%HOMEPATH%/.gitconfig'：没有这样的文件或目录

在我的 Windows 10 机器上当我运行时 git config global l 它失败并显示消息致命无法读取配置文件 HOMEDRIVE HOMEPATH gitconfig 没有这样的文件或目录两个环境变量看起来都不错对
用于指示存储库已弃用的 Git 挂钩

我们有一个存储库托管在 GitLab 实例上少数项目仍在引用该存储库但已被弃用取而代之的是另一个解决方案有什么方法可以将存储库标记为已弃用吗理想情况下每个fetch来自此存储库作为git submodule update
如果滚动位置为 0，ViewPager2 中的片段不会响应点击

我很高兴谷歌发布了ViewPager2 https developer android com jetpack androidx releases viewpager2它基于 RecyclerView 构建解决了旧 ViewPager 存
Android WebViewClient url重定向（Android URL加载系统）

我尝试使用以下方法拦截 webview 请求 ShouldInterceptRequest 里面我用了HttpUrlConnection为了从服务器获取数据我将其设置为遵循重定向这对 webviewclient 是透明的这意味着当我返
HTML5 文本画布在文本宽度大于允许的最大宽度时旋转

朋友们我发现旋转文本画布对象有点棘手问题是我正在绘制一个图形但有时每个条形的宽度小于该条形的值所以我必须将值评定为 90 度在大多数情况下它都会起作用我正在做以下事情 a function x y text maxWid
何时在 struts2 中使用重定向和链接结果类型

在我的 struts 2 项目中当使用重定向操作时我丢失了所有值例如操作错误和字段错误我在网上查了一下发现有2个选项链条这个用得不多我不知道为什么 MessageStoreInterceptor 这需要放置在每个操作中那么
Python检测关键字

我正在做的应用程序执行以下操作 1 如果麦克风检测到一些噪音它就会开始录制音频直到检测不到噪音之后音频被录制到 wav 文件中 2 我必须检测上面的一些文字只有 5 到 10 个单词需要检测到目前为止我的代码只执行第一部分检

Python检测关键字

Python检测关键字 的相关文章

随机推荐

热门标签

Python检测关键字的相关文章