Python3.7 + Yolo3识别 语音播报

2023-11-10

一、利用Python调用系统win10的文字转语音


首先下载需要用到的库:pip install pyttsx3 -i https://mirrors.aliyun.com/pypi/simple/

接下来直接上代码:

import win32com.client as win

# SpVoice类是支持语音合成(TTS)的核心类。通过SpVoice对象调用TTS引擎,从而实现朗读功能
speak = win.Dispatch("SAPI.SpVoice")
# 完成将文本信息转换为语音并按照指定的参数进行朗读。
# 该方法有Text和Flags两个参数,分别指定要朗读的文本和朗读方式(同步或异步等)。
speak.Speak("come on")
speak.Speak("你好")

最后运行代码,就会听到系统传出来的声音,读出了 come on 和 你好。

二、开始使用Yolo识别,利用语音播报返回出来


开始之前我们先得解析出来Yolo3的代码,从而获取到被识别出来的物体标签。

首先我们找到一个coco_classes.txt,发现里面有很多的英文单词,这些就是准备识别匹配的标签了。
在这里插入图片描述

然后我们在找到yolo.py,发现的我们的coco_classes.txt被传入进来了在这里插入图片描述
关键的来了,我们通过Ctrl + F 搜索一下classes_path这个Key,发现这几行代码
在这里插入图片描述
这里就是读取了存放标签的那个文本,进行了处理,并且返回了名字。

最后找到这一行代码,此处代码就是一开始进行识别的时候,我们的控制台打印出来的代码。
在这里插入图片描述
运行代码的时候发现,打印的这个label,就是识别出的物体的标签了。

这个时候我们就可以将我们的语音播报的代码添加进行,把label传入进去,就会发现识别出来的物体就会通过语音返回。
在这里插入图片描述

Time~

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

Python3.7 + Yolo3识别 语音播报 的相关文章

  • Lighttpd 和 cgi python

    我正在尝试通过 lighttpd 执行一些 python 脚本 但是当我尝试运行它时 我只得到一个要求我下载的空白文件 lighttpd conf server modules mod access mod alias mod access
  • 使用特定的类/函数预加载 Jupyter Notebook

    我想预加载一个笔记本 其中包含我在另一个文件中定义的特定类 函数 更具体地说 我想用 python 来做到这一点 比如加载一个配置文件 包含所有相关的类 函数 目前 我正在使用 python 生成笔记本并在服务器上自动启动它们 因为不同的
  • 元组有什么用?

    我现在正在学习 Python 课程 我们刚刚介绍了元组作为数据类型之一 我阅读了它的维基百科页面 但是 我无法弄清楚这种数据类型在实践中会有什么用处 我可以提供一些需要一组不可变数字的示例吗 也许是在 Python 中 这与列表有何不同 每
  • Python 中的哈希映射

    我想用Python实现HashMap 我想请求用户输入 根据他的输入 我从 HashMap 中检索一些信息 如果用户输入HashMap的某个键 我想检索相应的值 如何在 Python 中实现此功能 HashMap
  • 处理 Python 行为测试框架中的异常

    我一直在考虑从鼻子转向行为测试 摩卡 柴等已经宠坏了我 到目前为止一切都很好 但除了以下之外 我似乎无法找出任何测试异常的方法 then It throws a KeyError exception def step impl contex
  • 您可以格式化 pandas 整数以进行显示,例如浮点数的“pd.options.display.float_format”?

    我见过this https stackoverflow com questions 18404946 py pandas formatdataframe and this https stackoverflow com questions
  • 如何在 Python 中解析和比较 ISO 8601 持续时间? [关闭]

    Closed 这个问题正在寻求书籍 工具 软件库等的推荐 不满足堆栈溢出指南 help closed questions 目前不接受答案 我正在寻找一个 Python v2 库 它允许我解析和比较 ISO 8601 持续时间may处于不同单
  • 为什么 PyYAML 花费这么多时间来解析 YAML 文件?

    我正在解析一个大约 6500 行的 YAML 文件 格式如下 foo1 bar1 blah name john age 123 metadata whatever1 whatever whatever2 whatever stuff thi
  • 如何使用 pybrain 黑盒优化训练神经网络来处理监督数据集?

    我玩了一下 pybrain 了解如何生成具有自定义架构的神经网络 并使用反向传播算法将它们训练为监督数据集 然而 我对优化算法以及任务 学习代理和环境的概念感到困惑 例如 我将如何实现一个神经网络 例如 1 以使用 pybrain 遗传算法
  • Cython 和类的构造函数

    我对 Cython 使用默认构造函数有疑问 我的 C 类 Node 如下 Node h class Node public Node std cerr lt lt calling no arg constructor lt lt std e
  • Jupyter Notebook 找不到 Python 模块

    不知道发生了什么 但每当我使用 ipython 氢 原子 或 jupyter 笔记本时都找不到任何已安装的模块 我知道我安装了 pandas 但笔记本说找不到 我应该补充一点 当我正常运行脚本时 python script py 它确实导入
  • 不同编程语言中的浮点数学

    我知道浮点数学充其量可能是丑陋的 但我想知道是否有人可以解释以下怪癖 在大多数编程语言中 我测试了 0 4 到 0 2 的加法会产生轻微的错误 而 0 4 0 1 0 1 则不会产生错误 两者计算不平等的原因是什么 在各自的编程语言中可以采
  • 从 NumPy ndarray 中选择行

    我只想从 a 中选择某些行NumPy http en wikipedia org wiki NumPy基于第二列中的值的数组 例如 此测试数组的第二列包含从 1 到 10 的整数 gt gt gt test numpy array nump
  • 仅第一个加载的 Django 站点有效

    我最近向 stackoverflow 提交了一个问题 标题为使用mod wsgi在apache上多次请求后Django无限加载 https stackoverflow com questions 71705909 django infini
  • 如何在 Windows 命令行中使用参数运行 Python 脚本

    这是我的蟒蛇hello py script def hello a b print hello and that s your sum sum a b print sum import sys if name main hello sys
  • Pandas 将多行列数据帧转换为单行多列数据帧

    我的数据框如下 code df Car measurements Before After amb temp 30 268212 26 627491 engine temp 41 812730 39 254255 engine eff 15
  • 如何解决 PDFBox 没有 unicode 映射错误?

    我有一个现有的 PDF 文件 我想使用 python 脚本将其转换为 Excel 文件 目前正在使用PDFBox 但是存在多个类似以下错误 org apache pdfbox pdmodel font PDType0Font toUnico
  • 实现 XGboost 自定义目标函数

    我正在尝试使用 XGboost 实现自定义目标函数 在 R 中 但我也使用 python 所以有关 python 的任何反馈也很好 我创建了一个返回梯度和粗麻布的函数 它工作正常 但是当我尝试运行 xgb train 时它不起作用 然后 我
  • 模拟pytest中的异常终止

    我的多线程应用程序遇到了一个错误 主线程的任何异常终止 例如 未捕获的异常或某些信号 都会导致其他线程之一死锁 并阻止进程干净退出 我解决了这个问题 但我想添加一个测试来防止回归 但是 我不知道如何在 pytest 中模拟异常终止 如果我只
  • 使用随机放置的 NaN 创建示例 numpy 数组

    出于测试目的 我想创建一个M by Nnumpy 数组与c随机放置的 NaN import numpy as np M 10 N 5 c 15 A np random randn M N A mask np nan 我在创建时遇到问题mas

随机推荐

  • 渗透测试 面试笔试题

    Powered By 行云博客 https www xy586 top 原创文章 转载请附上原文出处链接和本声明 原文链接 https blog csdn net qq 41679358 article details 109019491
  • C语言:扫雷游戏简单实现

    目录 定义的一些变量 设计思路 为什么设计两个数组棋盘 为什么游戏是9 9但设计数组要设计11 11 初始化函数 为什么要把雷的棋盘初始化为0 打印函数 布置雷 排除雷 解释为什么先前初始化记数字棋盘时选择0和1 可以存在的优化 递归函数实
  • MediaPlayer.setAudioStreamType()方法过时用setAudioAttributes()方法替代

    在Android中创建MediaPlayer 有两种方法 第一种 MediaPlayer mp MediaPlayer create Context R raw xxx 或者 MediaPlayer mp MediaPlayer creat
  • cool-admin应对一个页面出现多个表格【element-ui解决】

    项目背景 在一个页面中引入三个表格的需求 这里以两个为例子好了 这里是失败的例子 cool admin中的cl表格可以实现出现这两个表格 这是data中return回来的 使用封装好的onload方法 调用server接口 实现从后端获取数
  • 【翻译】 Linux 与无人机的未来

    请考虑订阅 LWN订阅是 LWN net 的生命线 如果您喜欢这些内容并希望看到更多 您的订阅将有助于确保 LWN 继续蓬勃发展 请访问此页面加入我们 让 LWN 继续在网络上传播 作者 Nathan Willis 2015 年 10 月
  • 华为OD机试 - 找单词(Java)

    题目描述 给一个字符串和一个二维字符数组 如果该字符串存在于该数组中 则按字符串的字符顺序输出字符串每个字符所在单元格的位置下标字符串 如果找不到返回字符串 N 1 需要按照字符串的字符组成顺序搜索 且搜索到的位置必须是相邻单元格 其中 相
  • 使用深度相机制作自己的Linemod数据集

    1 实施方案 1 1 任务描述 制作自己的Linemod数据集 最终目的示意如下图 1 2 整体方案 通过构建物体和标定板的坐标转换关系 然后构建标定板和相机坐标的转换关系 然后通过映射函数构建3D坐标和图像像素坐标的映射关系 拍摄一系列照
  • Machine Unlearning: A Survey

    这是一个新方向 机器遗忘 针对 Machine Unlearning A Survey 的翻译 机器遗忘 综述 摘要 1 引言 1 1 机器遗忘的动机 1 2 这篇综述的贡献 1 3 与现有机器遗忘综述的比较 2 前言 2 1 机器遗忘的定
  • sql查询服务器系统时间格式,SQL时间函数getdate()是指本机还是服务器上的时间?...

    SQL时间函数getdate 是指数据库所在服务器上的系统时间 SQL Server日期时间函数 1 获取当前日期GetDate getdate 函数以datetime数据类型的格式返回当前SQLServer服务器所在计算机的日期和时间 其
  • 谷歌浏览器调试技巧

    因为上周一直在前段页面找一个东西 中间用到了谷歌浏览器的调试 来大概总结一下 Element标签 该标签使用来查看页面的HTML标签元素的 能够也就是查看源码 我们可以看到布局 可以看到用到的样式 还有用到的链接等等 Source 标签 点
  • 开关电源matlab仿真文件,开关电源matlab仿真设计报告.doc

    开关电源matlab仿真设计报告 开关电源matlab仿真设计报告 基于matlab的电力电子仿真设计报告 课程设计 综合实验 报告 2010 2011 年度第 1 学期 名 称 电力电子技术课程设计 院 系 电气与电子工程学院 班 级 电
  • ZigBee协议

    1 1 IEEE802 15 4标准 随着通信技术的迅速发展 人们提出了在自身附近几米范围内通信的要求 这样就出现了个人区域网络PAN Personal Area Network 和无线个人区域网络WPAN Wireless Persona
  • c语言开发题库管理系统,C语言程序设计_题库管理系统(参考).doc

    程序设计基础课程设计报告 班 级 计算机科学与技术1103班 姓 名 杨广宇 指导教师 胡宏涛 完成日期 2012年9月6日 题目 1 设计题目与要求 简要介绍课程设计题目内容与要求 1设计内容 要求输入试题 仅限选择题和填空题 基本信息
  • 织梦ajax上传图片,使用Ajax异步上传图片的方法(html,javascript,php)

    前两天项目中需要用到异步上传图片和显示上传进度的功能 于是找了很多外国的文章 翻山越岭地去遇上各种坑 这里写篇文章记录一下 HTML HTML代码没什么好说 一个form表单 还有文件类型的input 我们来看js部分 javascript
  • Java 面向对象-2

    1 面向对象进阶 1 1 继承 1 继承的概念 多个类中存在相同属性和行为时 将这些内容抽取到单独一个类中 那么多个类无需再定义这些属性和行为 只要继承那个类即可 此处的多个类称为子类 派生类 单独的这个类称为父类 基类或超类 可以理解为
  • 十大经典排序算法(动图演示C++实现)

    参考 https www cnblogs com onepixel articles 7674659 html 十大经典排序算法 动图演示C 实现 0 算法概述 0 1 算法分类 十种常见排序算法可以分为两大类 选泡插 快归堆希统计基 比较
  • SpringBoot脚手架工程快速搭建

    1 说明 本文汇总了搭建Spring Boot工程的文章 可以用于快速搭建一个新的Spring Boot工程 包括最开始的PowerDesigner数据库设计工具使用 导出对应数据库的DDL脚本 然后创建Maven工程 配置Spring B
  • Go tcp通信

    一般的网络通信socket编程过程按照建立socket使用socket 函数 绑定socket使用bind 函数 监听端口使用listen 函数或者连接使用connect 函数 接收使用receive 函数或者发送使用send 函数这样一个
  • docker部署mysql和jar包

    参考链接 docker介绍 一 文件准备 1 LabelingTool 后端 lt main模块下的配置文件 修改hanlp properties中 linux docker下hanlp路径 root usr Hanlp 2 将后端打成ja
  • Python3.7 + Yolo3识别 语音播报

    一 利用Python调用系统win10的文字转语音 首先下载需要用到的库 pip install pyttsx3 i https mirrors aliyun com pypi simple 接下来直接上代码 import win32com