LD3320语音识别

2023-10-27

芯片介绍

LD3320：

· 不需要外接任何辅助的Flash芯片，RAM芯片和AD芯片，就可以完成语音识别功能。

· 每次识别最多可以设置50项候选识别句，每个识别句可以是单字，词组或短句。另一方面，识别句内容可以动态编辑修改,
只需要主控MCU把识别关键词语的拼音串通过设置寄存器的方式传入芯片内部。因此可由一个系统支持多种场景。

· 主控MCU对芯片的操作通过读写芯片内部寄存器完成。通过设置和读取寄存器可以方便地完成设置语音识别列表，启动语音识别，获得识别结果，播放MP3等功能。

· 芯片内部已经准备了16位A/D转换器、16位D/A转换器和功放电路。麦克风、立体声耳机和单声道喇叭可以很方便地和芯片管脚连接。立体声耳机接口的输出功率为20mW，而喇叭接口的输出功率为550mW，能产生清晰响亮的声音。

· 支持并行接口和串行接口SPI两种连接方式，串行方式可以简化与其他模块的连接。

· 可把芯片设置为休眠状态，此时耗电非常少，而且可以方便地激活。

· 支持MP3播放功能，无需外围辅助器件，主控MCU将MP3数据依次送入LD332X芯片内部就可以从芯片的D/A PIN输出声音。支持MPEG1(ISO/IEC11172-3),
MPEG2(ISO/IEC13818-3) 和MPEG 2.5 layer 3等格式。

工作供电为3.3V，如果用于便携式系统，使用3节AA电池就可以满足供电需要。

硬件组成

按照手册原理图设计
0.5W小喇叭、小咪头一个（淘宝能搜到）
用STM32芯片走SPI通道

程序调试

首先官方代码没有问题；

全部采用循环查询方式；SPI速度最大支持1.5MHz；

语音播放与SPI速度有关,与SD卡读取速度也有关系，目前解决办法设置：

SPI：36/32=1.125M，SD：72/72=1M<1.125Mhz，保证数据不溢出，不影响SPI；

程序：
https://blog.csdn.net/weixin_43637946/article/details/86708128

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

LD3320

语音识别

LD3320语音识别的相关文章

【C#】.Net 腾讯云一句话识别【实例】

腾讯云一句话识别实例 using System using System Threading Tasks using TencentCloud Common using TencentCloud Common Profile using T
Coqui TTS 安装与测试

前言本篇记录一下 Coqui TTS 的安装 Coqui TTS 的主要作者是德国人这个库似乎之前和 Mozilla 的 TTS https github com mozilla TTS 有千丝万缕的关系但是现在后者的 TTS 已经停
语音识别芯片LD3320介绍再续

语音识别芯片LD3320驱动程序 1 芯片复位复位就是对LD3320芯片的第47腿 RSTB 发送低电平然后需要对片选CS做一次拉低拉高的操作以激活内部DSP 按照以下顺序 void LD reset RSTB 1 delay 1
python实现调用科大讯飞语音听写（将音频识别成文字输出）

一大致流程 1 申请科大讯飞账号 https passport xfyun cn register 2 创建应用应用平台选择WebAPI 3 查看开发文档 4 根据开发文档和示例代码进行调试二申请科大讯飞账号首先我们先去科大讯飞开
Kaldi语音识别学习记录-----编译安装

语音识别领域的开源框架有CMUSphinx HTK Kaldi等等而目前仍然比较活跃且工程价值较高的就数Kaldi 很多从事语音方面的公司都使用该框架训练自己的语音识别能力由于其内部代码逻辑较为复杂故这里一步一步来解读了解语音识
kaldi编译报错：找不到库

https blog csdn net boshuzhang article details 81988264
可以白嫖的语音识别开源项目whisper的搭建详细过程

原文来自我个人的博客 1 前提条件服务器为GPU服务器点击这里跳转到我使用的GPU服务器我搭建 whisper 选用的是 NVIDIA A 100显卡 4GB显存 Python版本要在3 8 3 11之间输入下面命令查看使用的Pyt
不限次数的chatGPT

不说废话直接看方法不用翻墙开干第一步打开电脑的Edge浏览器就是windows系统的默认浏览器搜索wetab 点击如下的官方链接就会进入安装插件界面第二步点击chat AI就会弹出这个弹窗点击安装教程按钮第三步来到
cogmen: contextualized gnn based multimodal emotion recognition(2022)

cogmen 基于语境gnn的多模式情感识别摘要情感是人类互动的固有部分因此开发理解和识别人类情感的人工智能系统势在必行在涉及不同人群的对话中一个人的情绪受到另一个说话者的话语以及他们自己在话语中的情绪状态的影响在本文中我们
语音转文字，视频转文字的新大陆！--飞书（好用记得点个赞）

语音转文字视频转文字的新大陆飞书 1 选择自己对应的系统下载飞书飞书是字节跳动于2016年自研的新一代一站式协作平台网址 https www feishu cn 2 下载安装之后使用手机号邮箱等注册登录点击会议点击进入子菜
GMM-HMM在语音识别中的应用

1 语音识别系统的基本结构 2 涉及算法 3 GMM高斯混合模型 3 1高斯混合模型的基本概念高斯混合模型是指具有如下形式的概率分布模型 p y k 1k k y k p y arrowvert theta sum k 1 k alpha
论文分享丨西工大音频语音与语言处理研究组四篇论文被IEEE Trans. ASLP和SPL录用

近日实验室三篇论文被语音研究顶级期刊IEEE ACM Transactions on Audio Speech and Language Processing TASLP 录用一篇论文被重要期刊IEEE Signal Processin
华为太长脸了，扔出“3张王炸”！再次颠覆互联网行业

8月29日在没有任何预告任何发布会的情况下华为扔出一张王炸华为新手机Mate60pro开售 9月8日华为废话不多说再次扔出王炸牌 Mate60 Pro MateX5开启预订一经开抢卖到断货就在刚刚华为AITO问界新
语音识别入门 --各个模型的整理

语音识别入门前期知识储备结构图语音特征提取各个模型的尝试 ASRT DeepSpeechRecognition end2end chinese speech recognition Wenet whisper 语音纠错 TTS 文本
语音识别之HMM算法及其源码

基础 1 了解HMM算法 http www cnblogs com pangxiaodong archive 2011 10 17 2214542 html 2 再次加深印象 http blog csdn net likelet artic
搭建AI智能语音外呼系统

随着人工智能技术的发展近半年来涌现了大量基于人工智能的呼叫中心业务服务商和集成商仅电销机器人这一个方向就至少有近百家公司正在推广运营包括百度讯飞智齿硅基百应箭鱼容联等商务上的需求非常强烈整个市场都飞快地热闹起来一套可
传统语音增强——基本的维纳滤波语音降噪算法

一维纳滤波的基本原理基本维纳滤波就是用来解决从噪声中提取信号问题的一种过滤或滤波方法它基于平稳随机过程模型且假设退化模型为线性空间不变系统的实际上这种线性滤波问题可以看成是一种估计问题或一种线性估计问题基本的维纳滤波是根据
windows下写入文本换行符\r\n修改为linux下换行符\n

最近一段时间经常使用python向文本写入数据但是windows下换行符默认为 r n 而linux下换行符为 n 写入的文本要在linux下调用这就很坑人了代码前行的路上怎么能被小小石头绊倒于是乎搜索了一通发现这个事情仅需要几行
python离线语音转文字

1 安装SpeechRecognition第三方库 pip install SpeechRecognition 2 安装pocketsphinx第三方库安装时可能会报错error command swig exe failed No s
机器翻译：跨越语言边界的智能大使

导言机器翻译作为人工智能领域的瑰宝正在以前所未有的速度和精度为全球沟通拓展新的可能性本文将深入研究机器翻译的技术原理应用场景以及对语言交流未来的影响 1 简介机器翻译是一项致力于通过计算机自动将一种语言的文本翻译成另一种语言的技

随机推荐

exports is not defined

若是babel 6 可以看这位同仁的文章 https www cnblogs com vickya p 8645061 html 若是babel 7 设置 https www babeljs cn docs babel preset env
【Python】文件操作 r+ 的问题

问题背景想用 python 实现文件的读取并修改部分内容再写回去 r 是最符合的权限可读写并且可以覆盖文件之前的内容但是实际使用时发现修改后的内容是追加的方式而不是覆盖 with open gitignore r as f
CENTOS上的网络安全工具（二十四）Windows下的Hadoop+Spark编程环境构建

前面我们搭建了hadoop集群 spark集群也利用容器构建了spark的编程环境但是一般来说就并行计算程序的开发一刚开始一般是在单机上的比如hadoop的single node 但是老师弄个容器或虚拟机用vscode远程访问式开
MFC定时器SetTimer函数

一 SetTimer表示的是定义个定时器根据定义指定的窗口在指定的窗口 CWnd 中实现OnTimer事件这样就可以相应事件了 SetTimer有两个函数一个是全局的函数 SetTimer UINT SetTimer HWND h
C语言上机实验思路分享4

实验内容方法和步骤 1 输入 10 个整数用选择法对这 10 个整数按从小到大的顺序排序并输出排序后的结果程序代码 include
从现实抽象出类的步骤

第一找出分类分析出类第二找出类的特征分析类的相关属性第三找出类的行为分析类的方法转载于 https www cnblogs com liumeilin p 7018110 html
AVRCP协议介绍

文章目录 1 AVRCP协议介绍 1 2 概念 1 2 1 1 2 2 role 用途 2 AVRCP框架 1 AVRCP协议介绍 1 2 概念 1 2 1 1 2 2 role CT controller 是一种通过向目标发送命令帧来启动
静态编译和动态编译，java与javascript区别总结

1 静态编译和动态编译静态编译是程序在编译时就已经确定好了所有类之间的关系要运行程序所有类都缺一不可若在开始运行时就把其中的某类文件丢失就会产生 NoClassDefFoundError错误程序会终止在程序运行前的装载期间就把
flutter获取状态栏高度

获取状态栏高度 import dart ui MediaQueryData fromWindow window padding top 系统默认的appBar等高度位于Dart Packages flutter src material
物理渲染学习笔记（三）——Cook-Torrance微表面模型

从 Phong 到 GGX 光照模型林林总总一直没能找机会梳理一遍这几天依次都自己实现了一遍也正好总结下 Microfacet 普通的着色模型假设着色的区域是一个平滑的表面表面的方向可以用一个单一的法线向量来定义来定义而 Micr
程序员吃青春饭？程序员在35岁以后是否需要转行？你规划好了吗？

都说程序员是一个吃青春饭的职业都认为程序员到了35岁以后不转管理岗位就没有什么前途了可能就要考虑换别的行业了年龄越大可能越写不动代码了那么程序员是不是35岁以后需要转行我说说我自己的观点关于程序员35岁之后是不是要转行这个问题
区块链技术基础（笔记）

一区块链本质上是一个对等网络 peer to peer 的分布式账本数据库二区块链本身其实是一串链接的数据区块其链接指针是采用密码学哈希算法对区块头进行处理所产生的区块头哈希值三基本概念 1 数据区块比特币的交易会保存在数据
Element ui 导航栏刷新时高亮

1 在组件中
原理解析：JS 代码是如何被浏览器引擎编译、执行的？

原理解析 JS 代码是如何被浏览器引擎编译执行的分析浏览器引擎对 JS代码的编译情况并结合日常的 JavaScript开发经验重新理解底层的编译解析机制对其底层原理的理解将有助于理解前端的跨端应用以及一套代码生成多种小程序相关
csu 1809 Parenthesis 2016湖南省赛 G

Problem acm csu edu cn csuoj problemset problem pid 1809 vjudge net contest 161962 problem G Reference blog csdn net l95
spring之bean注入的意义

简而言之就是首先 service注解在当前类的上边表示在当前类是spring管理的一个bean 使用 autowired 将另外一个A类的实体bean注入到当前类中让当前类具备那个A类的功能
Android SDK & AVD Manager

0 前言 Android源码中的prebuilts devtools tools android程序可根据不同的参数来启动SDK Manager或AVD Manager 1 SDK Manager 1 启动 android or andro
Chrome 基于 Wappalyzer 查看网站所用的前端技术栈

1 找到谷歌商店 https chrome google com webstore search wappalyzer utm source ext app menu 2 搜索 Wappalyzer 3 添加至Chrome 4 使用插件
MySQL的脏读、幻读、不可重复读

首先我们要知道我们的脏读幻读不可重复读这些概念是在事务中的概念脏读也就是读取了未提交的数据比如我开启了一个事务A 在里面操作一个用户表获取里面一个用户的积分比如此时这个用户的积分是100 此时有另外一个事务B也操作了这个用户
LD3320语音识别

芯片介绍 LD3320 不需要外接任何辅助的Flash芯片 RAM芯片和AD芯片就可以完成语音识别功能每次识别最多可以设置50项候选识别句每个识别句可以是单字词组或短句另一方面识别句内容可以动态编辑修改只需要主控MCU把识别关

热门标签