【面试总结】AI音频降噪方向相关面试题总结

2023-11-03

前情提要,相同的内容我也发布在了知乎上。

由于本人也参与过AI音频降噪的相关项目,所以在面试的过程中也有很多相关的问题。

这里提前吐槽一下,虽然Rnnoise这个模型效果不怎么好,但是这个方案相当于是这个领域的开辟的工程方案,所以有相当多的人会问。

我在GitHub也放了相同的内容,如果有同学是做相同方向的,同时也乐意整理和聚集这个方向的面经,欢迎大家多多push内容上去。具体的仓库地址:

git@github.com:fmbao/interview_ns.git

同时,我也会根据GitHub仓库中更新的内容,将之迁移过来,更新这篇知乎专栏的文章。

【问】Rnnoise中的基音计算模块的组成以及相关特征提取的方式

【答】

RNNoise超详细解析_qiuzelin_的博客-CSDN博客_rnnoise

有关Rnnoise的讲解: 在Rnnoise中,band struction 在其他论文中使用神经网络直接估计frequency bins需要的网络复杂度比较高。

作者为了避免这个问题,作者嘉定频谱包络足够平坦,进而可以使用比较粗糙的分辨率,此外,他没有直接计算频谱幅度,而是对理想临界带增益进行了估计

频带的划分选择和Opus codec使用的bark scale相同(实际上为了方便,文章作者直接就使用了Opus的pitch计算代码)

其中有关Opus的代码下载地址以及具体功能解释的网址是:

https://opus-codec.org

当然只要你愿意在网上搜也是可以看到很多有关Opus的文档的:

Opus从入门到精通(二):编解码器使用 - 掘金

还有写的非常详细的自己动手实现的版本:

Opus从入门到精通(三)手撸一个Opus编码程序_音视频_轻口味_InfoQ写作社区

【问】人耳对声音的敏感范围

【答】人耳对声音的敏感范围:1k-8kHz;人耳的能够听到的频率范围:20Hz-20kHz

【问】深度学习方案和传统音频降噪方案的差异

【答】深度学习降噪能够更好地应对非稳态噪声。

传统降噪算法主要是基于滤波理论,

深度学习降噪方案主要是基于TF域,时域降噪。

【问】GRU的权重是否共享

【答】GRU对每一帧的输入数据都是权重共享的

【问】BIGRU的具体实现

【答】具体实现在torch官网:

GRU — PyTorch 1.12 documentation

【问】IIR FIR滤波器

【答】有关这两个滤波器的实现:

数字信号处理:FIR滤波器和IIR滤波器 - 知乎

同时零逆战在这个博客中也讲述了比较详细的有关滤波器相关的描述;

语音信号处理——数字滤波器 - 凌逆战 - 博客园

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

【面试总结】AI音频降噪方向相关面试题总结 的相关文章

随机推荐

  • 并发编程学习(十四):tomcat线程池

    1 Tomcat 功能组件结构 Tomcat 的核心功能有两个 分别是负责接收和反馈外部请求的连接器 Connector 和负责处理请求的容器 Container 其中连接器和容器相辅相成 一起构成了基本的 web 服务 Service 每
  • VJ 4 Traveling

    C Traveling Time limit 2sec Memory limit 256MB Score 300 points Problem Statement AtCoDeer the deer is going on a trip i
  • docker默认配置文件不存在问题解决

    Docker默认的配置文件 etc default docker或者 etc sysconfig docker都不起作用 查看了一下 lib systemd system docker service文件 发现里面没有加载默认配置文件 一些
  • opencv,视频的操作

    http opencv python tutroals readthedocs io en latest py tutorials py gui py video display py video display html http doc
  • MySQL(51)MySQL LIKE:模糊查询

    MySQL LIKE 模糊查询 在 MySQL 中 LIKE 关键字主要用于搜索匹配字段中的指定内容 其语法格式如下 NOT LIKE 字符串 其中 NOT 可选参数 字段中的内容与指定的字符串不匹配时满足条件 字符串 指定用来匹配的字符串
  • 让我们的streamlit网页表格美起来的方法

    大家好 在我们的Streamlit交流群中经常听到小伙伴们吐槽Streamlit自带的表格样式太不友好了 不仅布局不好 如表格内容无法全部显示出来 每列的内容无法居中显示 主题色也不好看 表格行数信息从0开始不符合大家习惯等 针对这个问题
  • 休闲乐系统服务器更改,休闲乐系统服务器更改

    休闲乐系统服务器更改 内容精选 换一换 通过华为云创建的ECS服务器默认使用华为云提供的内网DNS进行解析 内网DNS不影响ECS服务器对公网域名的访问 同时 还可以不经Internet 直接通过内网DNS访问其他云上服务内部地址 如OBS
  • 解决git ssh -T git@github可以成功但无法clone

    解决git ssh T git github可以成功但无法clone git时可以链接成功 ssh T git github 但是clone时出错 提示无权限 如下 git github com Permission denied publ
  • $(" ").value的意思

    范例 var contSourceId contSourceId value 解读 最早出现在prototype js库里与document getElementById 类似 标签ID 返回那个标签的对象 实例
  • 使用cmake创建visual studio工程

    对于从网上拉取的C 代码 手动配置VS环境比较麻烦 使用cmake可以自动配置 这里使用一个简单的cmake配置hello cpp例子演示 前提环境 cmake vs2017 1 在某路径下创建一个文件夹名为test 注意 路径中不能有中文
  • 使用LVS+keepalived实现mysql负载均衡的实践和总结

    前言 经过一段时间的积累 数据库的架构就需要根据项目不断的进行变化 从单台数据库 到了两台数据库的主从 再到读写分离 再到双主 现在进一步需要更多的数据库服务器去支撑更加可怕的访问量 那么经过那么多的学习 也了解到 进一步的架构还有很多 负
  • jupyter中的%%time魔法函数和列表推导式有冲突

    搞了一个下午发现竟然是在jupyter中 time魔法函数和列表推导式不能同时使用 提示错误如下 但比较怪异的是将 time注释后成功运行 再恢复 time功能 竟然就没有异常了
  • 培训第二弹 全国大学生智能汽车竞赛百度竞速组预告

    3月12日本周六晚7点 百度飞桨B站直播间 第十七届全国大学生智能汽车竞赛完全模型组竞速赛第二次线上培训正式开讲 卓老师年前来百度科技园 检查作业 培训内容和学习资料筹备会 不放过每个细节 经过长期精心筹备 在3月12日晚7点飞桨B站直播间
  • 相似文本聚类

    聚类方法 原型聚类 原型是指样本空间中具有代表性的点 此类算法假设聚类结构能通过一组原型刻画 在现实聚类中极为常用 如 k means 高斯混合聚类 高斯混合聚类 层次聚类 层次聚类根据划分策略包括聚合层次聚类和拆分层次聚类 由于前者较后者
  • 2019年8月01日星期四 恒指/美原油/美黄金 走势分析

    财经早餐 2019年8月01日星期四 重点关注的财经数据与事件 02 00 美联储FOMC公布利率决议及政策声明 02 30 美联储主席鲍威尔召开新闻发布会 09 45 中国7月财新制造业PMI终值 15 50 法国7月制造业PMI终值 1
  • 一本读懂BERT(实践篇)

    目录 一 什么是BERT 二 BERT安装 三 预训练模型 四 运行Fine Tuning 五 数据读取源码阅读 一 DataProcessor 二 MrpcProcessor 六 分词源码阅读 一 FullTokenizer 二 Word
  • python基础-第一个python程序

    前言 上一章中 我们介绍了怎么去安装python环境 作为我们入门python的先决条件 今天 我们通过编写第一个python应用程序的方式 正式进入python的大门 首先 关于python 有两种打开方式 一种是shell命令行 一种是
  • mygui中文输入及显示

    更改配置文件MyGUI3 0 Media MyGUI Media下 core font xml添加
  • 这是最简单的java输出表情

    public static void main String args TODO Auto generated method stub System out println o 执行结果 不要质疑欧 我们java就是这么简单 适合刚入jav
  • 【面试总结】AI音频降噪方向相关面试题总结

    前情提要 相同的内容我也发布在了知乎上 由于本人也参与过AI音频降噪的相关项目 所以在面试的过程中也有很多相关的问题 这里提前吐槽一下 虽然Rnnoise这个模型效果不怎么好 但是这个方案相当于是这个领域的开辟的工程方案 所以有相当多的人会