【文献笔记】【通信】MAVL: Multiresolution Analysis of Voice Localization

2023-05-16

文章地址:MAVL: Multiresolution Analysis of Voice Localization

这是2021年春季刚发的文章

类似的文献笔记:
【文献精读】【通信】Symphony: Localizing Multiple Acoustic Sources with a Single Microphone Array


常见术语:
AoA:到达信道的角度(也就是 DoA)
xH:x的共轭转置


文章目录

  • Insight
  • 1 Introduction
  • 2 Primer on AoA Estimation
    • 2.1 Antenna Array Model
    • 2.2 AoA Estimation Algorithms
    • 2.3 Modeling Multipath Propagation
    • 2.4 Challenges
  • 3 Multipath Voice Localization
    • 3.1 AoA Estimation of Voice Signals
    • 3.2 Room Structure Estimation
      • 3.2.1 3D MUSIC
      • 3.2.2 Our Enhancements
    • 3.3 Constrained Beam Retracing
  • 4 Implementation
  • 5 Evaluation
    • 5.1 Performance of AoA Estimation
    • 5.2 Performance of Room Estimation
    • 5.3 Overall localization results
  • 6 Related Work
  • 7 Conclusion

Insight

1 Introduction

三个部分:
(1)人声定位能力对于智能设备的好处
(2)语音追踪面临的挑战
(3)作者及逆行定位的方法

语音定位有什么好处?
(1)知道了用户的位置后,智能设备可以集中波束向用户传播信息,这样可以进行更远距离的通信
(2)知道了用户的位置后,可以更好的掌握用户的意图,比如用户让开灯,通过定位用户位置就可以知道要开哪盏灯
(3)位置信息可以给予语音识别和NLP重要的context information

语音追踪面临的挑战:
(1)许多现有的系统要求被追踪的信号是已知的(chirps、OFDM,正弦波),但是人声显然不可能已知
(2)为了定位用户,需要估计多径信道的AoA,但是通过多径信道传播的信号是相干的,所以很难进行AoA估计
(3)使用多个 AoA 追踪位置有个前提,需要先估计室内环境,但是一般家庭的硬件设施不满足室内估计所需条件
(4)用户与智能设备间的信道可能是不可视的,由此造成的低信噪比和迂回的传播路径会造成问题

作者进行定位的方法:
如下所示为 MAVL系统框图
在这里插入图片描述
首先进行多径信道的 AoA 估计,然后通过发射宽带宽的chirps 估计房间结构,最后在通过 AoA和 房间结构来定位声音(a constrained beam retracing algorithm)


AoA估计的困难点:
(1)语音信号低频
(2)相干路径的存在


2 Primer on AoA Estimation

这一部分正如作者所说:

we introduce AoA estimation problem, existing approaches, and challenges.

2.1 Antenna Array Model

本文使用由N个麦克风组成的均匀圆形阵列
在这里插入图片描述
对于均匀原型阵列来说,single source 发送的接收信号可表示为:
在这里插入图片描述

2.2 AoA Estimation Algorithms

介绍了一种叫 MUSIC 的 AoA估计算法
看不懂

2.3 Modeling Multipath Propagation

对于多径信道估计很有参考价值,都是公式,直接截图
在这里插入图片描述
在这里插入图片描述
只是给出了一个接收端信号的公式而已,并没有讲如何进行信道估计

2.4 Challenges

作者想完成的是对相干低频信号的定位,这里有两个特性,相干性和低频,都会降低 AoA estimation的精度

3 Multipath Voice Localization

3.1 AoA Estimation of Voice Signals

3.2 Room Structure Estimation

3.2.1 3D MUSIC

3.2.2 Our Enhancements

3.3 Constrained Beam Retracing

4 Implementation

5 Evaluation

5.1 Performance of AoA Estimation

5.2 Performance of Room Estimation

5.3 Overall localization results

6 Related Work

7 Conclusion

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

【文献笔记】【通信】MAVL: Multiresolution Analysis of Voice Localization 的相关文章

  • Azure 文本转语音:如何更改输出的语言和语音?

    我需要以下 JavaScript 的帮助 希望有人能帮助我 文本以英语语音朗读 如何在以下工作代码中更改语言和语音 由于我的java技术较差 我在网上进行了大量搜索 但找不到合适的解决方案 所以 不幸的是我的编程技能不够好 所以我需要一些具
  • ActionScript 3 分析器和内存分析工具

    我正在使用 Adob e Flash CS 4 想知道是否有可用的分析器或内存分析工具 动作脚本 3 我知道有适用于 Flex 的工具 但是有适用于 Flash CS 4 的工具吗 谢谢 我确信那里有一个程序 仍在寻找我自己 但我 大多数
  • java中特定货币的货币符号的位置

    我知道如何使用 locale 和 NumberFormat 类获取 java 中货币的货币对象和其他详细信息 但我无法在 API 中找到任何内容来了解 货币符号是在开始还是结束时显示 例如 在美国 10 表示 10 美元 其中 位于数字开头
  • Localized.strings 已损坏?

    我试图包含我的应用程序的国际化 并且仅出于测试目的 我在文件 Localized string 中添加了一行简单的代码 这是我的整个文件 测试区域设置 测试区域设置 当我尝试运行我的应用程序时 我收到此错误 Localized string
  • PHP date() 外语 - 例如3 月 25 日 Aoû 09 [重复]

    这个问题在这里已经有答案了 我有一个脚本需要向国际观众显示日期数据 例如 于 2009 年 8 月 25 日星期二提交 有没有一种更简单 更干净的方法可以将其转换为法语 等 等效项 Mar 25 Ao 09 而不是 设置常数LANG and
  • Xcode 本地化更新

    因此 我使用 Use Base Internationalization 在 Xcode 中本地化了故事板 我进去翻译了字符串文件中的所有字符串 耶 那花了很长时间 现在 我在故事板的基本文件中添加了一个新元素 它有一个标签 其中有一个我需
  • Google 地点详细信息 API 中的语言不一致

    我在我的服务器上使用 Google Place Details API 来存储有关某个地点的信息 使用placeId由客户发送 我面临着有关结果语言的问题 当该地点是城市或该城市中的地址时 结果的语言会有所不同 即使在查询中指定了语言也是如
  • PHP 本地化 - gettext 还是数组?

    设置多语言网站现在我需要决定为网站上的静态文本使用哪个选项 让我解释一下我的网站设置 然后您是否可以帮助我决定使用哪种解决方案 该站点是一个CMS系统 允许多个域指向同一目录并根据域名提供内容 因此所有域共享相同的代码 在网站上 我创建了称
  • R 中基因列表(使用 ENTREZID)的基因本体 (GO) 分析?

    我对 GO 分析非常陌生 我有点困惑如何对我的基因列表进行分析 我有一个基因列表 n 10 gene list SYMBOL ENTREZID GENENAME 1 AFAP1 60312 actin filament associated
  • 翻译数据库内文本的最佳方法是什么

    我们这里有问题 我们需要将网站翻译成多种语言 我们已经使用 gettext 来翻译静态内容 但我们必须将一些文本内容翻译成多种语言 ui不是问题 我们找到了两种翻译文本的方法 1 在我们的文本输入中使用 JSON 为什么这个解决方案不好 每
  • ASP.NET MVC。如何禁止在 URL 中显示默认文化?

    这是问题 我有一个本地化的 asp net mvc 网站 本地化通过以下步骤完成 1 对于每条路线 我自动添加一个 culture url 段 默认值为 ru 我希望我的网址仅包含外国文化 例如 http mysite com ua con
  • 适用于 iOS 7 AVSpeechSynthesisVoice 的 BCP-47 语音代码有哪些?

    今天我对 iOS 7 中提供的语音合成功能感到非常兴奋 我想选择男声 OSX 中默认为 alex 我不知道他的 BCP 47 代码是什么 顺便说一句 如何获取所有语音代码的完整列表 iOS 8 添加了希伯来语 iOS 9 到 12 中没有添
  • 无法从 Windows Phone 8.1 访问 .NET 4.5 PCL 中的本地化资源

    我在访问针对 NET 4 5 的可移植类库中的本地化字符串资源时遇到问题 我允许用户在第一页上选择语言 并在其他页面上获得本地化体验 我试图通过代码获取资源来实现这一点 MyTextBloxk Text PasswordResetMetho
  • 列表本地化

    本地化字符串列表的正确方法是什么 我知道分隔符可以本地化为逗号或分号 但是连词是否本地化 如果是这样 任意长度列表的格式字符串会是什么样子 Example 蝙蝠 猫和狗 我可以根据区域设置使用分隔符并构建列表 如下所示 LIST UNIT
  • 如何将正文中的数字替换为波斯数字?

    我想将 html 内容中的每个数字转换为波斯数字 而不会对页面元素产生其他影响 例如 div style color c2c2c2 text number 1 span text number 2 span div text number
  • WPF ComboBox 中具有本地化名称的枚举

    我有一个列出枚举的组合框 enum StatusEnum Open 1 Closed 2 InProgress 3
  • C++ 的 String.Format

    正在寻找 NET 的 String Format 等函数的 C 实现 显然有 printf 及其变体 但我正在寻找具有位置的东西 如下所示 String Format 您好 0 您是 1 岁 感觉如何 1 姓名 年龄 这是必要的 因为我们将
  • string.Compare 行为

    怎么会这样呢 这是从VS2008中的立即窗口获取的 string Compare 1 string Compare 0 0 1 从言论来看字符串比较 http msdn microsoft com en us library 84787k2
  • 页面中某些超链接控件上的本地化资源未发生变化

    上面是正在开发中的网站的屏幕截图 我们有一个 DropdownList 控件 并在其 SelectedIndexChanged 上进行回发 然后我们更改站点区域性 然后加载相应的资源文件 DropDownList ASP NET 代码
  • 在 Rails 中本地化嵌套虚拟属性

    怎么可能本地化嵌套虚拟属性在 Rails 中 该模型 class User lt ActiveRecord Base attr accessor company information This is used in callbacks e

随机推荐