我的书:
购买链接:
京东购买链接
淘宝购买链接
当当购买链接
VAD(Voice Activity Detection)算法的作用是检测语音,在远场语音交互场景中,VAD面临着两个难题:
1. 可以成功检测到最低能量的语音(灵敏度)。 2. 如何在多噪环境下成功检测(漏检率和虚检率)。 漏检反应的是原本是语音但是没有检测出来,而虚检率反应的是不是语音信号而被检测成语音信号的概率。相对而言漏检是不可接受的,而虚检可以通过后端的ASR和NLP算法进一步过滤,但是虚检会带来系统资源利用率上升ÿ