声源定位技术在工业领域中研究与应用
在各种电子设备高度智能化的今天,语音增强与声源定位技术成为语音通信领域中2种不可缺少的技术。例如,在视频会议中,通过声源定位技术控制摄像头,使其自动转向正在发言的说话者方向;对于高速行驶的车辆,应用有声源定位技术的车载免提电话可以辨别实际命令的来源,对其命令作出响应;应用有声源定位技术的助听器的出现为有觉障碍的残疾人提供了帮助,基于阵列的语音增强技术利用声源的位置信息进行空间滤波,可以进一步抑制除说话人以外的其他方向的噪声,使得助听器话音更加清晰[1]。
人类对于声源的理解主要有2个部分:¹对声源的感受,也就是听见的问题;º对声源的理解与感知,包括了对信号的声强、频率、音质声源位置等进行整合分析。后者又可以分为语音识别和声源定位2大主要的部分[2]。目前语音识别技术已经取得了长足的进步,市场上也有不少的相关产品投放到普通民众的家中。相比之下声源定位技术虽然有一定的研究者,但实际投放到应用场合还比较少。
1 研究现状
所谓声源定位技术就是根据接收到的音频信号确定自然声源或人为声源的位置。在环境中,声音会产生各种听觉场景,即发生在空间不同位置上的声音流所形成的/事件0分布。通过听觉系统的复杂处理,人在脑中会对这一场景中叠加的各种声音事件加以分类,即所谓场景分析。对人的这种能力的研究及其功能建模,是计算听觉场景分析的任务,它对解决盲源分离及语音增强[3]等工程问题有指导意义。在智能机器人和视频会议等方面声源定位有着广泛的应用,目前主要采用基于麦克风阵列的信号处理方法。传统的声源定位方法主要有:可控波束形成技术;高分辨率谱估计的定向技术;时延估计技术等。
2 关键技术
在语音信号的处理当中,麦克风是最基本的信号接受设备之一。在实际的应用当中,如语音识、编码、助听器等以及语音控制系统,在以上环境中麦克风所接收的信号都是由环境噪声和信号源以及信号源的回声所组成,这些信号在时域和频域相互叠加。因此,仅用频域或者时域的方法很难得到有效的处理增益,采用时域和频域二者结合的方式进行处理也未必能够得到有效结果。这个时候就必须增加一个空间域。对来自不同方向位置的信号进行处理加强,抑制其他非需要空间方向的信号。这就需要采用声源定位的技术。
声源定位技术在通信和机器人领域有着非常广泛的应用前景,近年来受到了众多研究者的关注。现有的声源定位技术主要有3类[4]:¹基于最大输出功率的可控波束形成技术,它是对传声阵列接收到的信号进行滤波及加权求和,然后直接控制传声阵列的波束,使其指向具有最大输出功率的方向;º基于高分辨率频谱估计技术,通过求解传声器阵列与接收信号之间的相关矩阵来定出声源方向;»基于声波到达时间差的技术(Time Delayof Arrival, TDOA),利用声源到达空间位置传声器的时间差来定出声源方向。
相关文章
- 2023-01-09基于工作流的装配车间可配置制造执行系统
- 2022-05-10基于CPLD的直流无刷电机驱动电路设计
- 2023-03-06工业自动化仪表的使用
- 2023-04-12高精度光刻物镜的变形研究
- 2023-08-09微机控制曲轴疲劳试验台的研发



请自觉遵守互联网相关的政策法规,严禁发布色情、暴力、反动的言论。