
-
生物通官微
陪你抓住生命科技
跳动的脉搏
用于近场源定位中快速高效学习的特征变换
《IEEE Transactions on Artificial Intelligence》:Feature Transformation for Fast and Efficient Learning in Near-Field Source Localization
【字体: 大 中 小 】 时间:2026年02月28日 来源:IEEE Transactions on Artificial Intelligence CS6.4
编辑推荐:
近场音频源定位方法提出基于球谐函数分解与信号子空间的特征变换,有效抑制噪声与混响干扰,结合卷积神经网络实现高效训练与高精度定位,实验验证优于传统方法。
音频源定位是信号处理中的一个基本问题,其在机器人技术、监控、人机交互和空间音频渲染等领域有着广泛应用。在噪声较大和混响严重的环境中实现精确定位具有挑战性[1]、[2]、[3]、[4]。此外,定位性能还受到麦克风阵列配置的影响。在各种配置中,球形麦克风阵列(SMAs)能够提供均匀的空间分辨率,并通过利用球谐函数(SH)分解来减少方向上的歧义[5]、[6]。SH分解的主要优势在于它能够方便地分离不同成分,例如将SMA记录表示为径向和方向分量[7]、[8]、[9]。由于声源的位置也会影响定位技术,因此定位技术被分为远场定位和近场定位[7]、[10]。在远场区域,声波前沿被视为没有曲率的平面波,定位技术主要估计到达方向(DOA)。相比之下,近场声波是球形的,可以近似为点源。因此,定位过程需要同时考虑到达方向和距离估计。