用于近场源定位中快速高效学习的特征变换

《IEEE Transactions on Artificial Intelligence》:Feature Transformation for Fast and Efficient Learning in Near-Field Source Localization

【字体: 时间:2026年02月28日 来源:IEEE Transactions on Artificial Intelligence CS6.4

编辑推荐:

  近场音频源定位方法提出基于球谐函数分解与信号子空间的特征变换,有效抑制噪声与混响干扰,结合卷积神经网络实现高效训练与高精度定位,实验验证优于传统方法。

  
影响声明:
本文通过研究人工智能(AI)的变革性影响,解决了近场音频源定位所面临的挑战。AI提供了...显示更多

摘要:

本文开发了一种高效且快速的学习方法,用于利用球谐函数(SH)特征变换进行近场声源定位。这些SH特征是通过麦克风阵列记录的SH分解得到的。然而,这些SH特征常常受到噪声、干扰和混响的影响,从而降低了定位精度。在此背景下,我们提出了一种特征变换方法,该方法利用了SH分解信号的信号子空间。这种特征变换减少了在噪声和混响条件下分解出的SH参数的不规则性。因此,所提出的基于子空间的特征能够捕捉到重要的方向性和距离依赖性线索,从而在较少的训练周期内提高定位性能和精度。通过使用卷积神经网络(CNN)训练将输入特征映射到定位类别,证明了这种快速学习方法的有效性。所提出方法的性能通过详尽的仿真和实验进行了评估,并与以往的方法进行了比较。

引言

音频源定位是信号处理中的一个基本问题,其在机器人技术、监控、人机交互和空间音频渲染等领域有着广泛应用。在噪声较大和混响严重的环境中实现精确定位具有挑战性[1]、[2]、[3]、[4]。此外,定位性能还受到麦克风阵列配置的影响。在各种配置中,球形麦克风阵列(SMAs)能够提供均匀的空间分辨率,并通过利用球谐函数(SH)分解来减少方向上的歧义[5]、[6]。SH分解的主要优势在于它能够方便地分离不同成分,例如将SMA记录表示为径向和方向分量[7]、[8]、[9]。由于声源的位置也会影响定位技术,因此定位技术被分为远场定位和近场定位[7]、[10]。在远场区域,声波前沿被视为没有曲率的平面波,定位技术主要估计到达方向(DOA)。相比之下,近场声波是球形的,可以近似为点源。因此,定位过程需要同时考虑到达方向和距离估计。

相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号