
-
生物通官微
陪你抓住生命科技
跳动的脉搏
SSWMNet:在目标佩戴口罩的情况下解决语音分离问题
《ACM Transactions on Internet Technology》:SSWMNet: Solving the Speech Separation Problem While the Target is Wearing a Mask
【字体: 大 中 小 】 时间:2026年03月04日 来源:ACM Transactions on Internet Technology
编辑推荐:
单通道语音分离在戴口罩场景下面临挑战,本研究构建了SSWM多模态数据集,提出两种策略:直接使用遮挡面部图像或通过Wav2Lip生成视觉信息辅助自监督语音分离。实验表明采用Wav2Lip的方案效果更优,且视听方法显著优于纯音频方案。
此摘要是使用自动化工具生成的,并非由文章作者撰写或审核。它旨在帮助读者发现相关内容、评估文章的相关性,并协助来自相关研究领域的读者理解本文的工作。它旨在补充作者提供的摘要,后者仍然是文章的官方摘要。完整文章才是权威版本。点击此处了解更多。
点击此处对摘要的准确性、清晰度和实用性进行评论。您的反馈将有助于改进未来的版本。
要查看此由AI生成的通俗语言摘要,您必须具有高级访问权限。