
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于事件的唇读技术及三平面融合网络(Event-based Lip Reading with Triplane Fusion Network)
《ACM Transactions on Multimedia Computing, Communications, and Applications》:Event-based Lip Reading with Triplane Fusion Network
【字体: 大 中 小 】 时间:2026年02月27日 来源:ACM Transactions on Multimedia Computing, Communications, and Applications
编辑推荐:
事件相机唇语识别通过三视角融合提升性能。提出TF-Net框架,利用XYT、XT、YT三种互补视角,结合专家模块与跨视角互信息交换机制,有效捕捉唇部运动特征,在DVS-Lip和Modality数据集上分别提升1.6%和2.3%准确率。
该摘要是使用自动化工具生成的,并非由文章作者撰写或审核。它旨在帮助发现、评估相关性,并帮助来自相关研究领域的读者理解本文的工作。它旨在补充作者提供的摘要,后者仍是文章的官方摘要。完整文章才是权威版本。点击此处了解更多。
点击此处对摘要的准确性、清晰度和实用性进行评论。您的反馈将有助于改进和未来版本的优化。
要查看此由AI生成的通俗语言摘要,您必须具有高级访问权限。