
-
生物通官微
陪你抓住生命科技
跳动的脉搏
DS2VP:动态选择的空间可视化提示方法
【字体: 大 中 小 】 时间:2026年03月10日 来源:IEEE Transactions on Circuits and Systems for Video Technology 11.1
编辑推荐:
动态视觉提示方法DS2VP通过关键索引生成器筛选图像关键区域并动态适配提示,结合图像提示融合模块实现细粒度空间对齐,以及多级提示交互模块提升特征表征能力,在图像分类基准测试中显著优于现有视觉提示调优方法。
随着训练数据规模和模型规模的持续增长,人工智能(AI)的发展必须从单纯关注性能优化转向应对与可持续部署相关的挑战[1]。特别是基于transformer的架构[2]、[3]、[4]已成为视觉模型的主要框架,但其规模的迅速扩大导致了训练过程中的高能耗和高计算成本。然而,对于各种下游任务而言,对大型视觉模型进行传统的全精细调优面临着高计算成本和操作灵活性不足的显著挑战。通过在保持预训练模型不变的情况下引入少量额外的可学习参数,参数高效精细调优(PEFT)[5]、[6]、[7]已成为一种有效的策略,不仅在自然语言处理(NLP)[8]中得到应用,也在计算机视觉(CV)[9]、[10]中得到应用,用于将大型预训练模型适配到特定的下游任务中,尤其是在训练数据有限的场景下。