Evolving Prompt Adaptation for Vision-Language Models<br>面向视觉语言模型的演化提示适应方法<br>[摘要](abstracts/2603.09493.html)

Abstract (EN)

Abstract not available.

摘要 (ZH)

大规模视觉语言模型（VLMs）在有限标注数据下适应下游任务仍面临重大挑战。尽管参数高效的提示学习方法提供了可行路径，但它们常遭受预训练知识灾难性遗忘的问题。针对这一局限，本研究基于以下洞察：控制提示的演化路径对于实现无遗忘适应至关重要。为此，我们提出EvoPrompt——一种新颖框架，旨在显式引导提示轨迹以实现稳定、知识保留的微调。具体而言，该方法采用模态共享提示投影器（MPP）从统一嵌入空间生成分层提示。关键创新在于演化训练策略，它将低秩更新解耦为方向与幅度分量：保留早期习得的语义方向，仅调整其幅度，从而使提示在演化过程中不丢弃基础知识。该过程进一步通过特征几何正则化（FGR）得到稳定，该正则化强制特征去相关以防止表示崩溃。大量实验表明，EvoPrompt在少样本学习中达到最先进性能，同时能鲁棒地保持预训练VLMs原有的零样本能力。

← Back