BioVLM: Routing Prompts, Not Parameters, for Cross-Modality Generalization in Biomedical VLMs<br>BioVLM:通过路由提示而非参数实现生物医学视觉语言模型的跨模态泛化<br>[摘要](abstracts/2604.17629.html)

Abstract (EN)

Abstract not available.

摘要 (ZH)

预训练的视觉语言模型(如BioMedCLIP)在生物医学领域通常表现良好,但在挑战性模态上性能常会下降,这些模态中类间差异小且采集特异性变化显著,尤其是在少样本监督下,以及当模态先验与预训练语料差异较大时。我们提出了BioVLM,一种提示学习框架,无需大量主干网络微调即可提升跨域泛化能力。BioVLM学习一个多样化的提示库,并引入动态提示选择机制:针对每个输入,通过预测分布的低熵准则选择最具区分性的提示,从而有效将稀疏的少样本证据与丰富的语言模型语义先验相结合。为加强这种结合,我们蒸馏出高置信度的语言模型衍生属性,并通过强/弱数据增强一致性来强制执行稳健的知识迁移。在测试时,BioVLM通过选择适合模态的提示进行自适应,实现向未见类别和领域的迁移,同时保持训练轻量化和推理高效性。在11个MedMNIST+ 2D数据集上,BioVLM在三种不同的泛化设置中均达到了新的最优性能。代码可在https://github.com/mainaksingha01/BioVLM获取。

← Back