ReasonEdit: Editing Vision-Language Models using Human Reasoning<br>ReasonEdit:基于人类推理的视觉语言模型编辑<br>[摘要](abstracts/2602.02408.html)

Abstract (EN)

Abstract not available.

摘要 (ZH)

模型编辑旨在修正大型预训练模型中的错误,同时不影响无关行为。尽管近期已有研究尝试编辑视觉语言模型(VLMs),但尚无现有编辑器能够处理需要人类与模型对图像进行复杂推理的任务。为此,我们提出了ReasonEdit,这是首个允许用户在编辑过程中解释其推理的VLM编辑器,引入了一种新颖且实用的模型编辑框架。ReasonEdit持续将人类推理存储于代码本中,并在推理时通过一种受网络科学启发的新型拓扑平衡多模态嵌入方法,仅检索相关事实。在多个基于推理的视觉问答数据集上对四种VLMs进行测试,ReasonEdit实现了最先进的编辑性能,最终证明在编辑过程中融入人类推理能显著提升编辑的泛化能力。

← Back