LEAD: Layer-wise Expert-aligned Decoding for Faithful Radiology Report Generation<br>LEAD:面向忠实放射学报告生成的层级专家对齐解码<br>[摘要](abstracts/2602.04617.html)

Abstract (EN)

Abstract not available.

摘要 (ZH)

放射学报告生成(RRG)旨在从医学图像中生成准确且连贯的诊断结果。尽管大型视觉语言模型(LVLM)提升了报告的流畅性与准确性,但它们存在幻觉问题,会生成看似合理但缺乏图像依据的病理细节。现有方法主要依赖外部知识引导来促进生成文本与视觉信息的对齐,然而这些方法往往忽视了预训练模型固有的解码先验和视觉-语言对齐偏差,且因依赖构建的引导而缺乏鲁棒性。本文提出层级专家对齐解码(LEAD),一种新颖的方法,旨在从根本上修改LVLM的解码轨迹。我们设计了一个多专家模块,用于提取不同的病理特征,并通过门控机制将其整合到每个解码器层中。这种层级架构使LLM能够在每个推理步骤中通过学习的门控函数咨询专家特征,从而动态纠正解码偏差,并引导生成过程朝向事实一致性。在多个公共数据集上进行的实验表明,LEAD方法在临床准确性指标上实现了有效提升,缓解了幻觉问题,同时保持了高质量生成。

← Back