LEAD: Layer-wise Expert-aligned Decoding for Faithful Radiology Report Generation<br>LEAD：面向忠实放射学报告生成的层级专家对齐解码<br>[摘要](abstracts/2602.04617.html)

Abstract (EN)

Abstract not available.

摘要 (ZH)

放射学报告生成（RRG）旨在从医学图像中生成准确且连贯的诊断结果。尽管大型视觉语言模型（LVLM）提升了报告的流畅性与准确性，但它们存在幻觉问题，会生成看似合理但缺乏图像依据的病理细节。现有方法主要依赖外部知识引导来促进生成文本与视觉信息的对齐，然而这些方法往往忽视了预训练模型固有的解码先验和视觉-语言对齐偏差，且因依赖构建的引导而缺乏鲁棒性。本文提出层级专家对齐解码（LEAD），一种新颖的方法，旨在从根本上修改LVLM的解码轨迹。我们设计了一个多专家模块，用于提取不同的病理特征，并通过门控机制将其整合到每个解码器层中。这种层级架构使LLM能够在每个推理步骤中通过学习的门控函数咨询专家特征，从而动态纠正解码偏差，并引导生成过程朝向事实一致性。在多个公共数据集上进行的实验表明，LEAD方法在临床准确性指标上实现了有效提升，缓解了幻觉问题，同时保持了高质量生成。

← Back