Abstract not available.
多模态大语言模型(MLLMs)通过统一的跨模态推理显著推动了视频虚假信息检测的发展,但其通常依赖于固定深度的推理过程,并对内部生成的假设过度信任,尤其在关键证据稀疏、碎片化或需外部验证的场景中表现不足。为应对这些局限,我们提出了FactGuard,一种用于视频虚假信息检测的智能体框架,它将验证过程构建为基于MLLMs的迭代推理流程。FactGuard能够显式评估任务模糊性,并选择性调用外部工具以获取关键证据,从而实现推理路径的渐进式优化。为进一步强化这一能力,我们引入了一种两阶段训练策略,结合了领域特定的智能体监督微调与决策感知的强化学习,以优化工具使用并校准风险敏感型决策。在FakeSV、FakeTT和FakeVV数据集上的大量实验表明,FactGuard实现了最先进的性能,并验证了其出色的鲁棒性和泛化能力。