Abstract not available.
临床环境中的患者活动识别(PAR)利用活动数据来提升安全性与护理质量。尽管已取得显著进展,现有模型主要侧重于识别正在发生的活动。它们通常通过全局和局部注意力机制在空间上组合稀疏的视觉线索,但由于其神经处理流程,仅能学习逻辑上隐式的模式。推进临床安全需要能够推断一组视觉线索为何暗示风险,以及如何通过超越单纯分类的显式逻辑进行组合推理的方法。为此,我们提出了Logi-PAR,首个逻辑增强型患者活动识别框架,它集成了上下文事实融合作为多视图基元提取器,并注入了神经引导的可微分规则。我们的方法自动从视觉线索中学习规则,进行端到端优化,同时使训练过程中隐式出现的模式得以显式标注。据我们所知,Logi-PAR是首个通过将可学习逻辑规则应用于符号映射来识别患者活动的框架。它生成可审计的“为什么”解释作为规则轨迹,并支持反事实干预(例如,若提供协助,风险将降低65%)。在临床基准数据集(VAST和OmniFall)上的广泛评估展示了最先进的性能,显著优于视觉语言模型和Transformer基线。代码可通过以下链接获取:https://github.com/zararkhan985/Logi-PAR.git