Exploring Vision-Language Models for Online Signature Verification: A Zero-Shot Capability Study<br>探索视觉-语言模型用于在线签名验证:零样本能力研究<br>[摘要](abstracts/2605.14845.html)

Abstract (EN)

Abstract not available.

摘要 (ZH)

近年来,视觉-语言模型(VLM)在通用视觉推理方面展现出强大能力,但其在严格生物特征任务中的适用性仍未被探索。本研究针对签名验证挑战(SVC)基准,评估了最先进VLM(GPT-5.2和Gemini 2.5 Pro)的零样本性能。为支持视觉处理,原始运动时间序列被转换为静态图像,并在源数据可用时将压力信息编码为笔画不透明度。此外,我们引入了一种评分协议,通过提取潜在token概率来计算稳健的生物特征分数。实验结果表明,性能存在显著差异,这取决于信号质量和伪造类型。在随机伪造场景中,零样本VLM展现出卓越的辨别能力:GPT-5.2在移动端任务中达到0.32%的等错误率,超越了有监督的最先进系统。然而,在熟练伪造场景中,由于两个签名几乎相同,任务更具挑战性,结果显著变差,并出现关键的“合理化陷阱”:链式思维(CoT)推理会降低性能,因为模型会生成运动幻觉,将伪造痕迹解释为自然变化。

← Back