Exploring Vision-Language Models for Online Signature Verification: A Zero-Shot Capability Study<br>探索视觉-语言模型用于在线签名验证：零样本能力研究<br>[摘要](abstracts/2605.14845.html)

Abstract (EN)

Abstract not available.

摘要 (ZH)

近年来，视觉-语言模型（VLM）在通用视觉推理方面展现出强大能力，但其在严格生物特征任务中的适用性仍未被探索。本研究针对签名验证挑战（SVC）基准，评估了最先进VLM（GPT-5.2和Gemini 2.5 Pro）的零样本性能。为支持视觉处理，原始运动时间序列被转换为静态图像，并在源数据可用时将压力信息编码为笔画不透明度。此外，我们引入了一种评分协议，通过提取潜在token概率来计算稳健的生物特征分数。实验结果表明，性能存在显著差异，这取决于信号质量和伪造类型。在随机伪造场景中，零样本VLM展现出卓越的辨别能力：GPT-5.2在移动端任务中达到0.32%的等错误率，超越了有监督的最先进系统。然而，在熟练伪造场景中，由于两个签名几乎相同，任务更具挑战性，结果显著变差，并出现关键的“合理化陷阱”：链式思维（CoT）推理会降低性能，因为模型会生成运动幻觉，将伪造痕迹解释为自然变化。

← Back