Pushing the Frontier of Black-Box LVLM Attacks via Fine-Grained Detail Targeting<br>通过细粒度细节定位推动黑盒大视觉语言模型攻击前沿<br>[摘要](abstracts/2602.17645.html)

Abstract (EN)

Abstract not available.

摘要 (ZH)

针对大视觉语言模型（LVLM）的黑盒对抗攻击因梯度缺失和多模态边界复杂而极具挑战。尽管先前最先进的基于迁移的攻击方法（如M-Attack）通过源图像与目标图像之间的局部裁剪级匹配取得了良好效果，但我们发现这会导致迭代间产生高方差、近乎正交的梯度，破坏了连贯的局部对齐并导致优化不稳定。我们将此归因于：（i）ViT的平移敏感性产生尖峰状梯度；（ii）源与目标裁剪之间的结构不对称性。我们将局部匹配重新表述为源变换与目标语义的非对称期望，并构建了M-Attack的梯度去噪升级版本。在源端，多裁剪对齐（MCA）通过每轮迭代中对多个独立采样的局部视图梯度进行平均来降低方差。在目标端，辅助目标对齐（ATA）用来自语义相关分布的小型辅助集替代激进的目标增强，从而生成更平滑、低方差的目标流形。我们进一步将动量重新解释为补丁动量，通过重放历史裁剪梯度；结合改进的补丁尺寸集成（PE+），这增强了可迁移方向。这些模块共同构成了M-Attack-V2——一个对M-Attack的简单模块化增强方案，显著提升了针对前沿LVLM的基于迁移的黑盒攻击效果：在Claude-4.0上的成功率从8%提升至30%，Gemini-2.5-Pro从83%提升至97%，GPT-5从98%提升至100%，超越了先前的黑盒LVLM攻击方法。代码与数据已公开于：https://github.com/vila-lab/M-Attack-V2。

← Back