Abstract not available.
随着视觉语言模型(VLM)日益融入决策系统,理解视觉输入如何影响其行为变得至关重要。本文以迭代囚徒困境(IPD)为测试场景,研究了视觉启动对VLM合作行为的影响。我们考察了接触描绘行为概念(友善/助人 vs. 攻击/自私)的图像以及颜色编码的奖励矩阵是否会改变VLM的决策模式。实验在多个最先进的VLM上进行。我们进一步探索了缓解策略,包括提示修改、思维链(CoT)推理和视觉标记减少。结果表明,VLM的行为可能受到图像内容和颜色线索的双重影响,并且不同模型在敏感性和缓解有效性上存在差异。这些发现不仅强调了在视觉丰富且安全关键的环境中部署VLM时建立稳健评估框架的重要性,也突出了模型间架构和训练的差异可能导致不同行为反应——这一领域值得进一步研究。