Quantifying the human visual exposome with vision language models<br>利用视觉语言模型量化人类视觉暴露组<br>[摘要](abstracts/2605.03863.html)

Abstract (EN)

Abstract not available.

摘要 (ZH)

视觉环境是影响心理健康的一个基本但尚未量化的决定因素。尽管环境暴露组的概念已得到广泛认可，但当前的方法依赖于粗颗粒度的地理空间代理或存在偏倚的自我报告，未能捕捉日常生活中的第一人称视觉背景。我们通过将生态瞬时评估与视觉语言模型（VLM）相结合来弥合这一差距，以量化人类视觉体验的语义丰富度。基于2674张参与者拍摄的照片，VLM得出的绿色度估计值能够稳健地预测瞬时情绪和慢性压力，与已有基准结果一致。随后，我们开发了一个基于大规模语言模型（LLM）的半自动化流程，挖掘了超过700万篇科学出版物，提取了约1000个经实证研究与心理健康相关的环境特征。当应用于真实世界图像时，高达33%的VLM提取的情境评分与情绪和压力显著相关。这些发现为视觉暴露组学建立了一种可扩展的客观范式，使得高通量解码可见世界如何与心理健康相关联成为可能。

← Back