One Size, Many Fits: Aligning Diverse Group-Wise Click Preferences in Large-Scale Advertising Image Generation<br>一图多配：在大规模广告图像生成中协调多样化的群体点击偏好<br>[摘要](abstracts/2602.02033.html)

Abstract (EN)

Abstract not available.

摘要 (ZH)

广告图像生成日益关注点击率等在线指标，但现有方法采用“一刀切”策略，仅优化整体点击率，忽视了用户群体间的偏好多样性。这导致特定群体的表现欠佳，限制了定向营销的效果。为弥补这一差距，我们提出了《一图多配》统一框架，旨在协调大规模广告图像生成中多样化的群体点击偏好。该框架首先进行产品感知的自适应分组，根据用户属性和产品特征动态组织用户，并用丰富的集体偏好特征表示每个群体。基于这些分组，偏好条件图像生成采用群体感知多模态大语言模型，为每个群体生成定制化图像。该模型经过预训练，能同时理解群体特征并生成广告图像。随后，我们使用提出的群体偏好优化方法对模型进行微调，以协调群体偏好，有效提升各群体在生成图像上的点击率。为推进该领域发展，我们引入了分组广告图像偏好数据集，这是首个大规模公开的群体图像偏好数据集，包含基于4000万用户构建的约60万个群体。大量实验表明，我们的框架在离线和在线场景下均实现了最先进的性能。代码和数据集将在https://github.com/JD-GenX/OSMF发布。

← Back